Skip to main content

Table 4 Haversine distance error performance comparison (task 2—flying UAV, broadband sound source)

From: Noise power spectral density scaled SNR response estimation with restricted range search for sound source localisation using unmanned aerial vehicles

 

Haversine distance errorD (rad)

p value: paired samplet test (ref. best case)

 

Mean

Median

Min

Max

0.25 quartile

0.75 quartile

RMSE

 

Baseline

   

GCC-PHAT (max)

0.0868

0.07004

0.002181

2.350

0.04567

0.1035

0.1662

n.s.

GCC-PHAT (sum)

0.0810

0.06459

0.004032

2.457

0.04299

0.0918

0.1690

n.s.

GCC-NONLIN (max)

0.0905

0.06951

0.002702

2.350

0.04345

0.1008

0.1746

n.s.

GCC-NONLIN (sum)

0.0811

0.06633

0.004032

0.686

0.04325

0.0936

0.1155

n.s.

MVDR (max)

0.1690

0.08072

0.004032

2.490

0.04379

0.1199

0.3743

7.88 ×10−6

MVDR (sum)

0.1590

0.07550

0.003670

1.823

0.04377

0.1148

0.3633

5.15 ×10−5

DS (max)

0.2293

0.08965

0.004032

2.436

0.05588

0.1365

0.4655

1.10 ×10−9

DS (sum)

0.1648

0.07734

0.002618

2.465

0.04694

0.1169

0.3625

1.21 ×10−5

DNM (max)

0.2619

0.09346

0.004032

2.436

0.05745

0.1381

0.5411

2.02 ×10−10

DNM (sum)

0.1563

0.07733

0.003670

2.807

0.04490

0.1130

0.3910

2.62 ×10−4

w/ [28] T-F mask

   

GCC-PHAT (max)

0.1816

0.07557

0.002919

2.029

0.04480

0.1733

0.3429

1.78 ×10−11

GCC-PHAT (sum)

0.1078

0.06546

0.005047

2.490

0.04372

0.1000

0.2203

5.32 ×10−6

w/ [30] T-F mask

   

GCC-PHAT (max)

0.2472

0.09462

0.002449

2.558

0.05509

0.2263

0.4670

2.35 ×10−14

GCC-PHAT (sum)

0.1285

0.07141

0.004966

2.492

0.04797

0.1124

0.2464

4.34 ×10−9

w/ SNR response scaling

   

GCC-PHAT (max)

0.1335

0.07025

0.005124

2.259

0.03684

0.1176

0.2813

6.94 ×10−6

GCC-PHAT (sum)

0.1010

0.06524

0.007256

2.501

0.03983

0.1105

0.1973

1.48 ×10−6

GCC-NONLIN (max)

0.1227

0.07184

0.006535

2.254

0.04138

0.1196

0.2403

1.46 ×10−4

GCC-NONLIN (sum)

0.1101

0.06766

0.004056

2.495

0.03898

0.1116

0.2240

6.54 ×10−6

MVDR (max)

0.2669

0.11614

0.002071

2.498

0.05972

0.3117

0.4617

7.10 ×10−19

MVDR (sum)

0.2468

0.11260

0.002633

2.475

0.05254

0.1940

0.4403

9.62 ×10−17

DS (max)

0.2333

0.10711

0.004002

2.501

0.05783

0.1973

0.4350

1.37 ×10−14

DS (sum)

0.1957

0.09952

0.007290

2.501

0.04939

0.1626

0.3760

2.86 ×10−12

DNM (max)

0.2448

0.10371

0.000610

2.219

0.05417

0.1925

0.4523

1.69 ×10−14

DNM (sum)

0.1967

0.09452

0.003334

2.478

0.05081

0.1501

0.3783

2.13 ×10−12

w/ RPSL post-processing

   

GCC-PHAT (max)

0.0922

0.06516

0.003577

1.936

0.04173

0.0930

0.1844

n.s.

GCC-PHAT (sum) (best case)

0.0746

0.05987

0.004076

2.490

0.04177

0.0852

0.1622

N/A

GCC-NONLIN (max)

0.0965

0.06428

0.003356

1.937

0.03727

0.0962

0.1927

3.34 ×10−3

GCC-NONLIN (sum)

0.0805

0.06190

0.002988

2.484

0.03913

0.0900

0.1706

n.s.

MVDR (max)

0.1613

0.07477

0.001200

2.466

0.04130

0.1186

0.3334

7.74 ×10−9

MVDR (sum)

0.1244

0.07330

0.003783

2.478

0.04414

0.1089

0.2646

3.56 ×10−6

DS (max)

0.1619

0.07810

0.005783

2.481

0.04922

0.1179

0.3559

2.41 ×10−7

DS (sum)

0.1689

0.07352

0.002433

2.484

0.04421

0.1159

0.3812

3.06 ×10−7

DNM (max)

0.1810

0.07726

0.004760

2.661

0.04732

0.1266

0.4117

2.86 ×10−7

DNM (sum)

0.1777

0.07683

0.004642

2.475

0.04434

0.1205

0.4284

1.12 ×10−6

w/ [28] T-F mask + RPSL post-processing

   

GCC-PHAT (max)

0.0845

0.06388

0.002919

2.490

0.04131

0.0944

0.1750

3.10 ×10−3

GCC-PHAT (sum)

0.0743

0.06234

0.005047

2.490

0.04126

0.0851

0.1621

n.s.

w/ [30] T-F mask + RPSL post-processing

   

GCC-PHAT (max)

0.1125

0.06586

0.002449

1.905

0.04632

0.1076

0.2055

4.39 ×10−6

GCC-PHAT (sum)

0.1038

0.06491

0.004966

2.492

0.04532

0.0944

0.2311

1.03 ×10−3

w/ SNR response scaling + RPSL post-processing

   

GCC-PHAT (max)

0.0979

0.06657

0.005124

2.259

0.03562

0.1070

0.2145

n.s.

GCC-PHAT (sum)

0.0827

0.05976

0.007256

2.501

0.03822

0.1043

0.1704

2.03 ×10−3

GCC-NONLIN (max)

0.0954

0.06629

0.006180

2.254

0.03947

0.1096

0.1854

n.s.

GCC-NONLIN (sum)

0.0971

0.06379

0.004056

2.495

0.03823

0.1076

0.2084

1.20 ×10−3

MVDR (max)

0.1476

0.09110

0.002071

1.935

0.05083

0.1392

0.2560

2.79 ×10−11

MVDR (sum)

0.1590

0.09449

0.002633

2.475

0.04783

0.1377

0.3062

2.02 ×10−10

DS (max)

0.1321

0.08498

0.004002

2.501

0.04730

0.1347

0.2426

2.21 ×10−10

DS (sum)

0.1208

0.08031

0.007290

2.501

0.04661

0.1321

0.2312

2.51 ×10−8

DNM (max)

0.1693

0.09204

0.000610

1.948

0.05196

0.1463

0.3022

5.16 ×10−12

DNM (sum)

0.1429

0.08071

0.003334

2.478

0.04672

0.1352

0.2823

4.35 ×10−9

  1. Results from the baseline method are first presented, followed by results using the T-F mask from [28] and [30] and the proposed method (SNR response scaling and RPSL). Best-performing numericals for each category are highlighted in bold