Piątek, 25 czerwca 2021

Siedem kamieni milowych dokładnego testu ślepych prób audio

27 maja 2021

Ten artykuł o testowaniu został odtworzony z archiwum edukacyjnego strony Yuri's Sample Rate Converter za jego uprzejmą zgodą. Wszelkie prawa autorskie należą do wspomnianej strony i jakakolwiek reprodukcja poniższych informacji może być dokonana jedynie za wyraźną zgodą Yuri Korzunova.

Mity

"Obalanie audiofilskich mitów" to jeden z popularnych tematów na różnych forach i w artykułach. Z reguły te "mity" są oparte na wrażeniach odsłuchowych, a nie na testach. Są one niewyjaśnione technicznie lub mają niewielkie mierzalne różnice, które mogą być teoretycznie/prawdopodobnie.

W celu dokładnego sprawdzenia tych "mitów" zalecane jest użycie obiektywnej metody, która zapewnia wiarygodną powtarzalność. Wynik, który dostarcza tych samych wartości w podobnych warunkach w każdym czasie.

Ślepe testy

Ślepy test audio jest jednym ze sposobów "obiektywnego" pomiaru "subiektywnej" percepcji. Omówimy następnie jak przekształcić ten rodzaj testu w bezpieczny i wiarygodny zestaw dowodów.

Ślepy test Hi-Fi jest techniką, w której słuchacz (uczestnik) stara się rozpoznać nieznaną próbkę tylko poprzez dźwięk. Próbką jest tutaj nagranie, lub sprzęt, lub oprogramowanie, lub tryb pracy urządzenia/oprogramowania. Ten test jest próbą zmierzenia niemierzalnej cechy muzyki, którą znamy jako postrzeganą jakość dźwięku. Obiektywnym aspektem jest tutaj metodologia, dzięki której możemy zmierzyć i powtórzyć wynik w równych warunkach. Aspekt subiektywny jest wykrywany przez ludzkie odczucia/słyszenie, a to skutkuje decyzją podjętą przez słuchacza na podstawie tego, co odbiera.

Jako tester, nie mamy bezpośredniego dostępu do odczuć innej osoby. Nie możemy słuchać muzyki w ten sam sposób, co inna osoba. Możemy ją tylko zapytać, ale nie jest ona w stanie dokładnie opisać swoich odczuć. Szczególnie w najsubtelniejszych szczegółach, jakie daje nam nowoczesny sprzęt muzyczny, oprogramowanie, czy płyty testowe HiFi.

Ale my chcemy wiedzieć: to jest naprawdę słyszalne czy nie? Metody testowania

To jest główny cel ślepych testów. Staramy się wyeliminować subiektywną część percepcji (cena, uprzedzenie, przyzwyczajenie, itp., czyli prawdopodobna percepcja wyimaginowana). Dla jeszcze większej redukcji "subiektywności", stosuje się test podwójnie ślepej próby.

Podwójnie ślepa próba

Test z podwójnie ślepą próbą to próba, w której ani słuchacz, ani dyrygent nie wiedzą, czym jest próbka.

Ślepa próba dźwięku

Test ABX może być użyty w tym scenariuszu. Test ABX jest próbą, w której próbki A i B mogą być porównywane z próbką X (albo A albo B). Słuchacz powinien rozpoznać, co jest X (A lub B).

ABX test audio

Program do testowania plików audio Foobar2000 z wtyczką ABX test software może być użyty do testowania ABX plików audio. Autor nie wie jednak co się dzieje z plikami audio, gdy plugin ABX-test-foobar'a przygotuje pliki przed porównaniem (postęp po uruchomieniu pluginu). Aby wykonać test ABX na oprogramowaniu Mac OS, możesz spróbować znaleźć narzędzie ABXer. Dla systemu iOS istnieje aplikacja ABX Tester. Dostępny jest również międzyplatformowy Lacinato ABX. Programy te nie zostały przeze mnie przetestowane, więc nie mogę się wypowiedzieć na temat ich funkcji i możliwości.

Jeśli ktoś twierdzi, że dźwięk jest inny, to naprawdę nie możemy zmierzyć jego słyszalności. Dzieje się tak dlatego, że słuchamy dźwięku w mózgu poprzez nasze uszy.

Teoretycznie narzędzia pomiarowe są bardziej czułe niż ludzkie uszy. Jednak bez prób nie wiemy, gdzie znajduje się "krawędź słyszalności" różnicy.

Krawędź słyszalności to maksymalna wartość cechy lub wartość różnicy pomiędzy próbkami odsłuchowymi, która nie może być rozróżniona przez człowieka.

Profesjonalne, podwójnie ślepe testy sprzętu muzycznego nie są rozrywką domową. To ciężka, długa i kosztowna praca. Nie musi to oznaczać, że audiofilskie ¶lepe testy powinny być wykonywane w laboratorium. Musimy jedynie zapewnić, że bezpieczne i wiarygodne wyniki testów będą dostarczane w środowisku sprzyjającym procedurom testowym.

Prawidłowy ślepy test Hi-Fi - 7 kamieni kluczowych

Te cechy są niezbędne do zapewnienia bezpiecznych wyników testów:

  1. Metodologia Protokół Duża liczba pomiarów Odpowiednie miejsce odsłuchowe Kwestie sprzętu testowego Kwestia precyzji pomiarów Staranna kontrola warunków.

Testy powinny zapewniać wiarygodną powtarzalność w tych samych warunkach, tzn. nie powinno być żadnych odchyleń od uzgodnionych parametrów lub ustalonych dokładności.

Metodologia

Badanie rozpoczyna się od opracowania metodyki. Metodyka definiuje próby:

  • cel precyzję wykonanie inne rzeczy odnotowane poniżej

Metodologia powinna być zaprojektowana w pierwszej kolejności

Protokół badania

Protokół z badania ma postać papierową, na którym zapisywane są szczegółowe dane dotyczące przeprowadzanego badania. Obejmuje on:

  • sprzęt narzędzia pomiarowe uczestników (i ich umiejętności odsłuchowe, zawód, wykształcenie, inne) warunki testu inne zastrzeżenia wymagane lub specyficzne dla danego testu

Protokół testu Hi-Fi

Sprzęt testowy i pomiarowy może być zarejestrowany z unikalnym identyfikatorem przedmiotu (np. numer seryjny). Głównym celem protokołu jest możliwość sprawdzenia warunków eksperymentu w przypadku wątpliwości lub lepsze zrozumienie przyczyn ewentualnych wyników.

Miejsce odsłuchu

Aby zaoszczędzić czas, w jednym pomieszczeniu można umieścić kilku uczestników. W pomieszczeniu można ustawić kilka rzędów foteli.

Przy interpretacji wyników próby należy wziąć pod uwagę:

  • ustawienie każdego fotela i to, jak wpływa ono na dźwięk, fotel z i bez słuchacza będzie oddziaływał inaczej, dźwięk głośnika jest inny dla każdego fotela ze względu na położenie.

Głośniki mają indywidualne wzorce promieniowania. Pasmo przenoszenia zależy od pozycji siedzącej słuchacza w stosunku do głośników i ścian pomieszczenia odsłuchowego. Promienie akustyczne mogą się zakłócać, promienie odbite od powierzchni innej niż ściana również mogą się zakłócać.

Wpływ miejsca siedzącego na wyniki testu audio

Pomieszczenie bezechowe (wolne od echa) jest idealne, aby zapobiec odbijaniu się fal akustycznych. Głośniki mają również różne odpowiedzi częstotliwościowe w różnych kierunkach. Dlatego też różne umiejscowienie siedzeń może również powodować różne odpowiedzi częstotliwościowe, nawet w pomieszczeniu bezechowym. Ogólnie rzecz biorąc, tylko jedno stałe miejsce siedzące w pomieszczeniu odsłuchowym jest zalecane do przeprowadzenia dokładnych i wiarygodnych testów.

Zagadnienia związane z wyposażeniem badawczym

Urządzenia testowe (aparatura, która będzie testowana podczas badania) powinny być sprawdzone, aby w razie wątpliwości upewnić się, że są one sprawne w warunkach nakreślonych w metodyce.

Pożądane jest, aby aparatura badawcza posiadała unikalny identyfikator (numer seryjny). Pomaga to w przypadku chęci powtórzenia eksperymentu lub znalezienia różnic wynikających z przyczyn w przypadku wątpliwości. Ponieważ różne egzemplarze sprzętu mogą mieć różne parametry, a co za tym idzie różnie brzmieć.

Bardzo ważna rzecz! GŁOŚNOŚĆ PORÓWNYWANYCH PRÓBEK Ludzka "krawędź percepcji" jest zbliżona do 1 do 2 dB głośności. Dlatego też zalecana jest normalizacja poziomów próbek o 0.1 do 0.2 dB.

Człowiek ma ograniczony czas na zapamiętanie echa (zatrzymanie zdarzenia dźwiękowego). Dlatego czas odsłuchu próbki nie powinien być zbyt długi. Należy zapewnić możliwość natychmiastowego (w czasie rzeczywistym) łatwego przełączania się pomiędzy próbkami.

W przypadku porównywania słuchawek, badane próbki nie mogą być technicznie odizolowane od uczestnika. Dla rozwiązania tego problemu zaproponowano syntezę cech słuchawek i porównanie za pomocą pojedynczych egzemplarzy słuchawek.

Problem precyzji pomiaru

W obliczeniach statystycznych wartości błędów pomiarowych mogą być różne. Nie wiemy, czy wynik będzie dokładny, ale musimy oczekiwać, że w początkowym teście pierwsze podejście będzie miało rozkład normalny. W związku z tym;

Aby zapewnić precyzję pomiaru X, zaleca się mierzenie wartości Y z precyzją X/3 lub wyższą.

Na przykład, chcemy zapewnić dokładność pomiaru próby ucha w granicach 1%.

1/1% = 1/0,01 = 100 prób

Zatem zalecane jest wykonanie próby z dokładnością 3 razy większą niż 300 = 100 * 3.

Należy zapewnić określoną precyzję pomiaru

Duża liczba pomiarów

Badanie słuchu ma wiele zmiennych wynikających z czynnika ludzkiego, który jest ważniejszy od wszystkich innych elementów badania. Zmienność może być kompensowana przez zastosowanie dużej liczby powtórzeń w teście, dużej grupy uczestników lub szerokiej gamy elementów wyposażenia.

Zalecana jest duża liczba uczestników i cykli testowych

W części "Zagadnienie precyzji pomiaru" rozważaliśmy przykład: zapewnienie 1% precyzji.

Zalecane było 300 cykli. Nie gwarantuje to jednak 100-procentowej dokładności. Umiejętności uczestników mogą na przykład powodować zniekształcenie wyników. Aby zrekompensować to z dokładnością 1%, powinniśmy zaprosić 300 = (1/1%)*3 = (1/0.01)*3 uczestników. Zatem całkowita liczba pomiarów wynosi 90000 = 300 prób * 300 uczestników.

Powinniśmy wziąć pod uwagę każdą cechę, która może powodować błędy. We wstępnym przybliżeniu, powinniśmy zaprosić uczestników o różnych umiejętnościach, a grupy uczestników o tych samych umiejętnościach powinny mieć taką samą liczbę członków.

W podsumowaniu próby należy pogrupować wyniki według umiejętności uczestników.

Zasada ogólna: Pomiary liczbowe są wystarczające, jeśli dodanie kilku uczestników i/lub cykli i/lub elementów wyposażenia i/lub innych czynników, które będą miały wpływ na wyniki, mieści się w dopuszczalnym marginesie błędu.

Staranna kontrola warunków

Warunki mogą definiować eksperyment. Zmiana warunków może znacząco zniekształcić wyniki.

Staranna kontrola warunków zapewnia dokładność badania.

Przykład:

Ktoś chce porównać przetworniki DAC. Prosi ludzi, którzy mają te urządzenia, aby sprawdzili je na jakimś ogólnodostępnym CD testowym HiFi.

Testy te, z reguły, wykonywane są w domu, bez dokładnej kontroli warunków. Eksperymentowaliśmy z różnymi kolumnami, miejscami odsłuchowymi, szumem otoczenia itp. Nawet eksperymenty, opisane w szczegółach, mogą mieć subtelne, na pierwszy rzut oka, problemy, które mogą wpłynąć na wynik.

Z reguły przed eksperymentem nie wiemy dokładnie, jakie to szczegóły i czy są one ważne w danym procesie. Dopiero wyniki mogą pokazać, że szczegóły są nieistotne w naszym eksperymencie. Jeśli są one nieistotne, wpływ na wyniki będzie się mieścił w dopuszczalnym marginesie błędu.

Wnioski

  1. Ślepe testy, podwójnie ślepe testy, testy ABX mają na celu zaoferowanie "obiektywnych" pomiarów "subiektywnych" (niemierzalnych) odczuć. Prawidłowo przeprowadzone i nagrane ślepe testy hi-fi mogą być w stanie przedstawić poważny obiektywny dowód oparty na subiektywnej percepcji. Test może być przeprowadzony w domu dla celów osobistych, ale nie może być użyty jako dowód techniczny. Test powinien być zaprojektowany i przeprowadzony w sposób, który maksymalizuje niezależność od liczby uczestników i cykli testowych lub obu tych czynników. Dopuszczalne są odchylenia wyników do ustalonego marginesu błędu. Powtarzalność wyników jest osiągana przez dużą liczbę uczestników i cykli, elementów wyposażenia, itp. Nawet poprawnie zaprojektowany i przeprowadzony test HiFi nie gwarantuje prawdy absolutnej. Ponieważ nowa wiedza może otworzyć nowe szczegóły, które mogą być włączone do nowych testów.