Badania autentyczności nagrań

W tej części serwisu znajdą Państwo szereg informacji na temat badań autentyczności nagrań. 

  • Badania autentyczności nagrań dźwiękowych – jak to się zaczęło
  • Autentyczność nagrania dźwiękowego – definicje
  • Nagranie na taśmie magnetycznej – jak badać autentyczność
  • Autentyczność nagrania w dobie powszechnej cyfryzacji – zagadnienia ogólne
  • Analogowe, czy cyfrowe – cel badania autentyczności nagrania dźwiękowego jest ten sam
  • Aktualne rekomendacje i wytyczne dla badań autentyczności nagrań cyfrowych
  • Badań autentyczności cyfrowych nagrań dźwiękowych w praktyce


Badania autentyczności nagrań dźwiękowych – jak to się zaczęło.


     W praktyce wymiaru sprawiedliwości zdarzają się sytuacje, gdy kwestionowana jest autentyczność nagrania dźwiękowego będącego dowodem w sprawie. Zakres podstawowych zagadnień badawczych związanych z określeniem autentyczności nagrania dźwiękowego został sformułowany orzeczeniem Sądu Najwyższego w sprawie o sygn. III K 49/61 z dnia 10 marca 1961 r.[1]. Orzeczenie to mówi, że: „dowód z taśmy magnetofonowej stanowiącej dowód rzeczowy wymaga przeprowadzenia z kolei dowodu na identyczność zarówno utrwalonych głosów, jak i samej taśmy, a także braku w niej zmian”.


     Mimo, iż powyższa sentencja odnosiła się pierwotnie do nagrań analogowych, utrwalanych na taśmie magnetycznej, to możliwe jest jej uogólnienie na nagrania cyfrowe. Pierwszą istotną kwestią podniesioną w omawianej sentencji jest „identyczność (…) samej taśmy”, co można tutaj utożsamiać z ustaleniem oryginalności, tj. pierwotności, a tym samym nienaruszalności nośnika informacji, którego użyto do utrwalenia dowodowego nagrania. Prócz tego, sentencja mówi o „identyczności głosów”, co z kolei można interpretować jako integralność, a tym samym zgodność z rzeczywistością zarejestrowanych w obrębie nagrania zdarzeń akustycznych (w szczególności wypowiedzi rozmówców oraz towarzyszącej im scenerii akustycznej).

Drugą kwestią wynikającą z treści omawianej sentencji jest badanie samej taśmy, szerzej nośnika informacji, na okoliczność „braku w niej zmian”. Sformułowanie to można interpretować jako analizę zapisu pod kątem wykrycia śladów wskazujących na proces jego edycji, tj. świadomego i celowego manipulowania fragmentami nagrania poprzez np. ich usuwanie, przestawianie, czy dodawanie. Powyższa sentencja nie odnosi się jednak wprost do kwestii ciągłości zapisu dźwiękowego, której zachowanie, bądź nie wynikałoby bezpośrednio z zasady działania urządzenia użytego do utrwalenia analizowanego nagrania na konkretnym nośniku.


     Tak, czy inaczej, niezależnie od toczącego się na przestrzeni ostatniego półwiecza gwałtownego postępu technicznego w zakresie rejestracji dźwięku, omawiana sentencja Sądu Najwyższego przetrwała próbę czasu. Zawarta w niej idea analizowania „identyczności” oraz wykazywania „braku zmian” w obrębie dowodowego nagrania dźwiękowego utrwalonego na danym nośniku znajduje bowiem odzwierciedlenie w wielu definicjach autentyczności nagrania opracowywanych przez liczne ośrodki naukowo-badawcze.


Autentyczność nagrania dźwiękowego – definicje


     Zdefiniowanie pojęcia autentyczność nagrania bynajmniej nie jest rzeczą trywialną i często dochodzi do niejednoznaczności interpretacyjnych wyników analiz mających na celu wykazanie autentyczności nagrania dźwiękowego. Jedną z pierwszych definicji autentyczności nagrania dźwiękowego w Polsce była propozycja Stanisława Błasikiewicza i W. Bednarczyka z 1978r[2]. Według tej definicji: „audiodokument jest autentyczny, gdy charakteryzuje się ciągłością zapisu całej rozmowy (wypowiedzi) wraz z sytuacją akustyczną towarzyszącą przebiegowi zarejestrowanego zdarzenia”.

Mankamentem powyższej definicji jest niejasność kryteriów autentyczności nagrania wyrażonych jako całość rozmowy oraz sytuacja akustyczna towarzysząca przebiegowi zarejestrowanego zdarzenia. Po pierwsze, każde nagranie będzie rejestracją jedynie wycinka, fragmentu jakiejś rzeczywistości, z arbitralnie wybranym momentem rozpoczęcia i zakończenia rejestracji danego nagrania.


     Po wtóre, problem stanowi określenie czym w istocie jest całość danej rozmowy – czy należy spodziewać się, że rejestracja nagrania rozpocznie się od słów przywitania się rozmówców, a zakończy z chwilą ich rozstania? A co, jeśli dysponujący urządzeniem rejestrującym rozmówca w sposób świadomy uruchomił zapis dźwięku już w trakcie prowadzonej przez siebie rozmowy? Czy taki fragmentaryczny zapis zdarzenia akustycznego będzie stanowił podstawę do uznania nagrania za nieautentyczne, mimo iż nagranie to zostało zarejestrowane w sposób zamierzony?


     I wreszcie, termin sytuacja akustyczna towarzysząca przebiegowi zarejestrowanego zdarzenia ma charakter ogólny, a więc pozwala na dużą dowolność interpretacyjną.

Prezentowana przez S. Błasikiewicza oraz W. Bednarczyka definicja autentyczności nagrania dźwiękowego zawierającego mowę (zwanego też niekiedy audiodokumentem) była inspirowana ogólną definicją autentyczności dokumentów pochodzącą z pracy „Technika kryminalistyczna”[3]. Definicja ta pojęciu autentyczny przeciwstawia termin sfałszowany. Mimo, iż potoczna polszczyzna dopuszcza zamienne stosowanie słów autentyczny oraz oryginalny, to w kontekście badań fonoskopijnych znaczenie obu terminów jest jednak odmienne. Według E. B. Koeniga[4], pomijając kwestię arbitralności w definiowaniu pojęcia całość zdarzenia akustycznego, nagranie jest autentyczne, gdy wiernie oddaje przebieg całego utrwalonego zdarzenia akustycznego, w szczególności rozmowy. Zastrzeżenie to dotyczy nagrania rozumianego jako akt rejestrowania dźwięku na konkretnym nośniku.


     Pojęcie autentyczność nagrania rozmowy ma bowiem inne znaczenie niż autentyczność rozmowy jako takiej. Okoliczności przeprowadzenia rozmowy i treść wypowiedzi mogą wszak zostać sfingowane – rozmówcy odgrywają ustalone role, jednakowoż jej zapis pozostanie autentyczny, tzn. urządzenie rejestrujące zostanie włączone w funkcji zapisu dźwięku przed rozpoczęciem rozmowy i wyłączone po jej zakończeniu.


     Nagranie dowodowe może być wielokrotnie kopiowane, a mimo to, choć nieoryginalne, będzie uznawane za autentyczne. Rzecz jasna nie każda kopia wiernie odzwierciedla przebieg zdarzenia utrwalonego w zapisie oryginalnym. Bywa, że w trakcie procesu kopiowania dochodzi do utraty informacji bądź w skutek pofragmentowania oryginalnego zapisu, albo też w wyniku wprowadzenia dodatkowych zniekształceń i zakłóceń kopiowanego sygnału akustycznego. Kwestia wierności kopii względem oryginału miała szczególne znaczenie w przypadku nagrań analogowych, gdzie stosowane techniki kopiowania zawsze wprowadzały jakieś zmiany do kopiowanego sygnału akustycznego. Dopiero pojawienie się technologii cyfrowych pozwoliło na stworzenie takich technik kopiowania, które pozwalają na skopiowanie oryginalnego zapisu dźwiękowego bez wprowadzania jakichkolwiek zmian (tzw. kopiowanie binarne).

Na uwagę zasługuje pogląd, że nagranie nie traci przymiotu autentyczności, jeżeli zostanie ono poddane np. korekcji amplitudowo-częstotliwościowej poprawiającej zrozumiałość zarejestrowanej mowy. Takie podejście do kwestii ingerencji w oryginalność analizowanego nagrania dźwiękowego stoi w jawnej sprzeczności z postulatem Sądu Najwyższego o wykazywaniu „braku zmian” w obrębie nagrania celem uznania go za zapis autentyczny. Nawet jeśli dopuści się jakąś formę ingerencji w oryginalność nagrania, to i tak powstaje pytanie, czy ingerencja ta nie była na tyle silna, że w jej wyniku usunięto jakiekolwiek sygnały akustyczne mogące mieć wpływ na właściwą interpretację dowodu z nagrania.


     Wieloletnia praktyka badań autentyczności nagrań pozwoliła na wypracowanie pewnego „kompromisu” w omawianej kwestii. Otóż dane nagranie należy uznać za autentyczne, jeżeli zawarta w jego obrębie informacja pozwala na przeprowadzenie określonej tezy dowodowej z tego nagrania. Dla przykładu, jeśli nagranie było poddane obróbce mającej na celu redukcję zakłóceń mowy, to zapis taki można by uznać za autentyczny wtedy, gdy w wyniku takiej obróbki nie doszło do zniekształceń mowy uniemożliwiających prawidłowy odsłuch treści wypowiedzi. Jeśli jednak teza dowodowa opierałaby się na analizie i interpretacji towarzyszących mowie zdarzeń akustycznych z tła, wówczas uznanie nagrania poddanego procedurze redukcji zakłóceń za zapis autentyczny byłoby błędem.


     Prócz wyżej opisanych kwestii związanych z oryginalnością nagrania dźwiękowego, jako równie ważne kryterium autentyczności nagrania dźwiękowego, S. Błasikiewicz wskazuje ciągłość jego zapisu. Rzeczywiście, kryterium to jest dość ścisłe, bowiem odnosi się ono bezpośrednio do silnie zobiektywizowanych aspektów technicznych nagrania.


     W toku prowadzonych prac rozwojowych nad metodologią badań autentyczności nagrań dźwiękowych okazało się mianowicie, że istnieje możliwość precyzyjnego określenia tzw. śladów braku ciągłości zapisu dźwiękowego utrwalanego na taśmie magnetycznej. Opracowano nawet specjalistyczny przyrząd – mikroskop magnetooptyczny – służący do wizualizowania tychże śladów wprost z taśmy magnetycznej. Przyrząd ten działa w oparciu o zjawisko Faradaya, które polega na zdolności niektórych przezroczystych materiałów do skręcania płaszczyzny polaryzacji przechodzącego przez nie światła pod wpływem pola magnetyczneg[5]. Równolegle ślady braku ciągłości wizualizowano przy użyciu tzw. spektrogramów – obrazów przedstawiających dźwięk w trzech wymiarach – czasu (oś X), częstotliwości (oś Y) oraz natężenia (mocy) dźwięku określonego skalą szarości punktu (piksela) obrazu.

Metoda spektrograficzna analizy ciągłości zapisu nagrania dźwiękowego (zwana też. analizą czasowo-częstotliwościową) ma charakter uniwersalny, toteż może być stosowana zarówno do nagrań analogowych, jak i cyfrowych. Inną, znacznie precyzyjniejszą w porównaniu do „klasycznego” spektrogramu, metodą obrazowania zjawisk akustycznych z nagrań jest tzw. spektrogram z przemieszczeniem (ang. reassigned spectrogram). Metoda ta jest szczególnie przydatna w analizie niekiedy niezwykle subtelnych śladów braku ciągłości zapisu występujących w nagraniach cyfrowych.

Nagranie na taśmie magnetycznej – jak badać autentyczność


     Dalsze lata praktyki w zakresie badań fonoskopijnych prowadzonej w ramach tzw. „szkoły Błasikiewicza”[6] przyniosły rozszerzenie zaproponowanej przez jej twórcę definicji autentyczności nagrania. Doprecyzowano także zakres czynności wchodzących w skład badań autentyczności nagrań. I tak: „(…) badania autentyczności zapisów dźwiękowych mają na celu ustalenie, czy dowodowe nagranie nie zostało poddane jakimkolwiek zabiegom technicznym bądź elektroakustycznym, w wyniku których nagranie to nie przedstawiałyby, w sposób obiektywny, wszystkich zdarzeń akustycznych zaistniałych w rzeczywistości, w momencie jego utrwalenia przez urządzenie rejestrujące. W szczególności należy ustalić, czy w poddawanym analizie dowodowym materiale dźwiękowym występują jakiekolwiek przerwy w ciągłości zapisu, a jeżeli tak, to jaki jest ich rodzaj i charakter, czy z przedmiotowego nagrania nie zostały wyeliminowane fragmenty zapisu bądź też dograne inne nagrania oraz czy nie zmieniono chronologii zarejestrowanych wypowiedzi”.


     Tak sformułowany zakres badań autentyczności nagrań rozszerza pole analizy o „element językoznawczy”, bowiem prócz aspektów technicznych nagrania, przedmiotem dociekań staje się także ogólnie pojęta treść zarejestrowanych w nagraniu rozmów. Tak więc szczegółowym analizom poddaje się logiczną spójność wypowiedzi w obrębie dyskursu tworzonego przez uczestników zarejestrowanej w nagraniu rozmowy. Narzędzia do tego rodzaju analizy dostarczają trzy działy językoznawstwa – pragmatyka (badanie sposobów posługiwania się mową przez rozmówców), semantyka (analiza znaczeń poszczególnych słów, fraz, czy zdań) oaz składnia badająca budowę wypowiedzeń.


     Niezwykle ważną rolę w analizie ciągłości wypowiedzi pełni prozodia, w ramach której badane są akcent, intonacja oraz iloczas – cechy charakteryzujące brzmienie wypowiedzi. Szczególnie istotna jest tutaj analiza zaburzeń w obrębie tzw. konturu intonacyjnego wypowiedzi. Ewentualne „Załamanie” melodii wypowiedzi stanowi bowiem silną przesłankę o braku ciągłości zapisu nagrania.

Istotnym dopełnieniem opisanej wyżej analizy językoznawczej treści wypowiedzi z nagrania jest badanie ogólnie pojętego tła akustycznego (stąd określenie opisywanej metody jako analiza akustyczno-lingwistyczna). Przez tło akustyczne należy tu rozumieć wszelkie dźwięki pochodzące z otoczenia rozmówców. Mogą one mieć charakter całkowicie przypadkowy (np. odgłosy przyrody w parku, hałas przejeżdżających pojazdów w sąsiedztwie rozmówców, gwar rozmów w restauracji, itp.). Jednakowoż dźwięki z tła akustycznego często stanowią istotne uzupełnienie treści wypowiedzi, jako że są one efektem zachowań pozawerbalnych rozmówców (dla przykładu, sekwencja dźwięków w postaci szelestu papieru oraz odgłosu otwieranej szuflady, której towarzyszy wypowiedź o treści „(…) dobrze, to w takim razie sprawę uznajemy za załatwioną”, albo zdarzenie akustyczne w postaci serii plaśnięć, po których następuje kobiecy szloch). Brak ciągłości oraz logicznej spójności na metapoziomie pozawerbalnych zdarzeń akustycznych bardzo często jest wynikiem braku ciągłości zapisu nagrania. Paradoksalnie, im bogatsze tło akustyczne, które równocześnie stanowi źródło zakłóceń dla zarejestrowanej w nagraniu mowy, tym trudniej dokonać w nim zmian bez pozostawienia zauważalnych śladów takich działań.


     Stopień trudności ewentualnego przerabiania nagrania zależy również od typu języka, którym posługują się nagrywani rozmówcy. I tak: w przypadku języków fleksyjnych (np. j. Polskiego) usunięcie jednego elementu wypowiedzi na ogół pociąga za sobą zmiany morfologiczne (fleksyjne) w innych częściach tej wypowiedzi. Dla przykładu, usunięcie partykuły przeczącej nie z orzeczenia wypowiedzi o treści Ale nie dopuszczamy takich zmian w naszym projekcie skutkowałoby koniecznością przekształcenia frazy dopełnienia takich zmian z postaci dopełniaczowej do postaci mianownikowej – takie zmiany. Ponadto zaburzeniu uległaby prozodia tak zmodyfikowanej wypowiedzi, bowiem zapewne wymówiona z emfazą (a więc pod akcentem) partykuła nie osłabiłaby akcent poboczny na pierwszej sylabie w następującym po nie czasowniku dopuszczamy. Takie „osłabienie” akcentu pobocznego na pierwszej sylabie w czasowniku dopuszczamy z pewnością nie byłoby zgodne z regułami akcentowania czasowników wielosylabowych z orzeczenia w zdaniach oznajmujących, twierdzących.

Przeprowadzenie analogicznej operacji usunięcia przeczenia z wypowiedzi w języku angielskim byłaby o wiele łatwiejsza, jako że j. angielski należy do grupy języków analitycznych, gdzie istotną rolę w formowaniu wypowiedzi pełni składnia (szyk wyrazów w zdaniu), a mniejszą morfologia (fleksja wyrazów). Tak więc, w pewnym uproszczeniu, odwrócenie negacji orzeczenia w wypowiedzi o treści We do not accept such changes in our project sprowadzałoby się do prostego usunięcia frazy przeczącej do not.


     Jak widać z powyższych przykładów, próba manipulowania treścią wypowiedzi, bez pozostawiania widocznych śladów, jest co najmniej bardzo trudna, jeśli w ogóle możliwa. Dlatego też, w praktyce badań fonoskopijnych spotyka się przykłady usuwania dłuższych wypowiedzi w całości, nie zaś pojedynczych słów z konkretnych wypowiedzi, a ślady braku ciągłości zapisu często mają charakter przypadkowy, rzadko intencjonalny.


*        *        *


     W przypadku nagrań analogowych (rejestrowanych na taśmie magnetycznej) brak ciągłości zapisu może być spowodowany następującymi czynnikami:

  • użycie funkcji pauzy (wstrzymania rejestracji) w magnetofonie;
  • odłączenie zasilania magnetofonu (ewentualnie wyczerpanie się baterii);
  • montaż zapisu za pomocą cięcia i sklejania taśmy z wcześniej zarejestrowanym nagraniem;
  • wykonywanie kompilacji fragmentów nagrania/nagrań oryginalnych poprzez tworzenie kopii;
  • wykasowywanie, bądź dogrywanie fragmentów nagrania.

Autentyczność nagrania w dobie powszechnej cyfryzacji – zagadnienia ogólne


     XXI wiek przyniósł zasadniczy przełom w dziedzinie technik rejestracji nagrań dźwiękowych. Do głosu doszły cyfrowe techniki zapisu dźwięku, odsuwając w cień tradycyjną taśmę magnetofonową. Stąd wypływają istotne konsekwencje dla wyboru metody badań autentyczności nagrań i oceny ich wyników. W szczególności, z uwagi na całkowitą odmienność techniki zapisu nagrań cyfrowych, zastosowanie straciła metoda wizualizacji śladów braku ciągłości nagrania utrwalonego na taśmie magnetycznej.

Wbrew jednak opinii niektórych praktyków[7], należy podnieść, iż metody spektrograficzna oraz audytywna (akustyczno-lingwistyczna) nadal znajdują szerokie i zarazem podstawowe znaczenie w badaniu autentyczności nagrań cyfrowych.

Należy jednak zauważyć, iż analizowane ślady braku ciągłości zapisu mają dużo subtelniejszy charakter w porównaniu ze śladami głowicy magnetofonowej na taśmie. Tak więc zastosowanie zarówno metody spektrograficznej, jak i akustyczno-lingwistycznej do analizy nagrania cyfrowego wymaga dużo większej wprawy i zaangażowania ze strony biegłego, niż to było w przypadku nagrań analogowych utrwalanych na taśmie magnetycznej. Oczywiście dorobek metodologiczny w zakresie badań autentyczności nagrań cyfrowych jest szerszy niż wyżej opisane metody (zob. opis poniżej).


     Analizując cyfrowe zapisy dźwiękowe pod kątem ich autentyczności, nasuwa się uzasadniona wątpliwość, czy niewykrycie śladów braku ciągłości zapisu nagrania może być podstawą zawarcia w opinii biegłego sformułowania o autentyczności nagrania dowodowego. Albo też, czy wobec potencjalnej niewykrywalności śladów ewentualnego fałszerstwa, należy wstrzymywać się od kategorycznych sformułowań? Zdaniem wielu praktyków (w tym również autora niniejszych słów) dopuszczalne jest kategoryczne wypowiadanie się w kwestii autentyczności nagrań cyfrowych pod warunkiem jednak, że biegły jest w stanie zastosować kilka wiarygodnych metod, z których żadna nie wskazuje miejsc mogących świadczyć o braku ciągłości nagrania.


     Stosując nomenklaturę z zakresu badań autentyczności dokumentów, możliwe jest stwierdzenie, że niemal wszystkie próby fałszowania nagrań dźwiękowych są dokonywane poprzez przerabianie. Do sporej rzadkości należą przypadki, gdy dokonuje się podrobienia polegającego na rejestrowaniu zdarzeń, których okoliczności zostały sfingowane. Praktyka badań fonoskopijnych pokazuje bowiem, że trudności w zakresie montowania (przerabiania) zapisów dźwiękowych wynikają z braku możliwości dowolnego usuwania (ewentualnie dodawania) fragmentów nagrania tak, żeby zachować logiczną spójność wypowiedzi uczestników zarejestrowanej rozmowy przy równoczesnym utrzymaniu ciągłości i spójności wszelkich zdarzeń akustycznych z tła współtowarzyszących rozmowie dowodowej (zob. również szczegółowy opis powyżej).

W szczególności w odniesieniu do zapisów cyfrowych, warunkiem poprawności wnioskowania na podstawie badań autentyczności nagrania dźwiękowego jest adekwatność zastosowanych metod do specyfiki analizowanego nagrania. Dlatego na przykład badanie zmienności częstotliwości przebiegu przydźwięku sieci energetycznej w nagraniu o silnych zakłóceniach w paśmie 50 Hz jest błędem w sztuce.

Analogowe, czy cyfrowe – cel badania autentyczności nagrania dźwiękowego jest ten sam


     Przewidziane praktyką fonoskopijną badanie autentyczności nagrania polega w ogólności na ocenie spójności oraz integralności zapisu całego zdarzenia (np. rozmowy) przy uwzględnieniu takich zjawisk zachodzących w trakcie rejestracji nagrania, na które osoba rejestrująca nie miała żadnego lub większego wpływu. W tym celu bada się m.in.:

  • treść rozmowy;
  • kontur intonacyjny zarejestrowanych słów, fraz, zdań lub całych wypowiedzeń;
  • ciągłość sygnału mowy wynikającą z psychofizjologicznego procesu mówienia;
  • kontekst sytuacyjny, w którym rejestrowano nagranie, czyli zdarzenia akustyczne towarzyszące rejestrowanym wypowiedziom;
  • ciągłość zapisu zjawisk akustycznych.


     Przeprowadzone badania pozwalają odpowiedzieć na następujące pytania:

  • czy zapisano całą rozmowę czy tylko jej fragmenty;
  • czy po zarejestrowaniu danego nagrania usunięto z niego jakieś fragmenty zdań, poszczególne słowa, czy też nie;
  • czy nie zmieniono kolejności zarejestrowanych wypowiedzi;
  • jeśli zmontowano dane nagranie, to czy z jednej, czy też z kilku innych rozmów;
  • czy nagranie lub nagrania zarejestrowano przy użyciu tego samego urządzenia i w tych samych warunkach akustycznych;
  • czy dane nagranie jest oryginalnym zapisem lub kopią wcześniej zarejestrowanego nagrania.


     W pewnych sytuacjach biegły z zakresu fonoskopii przeprowadza także identyfikację urządzenia, przy użyciu którego zostało zarejestrowane nagranie dowodowe. Ekspert przeprowadza szereg eksperymentów ze wskazanym przez zleceniodawcę sprzętem rejestrującym, a uzyskane dane pomiarowe poddaje analizie w celu potwierdzenia lub wykluczenia hipotezy o użyciu danego urządzenia do rejestracji nagrania dowodowego).


Aktualne rekomendacje i wytyczne dla badań autentyczności nagrań cyfrowych


     Rekomendacja AES–27 1996 opracowana przez międzynarodowe stowarzyszenie inżynierów dźwięku AES (Audio Engineering Society) stanowi podstawę do dalszych rozważań w zakresie badań autentyczności cyfrowych nagrań dźwiękowych. Według tej rekomendacji: „(…) nagraniem autentycznym jest zapis dźwiękowy utrwalony [na konkretnym fizycznym nośniku] w momencie zaistnienia zdarzeń akustycznych w nim zarejestrowanych, zgodnie z okolicznościami, sposobem i techniką zadeklarowaną przez stronę, która to nagranie wytworzyła. Ponadto nagranie autentyczne to nagranie wolne od niewyjaśnionych artefaktów, [zniekształceń rejestrowanego sygnału akustycznego], przeróbek, wstawień, wykasowań lub edycji”[8]. Pierwsza część wyżej zacytowanej rekomendacji wskazuje na oryginalność zapisu dźwiękowego jako jednego z istotnych atrybutów autentyczności nagrania (w odróżnieniu od kopii nagrania, która stanowi rejestracją zdarzeń akustycznych post factum, zapis oryginalny powstaje równocześnie z zaistnieniem rejestrowanych zdarzeń akustycznych). Dalej omawiana definicja zakłada nie tylko próbę identyfikacji śladów ingerencji w ciągłość zapisu, ale również badanie okoliczności jego powstania (warunków, sposobu i techniki rejestracji danego nagrania). Oznacza to, iż istotnym elementem badań autentyczności nagrań staje się również inspekcja urządzenia użytego do zarejestrowania analizowanego nagrania, co często wiąże się z wykonywaniem stosownych eksperymentów i testów akustycznych z użyciem tego urządzenia, czasami w miejscu zarejestrowania nagrania.

Istotnym mankamentem wyżej przytoczonej rekomendacji jest odwoływanie się do wiedzy dysponenta nagrania na temat okoliczności jego powstania. Praktyka fonoskopijna pokazuje bowiem, że dysponent nagrania (organ wymiaru sprawiedliwości, czy osoba prywatna dostarczająca nagranie do badań) często nie ma wystarczającej wiedzy na temat danego nagrania, albo też kompetencje techniczne dysponenta nagrania są niewystarczające do określenia sposobu rejestracji nagrania, czy warunków akustycznych, w których ono powstało. Sytuacja taka ma miejsce w szczególności, gdy przedmiotem badania jest otrzymana „z drugiej ręki” kopia binarna nagrania (kopia identyczna z oryginałem – zob. opis poniżej). Tak, czy inaczej, to na prowadzącym badania autentyczności nagrań biegłym spoczywa obowiązek wnioskowania o okolicznościach i sposobie rejestrowania nagrania w oparciu o analizę stanu technicznego nagrania oraz utrwalonych w jego obrębie zdarzeń akustycznych. Wiedza strony na temat badanego nagrania ma tu więc charakter pomocniczy i każdorazowo podlega ścisłej weryfikacji przez biegłego.


     Omówiona powyżej rekomendacja AES z 1996r., jakkolwiek pierwotnie dotyczyła głównie nagrań analogowych utrwalanych na taśmie magnetycznej, to z biegiem czasu została ona poddana weryfikacji i ponownie zaakceptowana w tym samym kształcie w 2007 r., czyli już w czasach gwałtownie rosnącej popularności nagrań cyfrowych.

Kolejna istotna rekomendacja dotycząca badań autentyczności nagrań cyfrowych została opracowana przez Północnoamerykańskie Zrzeszenie Laboratoriów kryminalistycznych SWGDE (Scientific Working Group on Digital Evidence). W zbiorze najlepszych praktyk wydanym przez tę organizację w dniu 8 września 2014 r. można przeczytać: „Badanie autentyczności ma na celu ustalenie, czy nagranie jest zgodne [z okolicznościami oraz] ze sposobem, w jaki miało ono rzekomo zostać utrwalone. W rezultacie nie istnieje uniwersalny sposób umożliwiający uznanie nagrania za autentyczne bez pełnego poznania [i zweryfikowania] prawdziwości sądów o badanym nagraniu wyrażanych przez jego twórcę oraz bez zrozumienia stawianych temu nagraniu zarzutów. SWGDE zdaje sobie sprawę z faktu, że badania autentyczności nagrań stanowią [w istocie] procedurę o wysokim stopniu złożoności, która wymaga od jej wykonawcy odpowiednich kwalifikacji.”[9].


     Wersja tego dokumentu[10] z roku 2016 zawiera opis wielu metod i technik badawczych wraz z rekomendacjami oraz przykładami ich zastosowania. Omawiany dokument stanowi także oficjalne stanowisko Zrzeszenia, w którym jednoznacznie sformułowano paradygmat analizy oraz interpretacji wyników badania autentyczności cyfrowych nagrań dźwiękowych. Według tego dokumentu: „żadne naukowe dochodzenie, również w zakresie kryminalistyki, nie prowadzi do absolutnej pewności. Zatem wnioski z badania autentyczności nagrania dźwiękowego nie powinny być formułowane kategorycznie. Powinno się unikać języka sugerującego uzyskanie stuprocentowej pewności za wyjątkiem przypadków znanych modyfikacji lub kasowania”.

   Ciągły rozwój w zakresie technologii rejestracji nagrań dźwiękowych (w szczególności technik cyfrowych) skutkuje częstymi modyfikacjami i ulepszeniami stosowanych metod badania autentyczności zapisów dźwiękowych. W warunkach europejskich ważną platformą wymiany doświadczeń jest Europejska Sieć Instytutów Nauk Sądowych (European Network of Forensic Science Institutes). W ramach tej sieci funkcjonuje grupa robocza ds. analizy mowy oraz dźwięku.

Badań autentyczności cyfrowych nagrań dźwiękowych w praktyce


     Ten rodzaj badań fonoskopijnych to złożona procedura wymagająca od biegłego zarówno wnikliwej analizy audytywnej oraz sonograficznej nagrania, jak i zastosowania odpowiedniego instrumentarium głównie w postaci specjalistycznego oprogramowania komputerowego. Jak twierdzi Alan Cooper, ekspert londyńskiej Metropolitan Police: „Udowodnienie faktu, że nagranie jest autentyczne wymaga weryfikacji twierdzeń i zeznań [stron postępowania] w odniesieniu do zawartości i historii samego nagrania. Badania prowadzi się w celu ustalenia, czy nagranie jest oryginalne oraz wyjaśnienia wszelkich zidentyfikowanych anomalii, np. nieciągłości sygnałów utrwalonych w nagraniu”[11]. Istotnym aspektem badań autentyczności nagrania dźwiękowego jest bezsporne ustalenie jego oryginalności. Stwierdzenie, że dane nagranie jest autentyczne oznacza więc „uznanie [badanego] zapisu dźwiękowego za oryginalny, o pochodzeniu udokumentowanym na podstawie ustaleń procesowych i zeznań świadków, jak również na podstawie analizy z wykorzystaniem dedykowanych metod badawczych. Udowodnienie faktu, że nagranie jest oryginalne eliminuje możliwość wystąpienia zamierzonych edycji”[12].


     Podobny pogląd zdaje się prezentować Eddy Brixen, według którego badanie autentyczności nagrania dźwiękowego należy rozumieć jako: „każda forma dokumentacji, która może zweryfikować pochodzenie oraz zawartość nagrania, jak również nośnik, na którym utrwalono nagranie”[13]. Weryfikacja nośnika na ogół obejmuje analizę kilku czynników, do których należą m.in.:

  • zgodność parametrów technicznych oraz akustycznych (w szczególności widma amplitudowo-częstotliwościowego) dostarczonego do badań materiału dźwiękowego z parametrami nagrań testowych wykonanych przy użyciu urządzenia potencjalnie użytego do rejestracji badanego materiału dźwiękowego;
  • zgodności formatu danych dźwiękowych badanego materiału z formatem danych dźwiękowych wykorzystywanym przez wskazane urządzenie rejestrujące;
  • możliwości edycyjne materiału dźwiękowego zarejestrowanego w pamięci wskazanego urządzenia rejestrującego;
  • możliwości transferu danych dźwiękowych przez urządzenie rejestrujące;
  • możliwości konwersji danych dźwiękowych do różnych formatów;
  • zgodności metadanych zapisanych w dowodowym pliku z metadanymi pochodzącymi z plików testowych wytworzonych za pomocą użytego urządzenia rejestrującego lub podobnego modelu.[14]


     W Pracowni Fonoskopii i Rekonstrukcji Nagrań ArsDigita, jako podstawę do sformułowania definicji autentyczności nagrania przyjęto założenia zawarte w przytoczonym wyżej dokumencie wydanym przez AES[15]. W tym miejscu należy zauważyć, że jego uzupełnienie stanowi rekomendacja określająca sposób badania autentyczności taśm magnetycznych: „Analizując zapis dźwiękowy na taśmie magnetycznej, biegły powinien badać wskazane oryginalne nagranie wraz z dostępnym oryginalnym urządzeniem [użytym do zarejestrowania badanego nagrania]. Zadaniem biegłego jest formułowanie takich wniosków, które mogłyby w sposób naukowy świadczyć o utrwaleniu wskazanego nagrania za pomocą danego urządzenia rejestrującego oraz o braku rozstrzygających dowodów fałszowania, nieautoryzowanego edytowania lub innych form zamierzonych wykasowań, fizycznych lub innych, w obrębie analizowanego zapisu”[16].

Realizację zleconych badań autentyczności nagrań zawsze poprzedza wykonanie uwierzytelnionych kopii cyfrowych[17] analizowanego materiału dźwiękowego. Należy w tym miejscu odróżnić kopię binarną cyfrowego zapisu dźwiękowego od kopii „z korekcją” tego zapisu powstałą np. na skutek konwersji danych dźwiękowych oryginalnego zapisu do innego formatu. Kopia binarna oznacza „sklonowanie” danych oryginalnych bez jakiejkolwiek ich modyfikacji, dzięki czemu poddawana badaniom autentyczności kopia robocza w pełni odzwierciedla stan oraz cechy oryginału. Kopia „z korekcją” zasadniczo oznacza jakąś formę modyfikacji oryginalnych danych dźwiękowych (czy to poprzez wspomnianą wyżej konwersja danych dźwiękowych do innego formatu, czy też poprzez stosowanie technik „poprawiających” jakość dźwięku w nagraniu). Analiza takich kopii nagrania dowodowego znacząco utrudnia prowadzone badania autentyczności nagrań, w szczególności gdy w grę wchodzi analiza subtelnych śladów manipulacji zawartością nagrania obejmujących pojedyncze próbki sygnału akustycznego. W czasach ogólnie dostępnych narzędzi do rejestracji i edycji nagrań dźwiękowych, analiza kopii „z korekcją” jest niestety na porządku dziennym. I wreszcie kopiowanie oryginalnego dźwięku przez digitalizację analogowego sygnału akustycznego będące największym wyzwaniem dla biegłego. Zastosowanie takiej metody kopiowania nagrania jest niezbędne, jeśli oryginalne nagranie zostało zarejestrowane w technice analogowej np. na taśmie magnetycznej. Bywa jednak, że do badań trafiają „tanie” dyktafony cyfrowe wyposażone jedynie w gniazdo słuchawkowe oferujące sygnał analogowy. W takim przypadku również konieczne jest zastosowanie digitalizacji jako formy kopiowania oryginalnego materiału dźwiękowego do postaci umożliwiającej przeprowadzenie badań autentyczności nagrań. Niewątpliwą wadą tego rodzaju kopiowania jest wprowadzenie dodatkowych zniekształceń i zakłóceń kopiowanego sygnału akustycznego pochodzących zarówno z urządzenia odtwarzającego oryginalne nagranie, jak i rejestrującego kopię. Jak pokazuje praktyka, możliwe jest prowadzenie badań autentyczności nagrań nawet przy degradacji sygnału akustycznego spowodowanej przez proces digitalizacji sygnału analogowego.

Dość restrykcyjne stanowisko w kwestii możliwości przeprowadzenia badań autentyczności nagrania cyfrowego prezentują eksperci FBI Bruce Koenig i Douglas Lacey. Twierdzą oni mianowicie, że: „konwertowane kopie nagrań oryginalnych nie mogą być poddawane badaniom autentyczności, ponieważ powoduje to trudności z wykryciem niektórych zmian po tym, jak nagranie jest np. kopiowane do komputera, zmienione/konwertowane do innego formatu, poddane kompresji, re-kompresowane, itd.”[18]. Podobne stanowisko przyjmują naukowcy amerykańskiego National Center for Media Forensics Uniwersytetu Colorado w Denver, według których: „przekazanie do badań jedynie drugiej generacji plików (plików przetwarzanych, np. poddanych kompresji [lub re-kompresji]), bez stosownych wyjaśnień jest podejrzane i czyni wiarygodne badanie autentyczności trudnymi lub niemożliwymi [do wykonania]”[19]. Osoba rejestrująca dane nagranie mogła wprawdzie po prostu otworzyć plik, aby go odsłuchać, a następnie w sposób zupełnie nieświadomy zapisać go ponownie (np. w innym formacie), bez wprowadzania jakichkolwiek zmian. Autor niniejszych słów stoi na stanowisku, iż zadaniem eksperta jest nie tylko ustalenie stanu faktycznego, w tym przypadku braku oryginalności analizowanego zapisu, lecz także postawienie hipotez co do ewentualnych przyczyn i okoliczności zaistnienia takiego stanu rzeczy. Ponadto należy podnieść, iż ewentualna konwersja formatów danych dźwiękowych, czy ich kompresja, bądź re-kompresja, jakkolwiek pozbawia nagranie przymiotu oryginalności, to jednak nie uniemożliwia wnioskowania o autentyczności danego nagrania, jako że zmiana formatu danych dźwiękowych rzadko kiedy pociąga za sobą tak głęboką zmianę właściwości akustycznych sygnału dźwiękowego, żeby miało to uniemożliwić przeprowadzenie wiarygodnych badań autentyczności nagrania. Należy w tym miejscu przypomnieć, iż badanie autentyczności nagrania obejmuje także analizę spójności i chronologii ogólnie pojętych zdarzeń akustycznych do których należą wypowiedzi rozmówców i towarzyszące im dźwięki z tła. Jak pokazuje praktyka, zmiana formatu danych dźwiękowych ma ograniczony, bądź zgoła nie ma żadnego wpływu na zawartość informacyjną nagrania, tak więc wnioskowanie o ewentualnej konwersji danych dźwiękowych do innego formatu, czy też ich re-kompresja nie powinny stanowić przesłanki do kwestionowania wyników badań autentyczności nagrania prowadzonych na poziomie analizy zdarzeń akustycznych.


     Literatura przedmiotu przedstawia szereg propozycji metodyki badań autentyczności cyfrowych zapisów Dźwiękowych. Dla przykładu, Koenig i Lacey prezentują protokół badań autentyczności nagrań dźwiękowych[20], w którym wymieniają szereg metod możliwych do wykorzystania podczas prowadzenia tego typu analizy. Zalecają oni położenie szczególnego akcentu na następujące kwestie:

  • ustalenie oryginalności zapisu dźwiękowego (czy zapis jest oryginalny, czy kopia binarna, a może kopia „z korekcją);
  • ustalenie występowania ewentualnych śladów braku ciągłości zapisu powstałych w trakcie rejestracji nagrania (stwierdzenie obecności śladów włączenia/wyłączenia funkcji rejestracji dźwięku, wstrzymania rejestracji (użycie funkcji tzw. „pauzy”), czy śladów działania systemu automatycznej rejestracji dźwięku aktywowanego bodźcem akustycznym;
  • ustalenie śladów ewentualnej edycji/przeróbki nagrania już po jego rejestracji;
  • weryfikacja źródła rejestracji danego nagrania w postaci wskazanego do badań urządzenia rejestrującego.


     Dla odmiany Grigoras i in. zaprezentowali protokół badania autentyczności nagrań uzupełniony o zestaw parametrów, jakie należy wyodrębnić z badanego nagrania, a następnie poddać całościowej analizie. Wspomniane parametry zostały ujęte w cztery klasy: badanie pliku, analiza globalna, analiza lokalna oraz weryfikacja urządzenia. Ponadto eksperci zaproponowali, aby wyniki badań uzyskanych z wykorzystaniem różnych technik badawczych były oceniane na podstawie trzypunktowej skali[21]:

  • odpowiadający autentycznemu nagraniu;
  • nieodpowiadający autentycznemu nagraniu;
  • bez możliwości rozstrzygnięcia.

     Należy tutaj jeszcze zwrócić uwagę na fakt, że autorzy celowo zrezygnowali z używania słów „autentyczny” oraz „nieautentyczny”. Różnica między tymi określeniami wynika z tego, że według autorów prowadzone badania dają jedynie częściowy obraz historii badanego zapisu, stanowiący pewien specyficzny rodzaj poszlaki.


Więcej informacji na temat fonoskopii znajdą Państwo tutaj, lub w serwisie FAQ.


[1] OSNKW 1962, nr 1, poz. 8.

[2] S. Błasikiewicz, W. Bednarczyk, Metoda badań autentyczności zapisu magnetofonowego, Problemy Kryminalistyki 1978, nr 131, s. 34–50

[3] Technika kryminalistyczna, pod red. W. Kędzierskiego, Szczytno 1995, t. 2, s. 256 .

[4] B.E. Koenig: Authentication of forensic audio recordings, Journal of the Audio Engineering Society 1990,

nr 38 (1/2).

[5] J.S. Boulen: Applying an image enhancement technique to imaging polarimetry used in magneto optical investigations of audio tapes in authenticity investigations, Forensic Science International, vol. 136, suppl. 1,

2003; O. Boss, S. Gtroerer , N. Neoustroev: A new tool for the visualization of magnetic features on audiotapes,

International Journal 01 Speech Language and the Law, Vol. 10, No 2 (2003) .

[6] Potoczne określenie działalności stworzonego przez S. Błasikiewicza Wydziału Fonoskopii przy Zakładzie Kryminalistyki Komendy Głównej MO.

[7] W. Maciejko, J. Rzeszotarski, T. Tomaszewski: 50 lat polskiej fonoskopii, Problemy Kryminalistyki 269 (lipiec-wrzesień) 2010, s. 69-83.

[8] Audio Engineering Society. AES–27 1996 (r2007), AES Recommended Practice for Forensic Purposes – Managing Recorded Audio Materials Intended for Examination, Audio Engineering Society, Inc. 2007.

[9] SWGDE Best Practices for Forensic Audio – Scientific Working Group on Digital Evidence, wersja 2, 8.09.2014 r.

[10] SWGDE Best Practices for Digital Audio Authentication – wersja nr 1 (23.06.2016).

[11] A. J. Cooper, Detection of copies of digital audio recordings for forensic purposes, rozprawa doktorska, The Open University, 2006, s. 10

[12] Ibidem, s. 14.

[13] E. B. Brixen, Techniques for the Authentication of Digital Audio Recordings, 122th AES Convention, 5–8.05.2007, Wiedeń, Austria.

[14] B. Koenig, D. Lacey, Forensic Authentication of Digital Audio Recordings, Journal of the Audio Engineering Society, 57 (9), 2009, s. 662–695.

[15] Audio Engineering Society. AES–27 1996 (2007)…, op. cit.

[16] Audio Engineering Society. AES–43 2000, Standard for Forensic Purposes – Criteria for the Authentication of Analog Audio Tape recordings, 2000.

[17] Uwierzytelnienie kopii nagrania może następować m.in. po weryfikacji sum kontrolnych, podpisów cyfrowych, itp.

[18] B. Koenig, D. Lacey, Forensic Authentication of Digital Audio…, op. cit.

[19] C. Grigoras, D. Rappaport, J. Smith, Analytical Framework for Digital Audio Authentication, 46th AES International Conference, Denver, CO, USA, 2012.

[20] B. Koenig, D. Lacey, Forensic Authentication of Digital Audio…, op. cit.

[21] C. Grigoras, D. Rappaport, J. Smith, Analytical Framework…, op. cit.

Źródłem informacji do niniejszego tekstu pochodzą z:

W. Maciejko, J. Rzeszotarski, T. Tomaszewski, 50 lat polskiej fonoskopii, Problemy Kryminalistyki 269, (lipiec-wrzesień) 2010, s. 69-83

R. Korycki, Problematyka badania autentyczności cyfrowych nagrań fonicznych, Prokuratura i Prawo 12, 2016, s. 138-157