Publicitate
Recent, am lucrat la o poveste care implica o persoană care a făcut un apel telefonic, care a fost înregistrat. Ulterior, acea persoană a refuzat să admită că a făcut vreodată apelul.
Cu vocea înregistrată de la apelul telefonic și un clip al persoanei care neagă acuzația, m-am apucat să încerc să găsesc o modalitate de a demonstra că vocile sunt una și aceeași.
Recunosc că sunt un pic obsedat de tehnologiile vocale. Acesta este motivul pentru care am așteptat voce Google Cum să utilizați Google Voice pentru a face blog pe telefon Citeste mai mult pentru a deveni mai avansat cu tehnologia sa de recunoaștere vocală și este motivul pentru care ador aplicațiile de control vocal pentru PC ca Tazti Activați vorbirea pe text și controlul vocal prin configurarea recunoașterii vocale în WindowsRecunoașterea vorbirii rămâne mai puternică decât Cortana. Conduce vorbirea la text și controlul vocal. Acest articol vă va arăta ce poate face Recunoașterea vorbirii, cum să o configurați, să o antrenați și să o utilizați. Citeste mai mult
. Cu toate acestea, când vine vorba de compararea digitală a vocilor, am pierdut. Probabil că ați văzut acele filme spion unde computerul poate identifica automat vocea unui criminal cunoscut doar cu imprimarea vocală.Ca să fiu sincer, odată ce am descoperit Sonogram Visible Speech, am realizat că de fapt această tehnologie vocală a spectrogramelor este în prezent un mod viabil de a identifica solid o persoană doar prin vocea ei.
Înțelegerea Spectrogramei
Dacă știți despre izotopii chimici, atunci știți că, cu izotopii, chimiștii pot identifica machiajul chimic al acestora compuși prin izolarea elementelor de bază și folosirea defalcării pentru a identifica componentele individuale ale oricărui amestec. În același mod, un spectrogram audio descompune sunetul audio în frecvențe de bază. Lucrul interesant despre vocea umană este că nimeni nu vorbește cu o singură frecvență. Gura, pasajele nazale și structura casetei voastre determină amestecul de frecvențe care vă formează vocea oarecum unică.
Sonogram Visible Speech este o aplicație software gratuită cu spectrogram, care va lua fișiere video sau audio și va rupe coborâți pista audio în întregul spectru - toate frecvențele sale de-a lungul întregului interval de timp urmări. Un spectrogram completat arată ca imaginea de mai jos.
După cum vedeți, pista de jos arată ca unda sonoră de bază pe care o vedeți într-un program Îndrăzneală 3 sfaturi Audacity pentru îmbunătățirea interviurilor înregistrateAudio clar este vital pentru orice podcast sau înregistrare pe care doriți să o publicați. Îmbunătățiți calitatea audio cu Audacity în trei pași simpli. Citeste mai mult cu toate acestea, panoul central afișează fiecare segment al fișierului de sunet în întregul aspect al frecvenței. Lucrul uimitor al acestui software este faptul că există multe alte forme de undă pe care le puteți utiliza pentru a examina fișierul dvs. de sunet. Acestea sunt destinate în special utilizatorilor avansați.
Puteți configura modul în care se afișează fiecare dintre aceste forme de undă accesând meniul „Opțiuni” și selectând „General Ajustare." Aici puteți defini modul în care graficele logaritmice calculează ieșirea și configurația generală a afișajelor disponibile diagrame.
Dacă sunetul este destul de liniștit sau vocea pe care o analizați este o șoaptă, poate doriți să luați în considerare utilizarea afișajului de frecvență logaritmică. O activați din meniul „Opțiuni” și selectați „Frecvență logaritmică”. Acest lucru va „întări” oarecum zonele semnificative de frecvență din spectrogramă.
Acest lucru poate ajuta cu adevărat la identificarea tiparelor de frecvență clare care identifică pe cineva din sunetul vocii sale. Dacă v-ați pierdut complet și nu știți de unde să începeți, faceți clic pe „Ajutor” și accesați „Ajutor online”, pentru a deschide manualul de ajutor Sonogram online foarte bine scris. Acesta este un loc minunat pentru a începe dacă sunteți nou la analiza audio a spectrogramelor.
Un experiment cu spectrograme folosind vânătoare de fantome
Frumusețea acestui software este că este bună pentru multe utilizări diferite. Unul dintre artefactele care apar deseori în vânătoarea de fantome, un interes personal al meu, este „Fenomen vocal electronic” - în cazul în care vocea unei apariții sau a unei fantome se afișează în audio înregistrări. Aceste înregistrări sunt împrăștiate pe web, așa că am decis să scot câteva din site-urile de vânători fantome și să fac o analiză a spectrografiei.
Spectrograma arată că frecvențele vocale sunt în general scăzute, dar pentru a obține o imagine mai bună a vocilor din înregistrare, trebuie să deschideți forme de undă suplimentare. View Autocorrelation calculează „pitch” în intervalul de timp în care treceți mouse-ul.
„Fantoma” are o frecvență medie a pasului de aproximativ 129,0 hz. Parcurgând la sfârșitul înregistrării unde auziți vocea investigatorului, tonul calculat frecvența este de aproximativ 208,0 hz (ceea ce are sens pentru că este o voce feminină și sunetele înregistrează fantome) masculin.)
Deschiderea afișajului Fast Fourier dezvăluie și mai multe detalii despre voci. Această diagramă descompun rapid frecvențele primare și le afișează într-un cod de culoare.
În acest caz, defalcarea frecvențelor este distribuită, cu un număr mare de frecvențe joase, dar și în amestec. Cu toate acestea, investigatorul din cameră vorbește clar cu o voce care este grupată în frecvență mai mult spre capătul înalt al intervalului, așa cum se arată aici.
Această analiză rapidă a dovedit că cele două voci sunt destul de diferite, dar acesta este doar un exemplu de bază al capabilităților acestui software puternic. Practic, orice situație în care o defalcare a frecvențelor unei unde sonore vă poate ajuta - acesta este software-ul pentru dvs. Este ușor de învățat, rapid de configurat și configurat și funcționează la fel de bine sau mai bine decât orice software cu spectrogram plătit pe piață.
Aveți vreun proiect care ar putea utiliza o spectrogramă? Ați încercat vreodată Discurs vizibil Sonogram? Împărtășiți informațiile dvs. în secțiunea de comentarii de mai jos.
Ryan are o diplomă de licență în inginerie electrică. A lucrat 13 ani în domeniul ingineriei automatizării, 5 ani la IT, iar acum este inginer pentru aplicații. Fost redactor manager al MakeUseOf, a vorbit la conferințele naționale despre vizualizarea datelor și a fost prezentat la TV și radio naționale.