Te-ai întrebat vreodată cum „aude” Shazam muzica pe care o cânți și o identifică cu o asemenea acuratețe? Ei bine, nu ești singur.
Tehnologia care alimentează serviciul de recunoaștere a muzicii este un mister pentru mulți, mai ales că serviciul a fost lansat cu ani înainte ca smartphone-urile și învățarea automată să devină un lucru.
În acest articol, vom analiza modul în care funcționează Shazam și modul în care poate recunoaște muzica cu acuratețe.
Ce este Shazam?
Shazam este o aplicație populară de recunoaștere a muzicii pe care o poți folosi pentru a găsi informații despre o piesă nouă pe care o iubești, dar nu știi titlul sau numele artistului.
Spuneți că sunteți într-o cafenea sau vă plimbați într-un magazin din colț și auziți o piesă nouă pe care ați dori să o aveți în biblioteca dvs. de muzică. Shazam te ajută să găsești melodia cu ușurință. Tot ce trebuie să faceți este să înregistrați câteva secunde din melodie în aplicație.
Aplicația Shazam folosește o tehnologie sofisticată de recunoaștere a sunetului pentru a identifica muzica pe care o auziți câteva secunde, astfel încât să puteți afla numele artistului și să urmăriți, să vizionați videoclipuri și chiar să cumpărați sau să redați în flux melodia de pe dvs. dispozitiv.
Descarca: Shazam pt iOS |Android (Gratuit)
Cum funcționează Shazam?
Imaginea 1 din 4
Imaginea 2 din 4
Imaginea 3 din 4
Imaginea 4 din 4
Shazam folosește o tehnologie proprie dezvoltată de Avery Lin-Chun Wang, cofondatorul aplicației și științific șef de date, pentru a identifica potrivirile pentru melodiile interogate pe platforma sa. Tehnologia creează amprente digitale pentru înregistrări audio, care este sosul secret din spatele competențelor minunate de recunoaștere ale lui Shazam.
Shazam creează și stochează amprente audio constând din colecții de date numerice pentru fiecare peste 15 miliarde de melodii. Când un utilizator „Shazams” o melodie, Shazam creează rapid o amprentă audio a sunetului primit de la smartphone-ul sau microfonul PC-ului.
Odată ce ați terminat crearea amprentei audio pentru înregistrare, Shazam încarcă amprenta audio (nu audio) pe serverul său, unde efectuează o căutare în baza de date pentru potriviri. Dacă se găsește o potrivire, aceasta returnează informațiile despre melodie cu opțiuni de unde să le transmiteți sau să le cumpărați, împreună cu informațiile de identificare.
Ce este o amprentă audio?
O amprentă audio este un rezumat digital condensat al semnalelor audio. Acestea sunt utilizate pentru a identifica un eșantion audio sau pentru a localiza articole similare într-o bază de date audio.
Tehnologia de amprentă audio a lui Shazam poate potrivi piese de conținut audio neetichetate cu potrivirile corespunzătoare din baza sa de date audio. Shazam identifică titlul melodiei pe care ați înregistrat-o (un conținut audio neetichetat) prin potrivirea amprentei melodiei cu amprenta melodiilor din baza sa de date.
Shazam creează amprente unice pentru melodii în baza sa de date, utilizând anumite puncte de date identificate cu ajutorul unei spectrograme.
Ce este o spectrogramă?
O spectrogramă este un grafic tridimensional folosit ca reprezentare a sunetului. Spectrograma arată schimbarea frecvențelor pe o perioadă, luând în considerare și amplitudinea sau volumul. Fotografia de mai jos este un exemplu de citire a spectrogramelor.
Într-un interviu din 2003 cu American științific, Avery Wang a dezvăluit că algoritmul Shazam folosește puncte de spectrogramă reprezentând note cu cea mai mare energie pentru a genera amprente audio.
Ignorând majoritatea informațiilor dintr-o melodie și concentrându-se doar pe cele câteva note definitorii, Shazam își poate căuta baza de date și poate oferi potriviri exacte pentru interogările melodiilor la o viteză incredibilă.
Cum poate Shazam să identifice melodiile în locuri zgomotoase?
Shazam folosește înregistrări de melodii fără zgomot de fond și distorsiuni pentru a crea amprente digitale pentru baza sa de date. Când înregistrați o melodie cu aplicația într-un loc zgomotos, aceasta creează o amprentă audio a înregistrării dvs. prin identificarea notelor cu cea mai mare energie din înregistrare.
Apoi își caută în baza de date o potrivire pentru amprentele audio ale înregistrării dvs., cu condiția ca nivelul de zgomot de fundal nu a fost suficient de mare pentru a distorsiona datele utilizate pentru a crea sunetul amprenta.
Momente în care Shazam nu te poate ajuta să identifici o melodie
Shazam este excelent la potrivirea melodiilor, chiar și la muzica obscură pe care credeți că s-ar putea să nu o aibă în baza sa de date. Dar există momente în care Shazam nu poate identifica o piesă?
Înregistrare distorsionată
Atunci când Shazam o melodie într-un loc în care nivelul de zgomot de fundal este prea mare, zgomotul distorsionează datele din spectrogramă. Din acest motiv, amprenta audio a înregistrării dvs. va fi diferită de cea a melodiei originale.
Când se întâmplă acest lucru, Shazam returnează Cântecul nu este cunoscut dialog deoarece nu poate găsi o potrivire pentru amprenta audio.
Muzica live
Shazam nu are capacitatea sa de a identifica muzica din spectacole live. Acest lucru se datorează faptului că sunetul pe care îl înregistrați în spectacole live diferă adesea de versiunea originală a melodiei pe care Shazam o folosește pentru a crea amprente audio.
Singurul mod în care Shazam poate identifica o melodie în timpul unui spectacol live este dacă formația este suficient de pricepută pentru a interpreta melodia exact așa cum a fost înregistrată. Noroc cu trupa care încearcă să facă asta...
Înregistrarea dvs. vocală
„Aș putea să-l fac pe Shazam să recunoască o melodie pe care o cântam dacă aș fi un cântăreț foarte bun?”
Pe scurt, nu.
Algoritmul Shazam poate identifica doar muzica preînregistrată. Pentru ca Shazam să identifice o melodie pe care o cânți, ar trebui să ai aceeași voce cu instrumentalele la tempo-ul exact cu înregistrarea originală a melodiei.
Bâzâitul tău
Shazam nu poate identifica potrivirile pentru sunete, deoarece algoritmul său folosește frecvențe și amplitudini exacte pentru a crea amprente audio pentru melodiile din baza sa de date.
Când fredonați o melodie, Shazam creează o amprentă digitală pentru aceasta. Dar, deoarece un zumzet este doar o încercare de a resinteza o melodie, algoritmul nu va corespunde înregistrării.
Shazam este singura aplicație de identificare a muzicii?
Shazam a fost primul serviciu de identificare a muzicii și este în prezent cea mai folosită aplicație de identificare a melodiilor. Cu toate acestea, există alte aplicații pe care le puteți utiliza pentru a identifica o melodie jucându-te în jurul tău. Unii pot identifica chiar o melodie pe care o cânți sau o fredonează.
Trei dintre cele mai populare alternative Shazam sunt SoundHound, Versurile Musixmatch și Genius. Musixmatch și Genius vă ajută în primul rând să identificați versurile pentru muzica care se joacă în jurul vostru, în timp ce SoundHound este cel mai apropiat concurent al lui Shazam.
Legate de: Cele mai bune aplicații de recunoaștere a muzicii pentru a găsi melodii după melodia lor
Puteți utiliza aplicația SoundHound pentru a face cam tot ce face Shazam. Avantajul său major față de Shazam este că are funcționalitatea adăugată de a identifica melodiile pe care le cânți sau le fredonezi.
Credit de imagine: Sulastri Sulastri / Shutterstock.com
Vă întrebați cum să identificați o melodie dintr-un videoclip YouTube? Iată un ghid de căutare a melodiilor YouTube pentru a identifica muzica din videoclipuri.
Citiți în continuare
- Tehnologie explicată
- Shazam
- Descoperirea muzicii
- SoundHound
- Musixmatch
John este un iubitor de tehnologie prin naștere, un creator de conținut digital prin instruire și un stil de viață tehnic scriitor de profesie. John crede în a ajuta oamenii să rezolve problemele și scrie articole care fac exact asta.
Aboneaza-te la newsletter-ul nostru
Alăturați-vă newsletterului pentru sfaturi tehnice, recenzii, cărți electronice gratuite și oferte exclusive!
Încă un pas…!
Vă rugăm să confirmați adresa de e-mail în e-mailul pe care tocmai vi l-am trimis.