Google și-a lansat codul sursă beta codec audio Lyra pe GitHub, punând la dispoziția tuturor dezvoltatorilor o procesare audio cu o rată de biți redusă de calitate incredibilă. Codecul este cel mai util în situații încorporate și cu lățime de bandă restricționată în care trebuie salvate cât mai multe date.
Lyra: Aproape nimic nu a sunat niciodată atât de bine
Codecul audio funcționează pe principiul furnizării celui mai natural sunet cu cea mai mică rată de date posibilă. Acesta reușește să creeze niveluri aproape stranii de reproducere audio cu rate de biți de până la 3 kbps. Google folosește compresia Lyra în timp real deja în aplicația sa Duo, deși nu ți-ar fi reproșat că nici măcar nu ai realizat o diferență față de sunetul lățimii de bandă obișnuite.
Pentru a demonstra cât de mult Lyra este mai bun decât alte codecuri, Google oferă exemple prin intermediul unui postare pe blog comparând codecul de compresie condus de Machine Learning cu alte alternative de 3 și 6 kbps.
Este o diferență de noapte pe zi, iar oferirea dezvoltatorilor din întreaga lume de aceste instrumente va fi un factor semnificativ în îmbunătățirea calității comunicării acolo unde lățimea de bandă este redusă. Este, de asemenea, un motivator excelent pentru dezvoltatorii care doresc să creeze aplicații noi pe piețele emergente, lucru pe care Google este sigur că îl va acoperi în acest an
conferință online gratuită virtuală I / O Google.Codul sursă beta este în prezent proiectat având în vedere dispozitivele Arm pe 64 de biți, deși exemplele vor rula și pe sistemele Linux x86 pe 64 de biți. Codul sursă este furnizat complet documentat, deși este în versiune beta, iar pagina GitHub oferă instrucțiuni de instalare și cum se poate construi Lyra pe Linux pentru ținte Arm pe 64 de biți.
Pentru a obține codul sursă Lyra beta, mergeți la Pagina Lyra GitHub.
Cum funcționează Lyra?
În timp ce procesul real pe care îl folosește Lyra este o combinație incredibil de complexă de modele de învățare automată instruite mii de ore de date vocale și optimizări ale tehnologiei codec audio existente, teoria este destul de simplu.
La fiecare 40 ms, funcțiile sunt preluate din vorbire și comprimate până la 3 kbps. Aceste caracteristici reprezintă puncte de energie a vorbirii din spectrul de frecvențe cel mai apropiat de răspunsul vorbirii auditive umane - lucrurile pe care trebuie să le recunoaștem și să le înțelegem atunci când cineva vorbește.
Partea cheie a ceea ce face Lyra specială este modul în care folosește aceste informații:
Cu toate acestea, codecurile parametrice tradiționale, care pur și simplu extrag din vorbire parametrii critici care pot fi apoi folosit pentru a recrea semnalul la capătul de recepție, pentru a obține rate de biți reduse, dar adesea sună robotic și nefiresc. Aceste neajunsuri au condus la dezvoltarea unei noi generații de modele generative audio de înaltă calitate a revoluționat câmpul, putând nu numai să facă diferența între semnale, ci și să genereze complet noi cele.
După transmisie, Lyra reconstruiește forma de undă completând ceea ce lipsește folosind acest proces, în timp ce într-un fel nu este prea complex din punct de vedere al calculului.
Pe de o parte, este o minune tehnologică care va rula aproape oriunde. Pe de altă parte, încă nu sunt 100% convins că nu este vrăjitorie.
Google Duo este una dintre cele mai bune aplicații de apeluri video de acolo. Are o mulțime de caracteristici și iată cele pe care credem că ar trebui să le folosiți cu adevărat.
Citiți în continuare
- Știri tehnice
- Android
- Învățare automată
Ian Buckley este un jurnalist independent, muzician, interpret și producător video care locuiește în Berlin, Germania. Când nu scrie sau pe scenă, se ocupă de electronice sau coduri DIY în speranța de a deveni un om de știință nebun.
Aboneaza-te la newsletter-ul nostru
Alăturați-vă newsletterului pentru sfaturi tehnice, recenzii, cărți electronice gratuite și oferte exclusive!
Încă un pas…!
Vă rugăm să confirmați adresa de e-mail în e-mailul pe care tocmai vi l-am trimis.