Halo kawan dekat TanyaTekno, ketemu kembali kita di artikel ini. Di artikel ini saya akan mengulas Codec audio Meta AI mengklaim tingkat kompresi 10 kali dibandingkan dengan file MP3
tl; DR: Encodec adalah codec audio generasi berikutnya yang didasarkan pada desain jaringan saraf yang kompleks, sebuah sistem yang dapat memampatkan banyak jus audio ke dalam ruang penyimpanan minimal. Codec ini bekerja dengan pengalaman Metaverse dan meningkatkan panggilan telepon seluler.
Dengan efisiensi tinggi dan dukungan terintegrasi melalui produk populer seperti pemutar Winamp yang selalu ada, codec MP3 menjadi standar de-facto untuk berbagi file audio online selama tahun 1990-an dan seterusnya. Sekarang, codec baru ingin membuat sejarah lagi dengan menawarkan keuntungan yang lebih ekstrim dalam efisiensi dan penghematan bandwidth. Rahasianya adalah algoritme kecerdasan buatan yang mampu “mengompresi berlebihan” aliran audio.
Peneliti meta membayangkan konsep Encodec sebagai solusi potensial untuk mendukung pengalaman berkualitas tinggi “saat ini dan masa depan” di metaverse. Teknologi baru adalah jaringan saraf yang dilatih untuk “menembus batas dari apa yang mungkin” dalam kompresi audio untuk aplikasi online. Sistem dapat mencapai “perkiraan rasio kompresi 10x” dibandingkan dengan standar MP3.
Meta melatih AI “end-to-end” untuk mencapai volume target tertentu setelah menekan. Encodec dapat memampatkan aliran data MP3 64 kbps menjadi 6 kbps, yang berarti hanya membutuhkan 6.144 byte (ya, byte) untuk mempertahankan kualitas asli yang sama. Para peneliti mengatakan codec dapat memampatkan sampel audio stereo 48kHz untuk berbicara – sebuah industri pertama.
Pendekatan berbasis AI dapat “memampatkan dan mendekompresi audio secara real-time untuk perampingan yang canggih,” dengan hasil yang berpotensi mengejutkan, seperti yang ditunjukkan dalam sampel yang dibagikan di blog Meta AI. Codec klasik seperti MP3, Opus atau EVS memecahkan kode sinyal antara frekuensi yang berbeda dan mengkodekannya seefisien mungkin untuk memanfaatkan psikoakustik (studi tentang persepsi vokal manusia). Metode encoder didasarkan pada desain kompleks yang terdiri dari tiga bagian: encoder, quantizer, dan decoder.
Encoder mengambil data yang tidak terkompresi dan mengubahnya menjadi representasi dengan dimensi yang lebih tinggi dan frekuensi gambar yang lebih rendah. Quantifier memampatkan aliran ini ke volume target sambil mempertahankan informasi yang paling penting untuk merekonstruksi sinyal asli. Akhirnya, decoder mengubah sinyal terkompresi menjadi bentuk gelombang yang “mirip mungkin dengan aslinya”.
Model pembelajaran mesin Encodec mengidentifikasi perubahan vokal yang tidak terlihat oleh manusia, menggunakan alat diskriminasi untuk meningkatkan kualitas yang dirasakan dari suara yang dihasilkan. Meta menggambarkan proses ini sebagai “permainan kucing-dan-tikus”, membedakan antara sampel asli dan sampel yang direkonstruksi. Hasil akhirnya adalah kompresi suara ucapan yang unggul pada bit rate rendah (1,5 kbps hingga 12 kbps).
Encodec dapat menyandikan dan mendekode data audio secara real time pada satu inti CPU, kata Meta, dan masih menawarkan beberapa area peningkatan untuk ukuran file yang lebih kecil. Dikombinasikan dengan mendukung pengalaman generasi berikutnya Metaverse pada koneksi Internet yang ada, model baru ini dapat memastikan panggilan telepon berkualitas tinggi di area di mana jangkauan seluler optimal.
Demikianlah uraiantentang Codec audio Meta AI mengklaim tingkat kompresi 10 kali dibandingkan dengan file MP3
. Jangan Lupa untuk
share artikel ini ya sobat.