Meta Umumkan EnCodec, Kompresi Audio AI Yang 10X Lebih Kecil Dari MP3

Minggu, 06 November 2022 | 17:50
Freepik

Ilustrasi wanita mendengarkan audio musik

Nextren.com - Meta baru saja mengumumkan sebuah teknologi kompresi audio baru yang disebut dengan EnCodec.

Teknologi ini diklaim mampu membuta kompresi suara 10 kali lebih kecil dibandingkan dengan format file MP3.

Dilansir dari TechGoing, kabar ini hadir dari laporan FAIR (Fundamental Artificial Intelligence Research) yang merupakan lembaga penelitian milik Meta. (6/11/22)

FAIRmelaporkan kesuksesan lembaga dalam penemuan kompresi hiper audio yang dijalankan oleh kecerdasan buatan (AI).

Mereka mampu membangun sistem yang melatih AI secaraend-to-end untuk mengompresi data audio ke ukuran file tertentu.

Data tersebut dapat diterjemahkan (decoded) melalui neural network atau jaringan syaraf pada otak machine learning.

Sebagai teknologi baru dari Meta, EnCodec di gadang-gadang dapat menjadi teknologi audio lawas seperti MP3.

Seperti pada gambar di bawah ini, teknologi ini diklaim mampu mencapai rasio frekuensi mencapai 10 kali lebih kecil dibandingan MP3 dengan kecepatan 64 kb/s.

Meta
Meta

Kemampuan konversi EnCodec yang 10X lebih kecil dibanding MP3

Meta mengatakan bahwa teknologi ini dapat secara dramatis meningkatkan kualitas suara melalui koneksi bandwidh rendah.

Karenanya akan sangat membantu untuk melakukan panggilan suara dengan kualitas sinyal yang jelek sekalipun.

Kemampuan ini dianggap mampu menghemat ruang penyimpanan, namun tetap menjaga kualitas dari file suara.

Dalam melakukannya, Meta menjelaskan setidaknya ada tiga komponen penting pada EnCodec yang menunjang kulitas kompresinya:

Meta
Meta

Tiga komponen Encodec yakni Encoder, Quantizer, dan Decoder

1. Encoder: Encoder dapat mengambil data yang tidak terkompresi dan megubahnya menjadi representasi frame yang lebih tinggi maupun rendah.

2. Quantizer: Bagian ini sangat penting karena berfungsi memampatkan representasi suara ke ukuran target dan merekonstruksi sinyal asli dengan melatihquantizer.

Hal tersebut dilakukan untuk memberikan ukuran yang diinginkan sembari menyimpan informasi penting di dalamnya.

Representrasi file yang terkompresi tersebut akan dikirim melaui jaringan maupun penyimpanan fisik seperti disk.

3. Decoder: komponen ini berfungsi untuk mengubah data terkompresi menjadi audio secara real-time menggunakan jaringan saraf pada satu CPU.

EnCodec meggunakan Diskriminator yang dapatmembedakan antara sampel nyata dan yang direkonstruksi.

Hal itu menjadi kunci untuk memampatkan audio sebanyak mungkin tanpa adanya kendala saat kehilangan sinyal.

Sayangnya, untuk sekarang teknologiEnCodec dari Meta ini masih dalam tahap penelitian loh sobat.

Namun,hal ini menjadi tanda bahwa di masa depan audio yangberkualitas tinggi mampu tersedia meski dengan bandwidth sedikit.

Hal ini tentunya sangat berguna untuk penikmat musik maupun video streaming di Indonesia.

Mereka masih bisa mendapatkan kualitas suara streaming yang tinggi meski dengan jaringan yang sangat buruk.

Nah, itulah informasi seputar teknologi EnCodec dari Meta sobat Nextren sekalian.

Buat kalian yang penasaran dengan berita seputar teknologi dan tren lainnya, pantengin terus Nextren.com ya!

(*)

Editor : Wahyu Subyanto

Sumber : TechGoing

Baca Lainnya