AI Meta Ini Bisa Terjemahkan Teks hingga Suara ke 100 Bahasa
Uzone.id – Meta kembali meluncurkan produk terbaru mereka setelah merilis Threads, kali ini Mark Zuckerberg memperkenalkan model kecerdasan buatan atau AI mereka bernama SeamlessM4T.
Model AI ini diklaim bisa menerjemahkan dan juga mentranskrip hampir 100 bahasa, baik itu dari teks maupun ucapan pengguna.Meta juga mengklaim kalau SeamlessM4T ini memberikan terobosan signifikan untuk model bahasa speech-to-speech and speech-to-text yang didukung oleh AI.
“Model tunggal ini menyediakan terjemahan sesuai permintaan, memungkinkan untuk berkomunikasi dengan lebih efektif dalam bahasa yang berbeda,” tulis Meta dalam postingan blog, dikutip dari Techcrunch.
Tidak hanya menerjemahkan teks saja, seperti klaimnya, alat penerjemah ini bisa digunakan utnuk menerjemahkan esai, pidato hingga obrolan sehari-hari dengan lawan bicara dengan metode dari teks ke teks (text to text), suara ke suara (speech to speech), atau suara ke teks (speech to text).
Model AI ini dibangun menggunakan Massively Multilingual Speech, sebuah framework Meta yang menyediakan teknologi pengenalan ucapan, identifikasi bahasa, dan sintesis ucapan di lebih dari 1.100 bahasa.
Selain itu, Meta juga mengumpulkan puluhan miliaran teks (kalimat) dan 4 miliar jam suara yang tersebar di internet untuk untuk mengembangkan tool penerjemah ini.
Suara dan kalimat ini diklaim Meta tidak memiliki hak cipta dan sebagian besar berasal dari sumber terbuka atau sumber yang berlisensi.
Dengan sumber data ini, peneliti Meta menyelaraskan 443 ribu jam ucapan suara dengan teks dan menciptakan 29 ribu jam deretan data ‘text-to-speech’ yang kemudian akan mengajarkan SeamlessM4T untuk menyalin teks, menerjemahkan teks, membuat audio, dan menerjemahkan kata yang diucapkan oleh pengguna.
Perusahaan Mark Zuckerberg ini juga mengklaim kalau SeamlessM4T bekerja dengan lebih baik ketika ada kebisingan di latar belakang saat digunakan untuk menerjemahkan audio ke teks.
“Dengan hasil yang canggih, kami percaya SeamlessM4T adalah terobosan penting dalam upaya komunitas AI menuju penciptaan sistem multitask universal,” tulis Meta.
Meta sendiri bukan satu-satunya yang mencoba untuk membuat model bahasa yang mampu mempermudah percakapan antar bahasa, Google dan Mozilla pun berencana untuk menciptakan model bahasa lain untuk mempertahankan posisi mereka sebagai salah satu raksasa teknologi dunia.
Google dikabarkan sedang mengembangkan Universal Speech Model yang nantinya bisa memahami 1000 bahasa yang paling banyak digunakan di dunia. Sementara Mozilla sedang mengembangkan Common Voice yang nantinya bisa memudahkan pengguna untuk mengenali suara multi bahasa.