BRIN Gandeng Singapura Kembangkan AI Berbahasa Indonesia
Foto: Penandatanganan Kerjasama LLM Bahasa Indonesia
Uzone.id – Saat ini, teknologi kecerdasan buatan (AI) dalam bentuk LLM (Large Language Model) seperti chatbot ChatGPT dan Bard masih terfokus pada bahasa Inggris.
Alhasil, bahasa-bahasa non-Inggris seperti Bahasa Indonesia tidak optimal dan tidak terlalu informatif ketika harus menjawab pertanyaan dalam bahasa non-Inggris.Darius Liu, Kepala Strategi, Kemitraan dan Pertumbuhan dari AI Singapore mengatakan kalau semakin jauh seseorang dari budaya Amerika Serikat, maka semakin kecil pula platform seperti ChatGPT kemungkinan berperilaku seperti manusia.
“Semakin jauh Anda secara budaya dari AS, semakin kecil kemungkinan ChatGPT berperilaku seperti manusia di wilayah tersebut,” ujarnya dalam acara Konferensi Pers, Kamis, (30/11).
Saat ini sebanyak 59,1 persen bahasa dalam Large Language Model (LLM) diketahui adalah Bahasa Inggris, dilanjutkan dengan Bahasa China/Inggris, (27,3 persen), Bahasa Arab/Inggris (4,5 persen) dan Bahasa Jepang/Inggris, dan Multilingual (4,5 persen).
Melihat adanya gap dalam penggunaan-penggunaan model bahasa ini, Badan Riset dan Inovasi (BRIN), Korika (Kolaborasi Riset dan Inovasi Kecerdasan Buatan), startup Glair.ai dan Datasaur.ai menggandeng AI Singapore (AISG) untuk mengembangkan Large Language Model (LLM) Bahasa Indonesia yang nantinya bisa dimanfaatkan oleh berbagai keperluan di berbagai platform.
Pengembangan Model Bahasa (LLM) ini hadir melalui platform SEA-LION, yang mana program ini dibuat oleh AI Singapore. SEA-LION sendiri merupakan sebuah produk model bahasa yang dilatih secara khusus untuk pengguna di Asia Tenggara.
Sesuai dengan tujuannya, model bahasa ini dapat mengerti dengan baik bahasa-bahasa di Asia Tenggara seperti Bahasa Indonesia, Bahasa Thailand, Bahasa Tagalog dan bahasa lainnya.
Model bahasa tersebut diklaim bisa memberikan jawaban yang lebih baik dan lebih ‘manusia’ ketika diterapkan di platform-platform khusus seperti platform interaktif di Indonesia. SEA-LION juga telah melalui masa uji coba beberapa kali dengan membandingkan model bahasa mereka dengan GPT-4 dari OpenAI dan Llama 2 milik Meta.
Hasilnya, SEA-LION memberikan respon dan jawaban yang lebih baik ketika diberi pertanyaan menggunakan Bahasa Indonesia dibandingkan dengan jawaban dari GPT-4 dan Llama 2.
Nantinya, LLM berbahasa Indonesia bisa diterapkan di perusahaan-perusahaan, pemerintahan, kementerian, dan lembaga publik lain untuk memberikan informasi khusus sesuai dengan topik yang tersedia.
Berbeda dengan ChatGPT dan Bard yang merupakan chatbot AI dengan general purposes berisi data dan model bahasa yang sangat luas, model bahasa menggunakan SEA-LION ini hadir dengan data yang lebih spesifik dan fokus ke dalam satu topik sehingga memberikan jawaban yang lebih spesifik juga.
“Salah satu contohnya seperti customer support services untuk Kominfo, ketika kita ingin bertanya mengenai regulasi misalnya, karena LLM ini fokus dan bahasanya khusus dibuat menggunakan Bahasa Indonesia, maka jawabannya akan lebih baik dan specialized daripada ChatGPT,” kata On Lee, CTO dari GDP Venture.
Pengembangan Large Language Model ini akan memberikan dampak yang cukup signifikan untuk berbagai sektor, termasuk membantu meningkatkan kualitas bisnis, inovasi hingga pemanfaatan SDM menggunakan teknologi AI.
Dr. Esa Prakasa, M.T., Kepala Pusat Riset Sains Data dan Informasi, Organisasi Riset Elektronika dan Informatika, BRIN mengatakan kalau LLM dalam Bahasa Indonesia ini nantinya bisa meningkatkan penyediaan layanan publik, penelitian, aksesibilitas pada publik, mendukung teknologi dan meningkatkan SDM.
“Tidak hanya bermanfaat untuk publik, tetapi dengan mengadopsi LLM Bahasa Indonesia juga dapat membantu pemerintah Indonesia dalam meningkatkan kualitas komunikasi ke masyarakat, meningkatkan penyediaan layanan publik, mendorong penelitian dan pengembangan, serta berpeluang memberikan berkontribusi positif pada pertumbuhan ekonomi nasional,” ujarnya.