Google Pamer Kecanggihan Gemini AI, Tapi Kok Dihujat?
Foto: Google/Unsplash
Uzone.id – Google sudah memperkenalkan kemampuan model kecerdasan buatan terbaru mereka, Gemini AI dalam sebuah video demo berdurasi 6 menit pada 6 Desember 2023 lalu.
Dalam video tersebut, Google memamerkan berbagai kemampuan yang bisa dilakukan oleh Gemini AI, khususnya mengenali dan memahami informasi dari video dan gambar. Dalam salah satu demonya, Gemini AI mampu mengenali bentuk gambar yang dibuat oleh manusia, termasuk mengenali warna.Dalam demo Multimodal Dialogue misalnya, Gemini AI mampu mengenali garis yang dibentuk oleh manusia lalu hingga membentuk sebuah objek gambar.
“(Gambar tersebut) terlihat seperti burung. Burung yang sedang berenang di dalam air dan punya leher serta paruh yang panjang. Ini adalah bebek,” jawabnya. Selanjutnya, AI ini memberikan informasi lebih lanjut mengenai hewan tersebut.
Dalam demo lebih lanjut, Gemini AI memiliki kemampuan ‘Multilinguality’ dimana AI ini bisa berbicara dan mengerti perintah dalam berbagai bahasa yang ada.
Lebih interaktif, Gemini AI juga bisa memberikan ide game dari gambar yang mereka lihat. Dalam demo ini misalnya, Gemini AI bisa membuat ide permainan dari gambar peta. Selanjutnya, ketika manusia menjawab, teknologi ini akan memberikan keterangan benar/salah.
Tak sampai disana, model AI ini juga bisa menjawab trik-trik yang diputar oleh manusia dan bisa mengerti koneksi atau persamaan antara dua benda dan memberikan informasi mengenai kedua gambar ini. Kecanggihan lainnya, Gemini AI ini bisa menghasilkan gambar dan teks, bisa memberikan alasan dan informasi logis dari sebuah gambar/teks, menerjemahkan secara visual serta memahami budaya hanya dari video atau gambar.
Untuk mendapat kecanggihan-kecanggihan ini, Google kemudian akan menerapkan Gemini AI ke layanan Google seperti Bard, Gmail, Google Docs, Meet dan layanan Google lainnya.
Sayangnya, kecanggihan-kecanggihan yang dipamerkan Google dalam demo Gemini AI ini mendapat kritikan dari berbagai pihak bahkan Google dituduh telah berbohong soal demo ini.
Seorang kolumnis Bloomberg bernama Parmy Olson menyoroti beberapa bagian dari demo Google tersebut, dimana Gemini AI 'terlalu' mampu memahami gambar hewan bebek dengan cepat dan tanggap layaknya manusia.
Video ini memang menunjukkan kecanggihan Gemini AI yang smooth dan cepat, namun nyatanya Google menuliskan keterangan dalam video dimana mereka mengurangi latensi dan mempersingkat output yang dihasilkan Gemini AI agar lebih cepat.
Parmy Olson pun geram akan hal ini, ia menyebut kalau Google telah menyesatkan penonton karena telah mengedit video tersebut.
Melansir dari The Verge, Olson mengatakan Google telah mengakui demo video ini tidak terjadi secara real-time, melainkan menggunakan gambar dari rekaman mentah, dan kemudian menulis perintah teks yang kemudian ditanggapi oleh Gemini.
“Hal ini sangat berbeda dari apa yang ditampilkan oleh Google,” tulis Olson.
Olson menambahkan kalau ini bukan kali pertama Google melakukan hal tersebut, salah satunya adalah demo Duplex Google yang juga too good to be true.
Dalam kasus seperti ini, Olson menyebut Google sedang ‘berlagak’ untuk menyesatkan orang-orang dari fakta keras dimana Gemini masih tertinggal jauh dari model GPT punya OpenAI.
Namun, Google langsung mengeluarkan sanggahannya. Presiden peneliti DeepMind Google, Oriol Vinyals dalam sebuah postingan mengatakan kalau video tersebut nyata adanya.
“Semua perintah dan output dalam video tersebut nyata, hanya dipercepat agar lebih singkat,” katanya, dikutip dari The Verge, Jumat, (15/12).
Lalu, ia pun mengatakan, “video ini hanya mengilustrasikan seperti apa pengalaman pengguna multimode yang dibangun Gemini nantinya. Kami hanya ingin menginspirasi pengembang.”
Hm, jadi bagaimana menurut kalian?