Nvidia Ketahuan Latih AI Pakai Jutaan Video dari YouTube dan Netlfix
Uzone.id - Nvidia ketahuan mengambil jutaan video secara online dari YouTube, Netflix, dan sumber-sumber lainnya untuk melatih model AI komersial mereka. Kabar ini diduga berasal dari mantan karyawan Nvidia yang membagikan informasi tersebut kepada 404 Media.
Sumber mengatakan, jutaan video tersebut tidak hanya ditujukan untuk penelitian saja, tapi juga digunakan untuk melatih model AI Nvidia, seperti generator dunia Omniverse 3D, sistem mobil self-driving, dan generator avatar Digital Humans.Dalam laporannya, 404 Media mengatakan bahwa Nvidia memerintahkan beberapa karyawannya untuk mengunduh banyak video untuk melatih model AI. Meski dikhawatirkan telah melanggar legalitas dan etika atas tindakan tersebut, Nvidia berkilah kalau metode pelatihan AI-nya sudah sesuai dengan isi dan hukum hak cipta.
“Kami menghormati hak-hak semua pembuat konten dan yakin bahwa model kami dan upaya penelitian kami sepenuhnya sesuai dengan isi dan semangat hukum hak cipta," kata juru bicara Nvidia.
“Hukum hak cipta melindungi ekspresi tertentu, tetapi tidak melindungi fakta, ide, data, atau informasi. Siapapun bebas mempelajari fakta, ide, data, atau informasi dari sumber lain dan menggunakannya untuk membuat ekspresi mereka sendiri. Penggunaan yang adil juga melindungi kemampuan untuk menggunakan sebuah ciptaan untuk tujuan transformatif, seperti pelatihan model," jelas sang juru bicara, seperti dikutip Uzone.id.
Cara Nvidia memang bukan kali pertama terjadi pada perusahaan teknologi yang bergerak di bidang AI. Dikutip dari Tom’s Hardware, sebelumnya ada OpenAI, Stability AI, Midjourney, DeviantArt, dan Runway yang sempat dituding mengambil konten secara online tanpa izin untuk melatih model AI-nya. Tampaknya, Nvidia ingin menciptakan model AI mendasar yang dapat dikembangkan lebih lanjut oleh perusahaan lain. Makanya, untuk membantu perusahaan terus bersaing di pasar AI yang kompetitif ini, Nvidia menggunakan database video online yang sangat besar untuk melatih sistem AI-nya.
Hal ini juga ditekankan oleh Ming-Yu Liu, VP of Research Nvidia. Menurutnya, keputusan untuk mendapatkan data dengan cara ini telah dibuat dan mendapatkan persetujuan di tingkat eksekutif perusahaan.
"Kami sedang menyelesaikan jalur data v1 dan mengamankan sumber daya komputasi yang diperlukan untuk membangun pabrik data video yang dapat menghasilkan pengalaman visual seumur hidup manusia yang setara dengan data pelatihan per hari," ucap Liu.
Masih dalam laporan 404 Media, proyek AI Nvidia yang dijuluki Cosmos itu dimulai pada Februari 2024. Dalam kurun waktu dua minggu, tim Nvidia telah mengunduh 100.000 video dan mengumpulkan lebih dari 38,5 juta URL video, dimana hampir 40 persen di antaranya berasal dari video sinematik.
Dokumen yang dibagikan juga mengungkap bahwa Nvidia melatih modelnya pada kumpulan data yang disebut HD-VG-130M yang berisi 130 juta video YouTube, dan secara eksplisit hanya untuk penelitian akademis.
Tidak jelas seberapa kompeks proyek Cosmos di Nvidia. CEO Nvidia, Jensen Huang telah memberikan tanggapannya dengan mengatakan, "Pembaruan yang hebat. Banyak perusahaan harus membangun video foundational models (FM). Kami dapat menawarkan jalur yang sepenuhnya dipercepat."