Google DeepMind kembali menghadirkan terobosan di dunia kecerdasan buatan dengan merilis Genie 3, generasi terbaru dari sistem world model yang mampu menciptakan dan memodifikasi dunia simulasi secara dinamis. Sebelumnya, pada Desember lalu, DeepMind merilis Genie 2 yang mampu membangun dunia 3D dengan konsistensi lingkungan yang lebih baik. Kini, Genie 3 hadir dengan peningkatan signifikan untuk melatih AI agar lebih cerdas dan responsif dalam berbagai skenario.
Salah satu peningkatan besar pada Genie 3 adalah kemampuan menghasilkan visual 720p, naik dari 360p pada versi sebelumnya, serta mempertahankan simulasi yang konsisten selama beberapa menit sebelum muncul artifact. Bandingkan dengan Genie 2 yang secara teoritis mampu bertahan 60 detik, namun sering “menghalusinasi” lebih cepat. Selain itu, fitur baru bernama promptable world events memungkinkan pengguna mengubah keadaan dunia simulasi secara langsung hanya dengan perintah teks. Dalam salah satu demo, Genie 3 dapat menambahkan sekawanan rusa ke adegan pemain ski di pegunungan, meski animasinya belum sempurna, fitur ini menjadi nilai jual utama.
Keunggulan lainnya adalah interaksi real-time. Jika di Genie 2 perintah gerakan membutuhkan jeda untuk memproses frame berikutnya, kini Genie 3 merespons seketika, menciptakan pengalaman simulasi yang lebih realistis dan dinamis. DeepMind melihat teknologi ini sebagai alat penting untuk melatih AI menghadapi skenario “bagaimana jika” yang tidak tercakup dalam pre-training. Misalnya, Genie 3 dapat digunakan untuk melatih mobil otonom menghindari pejalan kaki secara aman.
Meski demikian, DeepMind mengakui masih banyak pekerjaan yang harus dilakukan. Genie 3 belum mampu mereplikasi lokasi dunia nyata dengan presisi sempurna, masih kesulitan merender teks, dan belum bisa mempertahankan dunia simulasi selama berjam-jam. Namun, laboratorium ini yakin bahwa Genie 3 sudah cukup matang untuk memberikan dampak nyata di dunia AI dan akan semakin bermanfaat seiring perkembangan model berikutnya.
Untuk saat ini, Genie 3 belum dirilis untuk publik, namun DeepMind tengah membuka akses bagi lebih banyak penguji sebelum rilis yang lebih luas di masa depan.