Google telah memperkenalkan model kecerdasan buatan generatif lainnya yang dapat membuat sejumlah tak terbatas permainan video platformer 2D. Genie dipromosikan sebagai model dunia yang dapat dikontrol tindakan yang dilatih pada data permainan video tanpa supervisi. Ini menggunakan analisis prediktif untuk menghasilkan level permainan video dan juga dapat mengendalikan karakter yang dapat dimainkan serta menentukan gerakannya. Menariknya, OpenAI juga memperkenalkan model dunia baru pada awal bulan ini bernama Sora, yang dapat menghasilkan video hiper realistik hingga satu menit lamanya.
Pengumuman tersebut dibuat oleh Tim Rocktäschel, Kepala Tim Keterbukaan, Google DeepMind, melalui serangkaian posting di X. Dia mengatakan, “Kami memperkenalkan Genie, model dunia dasar yang dilatih secara eksklusif dari video internet yang dapat menghasilkan berbagai dunia 2D yang dapat dikendalikan tindakan dengan memberikan rangsangan gambar.” Genie unik dalam aspek bahwa ia hanya dapat menghasilkan satu hal tertentu, dan juga merupakan satu-satunya model yang menghasilkan permainan video yang telah diumumkan secara publik sejauh ini.
Model AI Genie Google belum tersedia untuk publik dan hanya ada sebagai model penelitian untuk saat ini. Inilah mengapa fungsionalitas yang berorientasi pada pengguna belum diketahui. Ini dapat menghasilkan level permainan video menggunakan gambar, tetapi apakah itu dapat menerima rangsangan teks atau bahkan video belum diketahui. Model AI dilatih tanpa supervisi pada 2,00,000 jam rekaman permainan video dan berisi 11 miliar parameter. Arsitektur model menggunakan tiga bagian berbeda, tokenizer video spasial temporal, model dinamika autoregresif, dan model aksi laten sederhana dan dapat diskalakan.
Menyoroti hal ini, dia menambahkan, “Model Genie bersifat umum dan tidak terbatas pada 2D. Kami juga melatih Genie pada data robotika (RT-1) tanpa tindakan, dan menunjukkan bahwa kami dapat mempelajari simulator yang dapat dikendalikan tindakan di sana juga. Kami pikir ini adalah langkah yang menjanjikan menuju model dunia umum untuk Kecerdasan Buatan Umum.”