Luma AI meluncurkan model kecerdasan buatan (AI) generasi video dari teks, Dream Machine, secara global. Platform ini mampu menghasilkan video berdurasi hingga lima detik dari prompt teks sederhana atau deskriptif. Model AI ini dapat menghasilkan video dalam berbagai gaya seperti sinematik, animasi, realistis, dan lainnya. Perusahaan AI tersebut mengklaim bahwa Dream Machine dilatih sepenuhnya menggunakan video, dan mampu menghasilkan video dengan pengambilan gambar yang secara fisik akurat, konsisten, dan penuh peristiwa. Platform ini saat ini dapat diakses dan digunakan secara gratis, tetapi kemungkinan akan memiliki batasan generasi harian.
Menurut situs webnya, model AI Dream Machine dibangun berdasarkan model transformer dan dilatih langsung dengan video. Biasanya, model bahasa besar (LLM) dilatih dengan teks dan gambar sebelum dialihkan ke video, karena membutuhkan pemahaman ruang dan gerak yang lebih dalam. “Dream Machine adalah langkah pertama kami menuju pembangunan mesin imajinasi universal,” tambah perusahaan tersebut.
Dream Machine bergabung dengan platform generasi video lainnya seperti Runway AI dan Pika 1.0 yang juga tersedia di domain publik dan menawarkan generasi video antara tiga hingga lima detik.
Platform AI ini membutuhkan waktu 120 detik untuk menghasilkan video yang menurut perusahaan akan memiliki 120 frame berbeda. Dream Machine juga dikatakan memahami bagaimana manusia, hewan, dan objek berinteraksi dengan dunia fisik dan menciptakan video dengan fisika yang akurat dan konsistensi karakter.
Namun, Luma AI juga menyoroti beberapa keterbatasan dalam mode saat ini seperti pergerakan, teks, morfing, dan masalah Janus yang terkenal, di mana alih-alih menampilkan output 3D yang konsisten, model AI ini menampilkan beberapa tampilan kanonik objek dalam arah yang berbeda.
Untuk mencoba platform ini, penggemar dapat mengunjungi situs webnya dan mengklik tombol ‘Coba Sekarang’. Pengguna harus mendaftar ke platform ini sebelum dapat menghasilkan video.