OpenAI Umumkan Model AI Text to Video, Sora

Eveline

OpenAI, organisasi di balik ChatGPT baru saja meluncurkan Sora, sebuah model AI revolusioner yang dapat membuat video realistis dan imajinatif dari instruksi teks. Sora merupakan model difusi yang dapat menghasilkan video dengan berbagai ukuran dan bentuk, serta memodifikasi video yang ada dengan mengubah lingkungan, pencahayaan, dan sudut kamera berdasarkan masukan pengguna. Sora juga dapat membuat video dari satu gambar atau melanjutkan video yang ada dengan menambahkan lebih banyak frame.

Sora mampu menghasilkan konten video Full HD berkualitas tinggi hingga 60 detik yang sesuai dengan perintah pengguna. Video yang dihasilkan Sora juga sangat mengesankan dan beragam, mulai dari lanskap alam hingga adegan animasi.

Sora dapat menangani perintah kompleks yang melibatkan banyak karakter, gerakan tertentu, dan deskripsi detail tentang adegan dan objek. Model ini tidak hanya mengikuti instruksi pengguna, tetapi juga menyimpulkan bagaimana elemen-elemen dalam perintah berinteraksi satu sama lain dan dengan dunia fisik.

Sora menggunakan arsitektur transformer yang mirip dengan ChatGPT, di mana video dan gambar direpresentasikan sebagai potongan data yang lebih kecil yang disebut patch. Sora menghasilkan video dengan mulai dari noise acak dan secara bertahap menyempurnakannya hingga membentuk output akhir.

OpenAI menerapkan protokol keamanan yang ada yang digunakan dalam DALL·E untuk memastikan bahwa Sora selaras dengan prinsip-prinsip etis dan nilai-nilai sosialnya. Sora saat ini sedang menjalani pengujian ketat oleh “tim merah” dari para ahli yang akan mengevaluasi model untuk potensi risiko dan kerentanan model tersebut sebelum rilis resminya.

OpenAI juga akan berinteraksi dengan otoritas kebijakan, seniman, dan pendidik untuk membahas kemungkinan implikasi dan aplikasi Sora. Sayangnya untuk saat ini OpenAI masih belum mengumumkan tanggal peluncuran resmi untuk Sora.