SHARE
Cyber Life

Laboratorium kecerdasan buatan Google DeepMind sedang mengembangkan teknologi baru yang dapat menghasilkan soundtrack, bahkan dialog, untuk video. Tim DeepMind telah membagikan kemajuan mereka pada proyek teknologi video-ke-audio (V2A), yang dapat dipasangkan dengan Google Veo dan alat pembuatan video lainnya seperti Sora dari OpenAI. Dalam blognya, tim DeepMind menjelaskan bahwa sistem ini dapat memahami piksel mentah dan menggabungkan informasi tersebut dengan petunjuk teks untuk menciptakan efek suara sesuai dengan apa yang terjadi di layar. Perlu dicatat, alat ini juga dapat digunakan untuk membuat soundtrack untuk rekaman tradisional, seperti film bisu dan video lain tanpa suara.

Para peneliti DeepMind melatih teknologi ini pada video, audio, dan anotasi yang dihasilkan oleh AI yang berisi deskripsi rinci tentang suara dan transkrip dialog. Mereka mengatakan bahwa dengan cara ini, teknologi ini belajar mengasosiasikan suara tertentu dengan adegan visual. Seperti yang dicatat oleh TechCrunch, tim DeepMind bukan yang pertama merilis alat AI yang dapat menghasilkan efek suara dan ini tidak akan menjadi yang terakhir. “Penelitian kami menonjol dari solusi video-ke-audio yang ada karena dapat memahami piksel mentah dan penambahan petunjuk teks adalah opsional,” tulis tim tersebut.

Meskipun petunjuk teks bersifat opsional, petunjuk tersebut dapat digunakan untuk membentuk dan menyempurnakan produk akhir agar seakurat dan serealistis mungkin. Anda dapat memasukkan petunjuk positif untuk mengarahkan output dalam menciptakan suara yang diinginkan, misalnya, atau petunjuk negatif untuk mengarahkannya menjauh dari suara yang tidak diinginkan.

Para peneliti mengakui bahwa mereka masih berusaha mengatasi keterbatasan teknologi V2A mereka saat ini, seperti penurunan kualitas audio output yang dapat terjadi jika ada distorsi dalam video sumber. Mereka juga masih bekerja untuk meningkatkan sinkronisasi bibir untuk dialog yang dihasilkan. Selain itu, mereka berjanji untuk menempatkan teknologi ini melalui penilaian dan pengujian keamanan yang ketat sebelum merilisnya ke dunia.

LAINNYA DARI MASTEKNO
Games
Grand Theft Auto, The Trilogy – the Definitive Edition Tembus 30 Juta Unduhan di Netflix Games

Netflix menambahkan Grand Theft Auto: The Trilogy – The Definitive Edition ke layanan langganan game...

Software
Tablet Google Pixel Dapatkan Akses Circle to Search melalui Tombol Aksi pada Android 15 Beta 3

Android 15 dikabarkan akan memudahkan pengguna mengakses fitur Circle to Search dari Google pada perangkat...

Electronic & Acc
Pengembangan Apple Vision Pro 2 Dilaporkan Dihentikan Akibat Penjualan yang Buruk

Apple Vision Pro 2, penerus yang dirumorkan dari headset realitas campuran pertama dari raksasa teknologi...

Cyber Life
Meta Akhirnya Membuat API Threads Tersedia untuk Pengembang

Perusahaan ini mulai menguji alat pengembang dengan beberapa perusahaan pada bulan Maret lalu, tetapi kini...

Software
Kini Anda Dapat Membatasi Instagram Live untuk Teman Dekat

Instagram meluncurkan fitur baru yang memungkinkan pengguna untuk berinteraksi dengan kelompok teman dan pengikut yang...

Games
Dragon Quest 3 HD-2D Remake Rilis pada 14 November

Square-Enix telah mengumumkan bahwa versi baru dari Dragon Quest III, yang menggabungkan elemen lama dan...

Games
Sekuel Lords of the Fallen Dijadwalkan Rilis pada 2026, Eksklusif di Epic Games Store untuk PC

Lords of the Fallen, game action-RPG bergaya Soulslike yang direboot pada 2023, akan mendapatkan sekuel....

Handphone
Oppo Reno 12 dan Reno 12 Pro dengan MediaTek Dimensity 7300-Energy Diluncurkan Secara Global

Oppo Reno 12 dan Reno 12 Pro telah diperkenalkan di beberapa pasar global, beberapa minggu...

Cyber Life
Adobe Acrobat Hadirkan Fitur AI, Termasuk Generasi Gambar dengan Integrasi Model Firefly Image 3

Adobe memperkenalkan serangkaian fitur kecerdasan buatan (AI) baru untuk Acrobat, perangkat lunak pengedit PDF-nya, pada...