SHARE
Cyber Life

Laboratorium kecerdasan buatan Google DeepMind sedang mengembangkan teknologi baru yang dapat menghasilkan soundtrack, bahkan dialog, untuk video. Tim DeepMind telah membagikan kemajuan mereka pada proyek teknologi video-ke-audio (V2A), yang dapat dipasangkan dengan Google Veo dan alat pembuatan video lainnya seperti Sora dari OpenAI. Dalam blognya, tim DeepMind menjelaskan bahwa sistem ini dapat memahami piksel mentah dan menggabungkan informasi tersebut dengan petunjuk teks untuk menciptakan efek suara sesuai dengan apa yang terjadi di layar. Perlu dicatat, alat ini juga dapat digunakan untuk membuat soundtrack untuk rekaman tradisional, seperti film bisu dan video lain tanpa suara.

Para peneliti DeepMind melatih teknologi ini pada video, audio, dan anotasi yang dihasilkan oleh AI yang berisi deskripsi rinci tentang suara dan transkrip dialog. Mereka mengatakan bahwa dengan cara ini, teknologi ini belajar mengasosiasikan suara tertentu dengan adegan visual. Seperti yang dicatat oleh TechCrunch, tim DeepMind bukan yang pertama merilis alat AI yang dapat menghasilkan efek suara dan ini tidak akan menjadi yang terakhir. “Penelitian kami menonjol dari solusi video-ke-audio yang ada karena dapat memahami piksel mentah dan penambahan petunjuk teks adalah opsional,” tulis tim tersebut.

Meskipun petunjuk teks bersifat opsional, petunjuk tersebut dapat digunakan untuk membentuk dan menyempurnakan produk akhir agar seakurat dan serealistis mungkin. Anda dapat memasukkan petunjuk positif untuk mengarahkan output dalam menciptakan suara yang diinginkan, misalnya, atau petunjuk negatif untuk mengarahkannya menjauh dari suara yang tidak diinginkan.

Para peneliti mengakui bahwa mereka masih berusaha mengatasi keterbatasan teknologi V2A mereka saat ini, seperti penurunan kualitas audio output yang dapat terjadi jika ada distorsi dalam video sumber. Mereka juga masih bekerja untuk meningkatkan sinkronisasi bibir untuk dialog yang dihasilkan. Selain itu, mereka berjanji untuk menempatkan teknologi ini melalui penilaian dan pengujian keamanan yang ketat sebelum merilisnya ke dunia.

LAINNYA DARI MASTEKNO
Cyber Life
Adobe Perkenalkan Teknologi AI Agentik untuk Photoshop, Premiere Pro, dan Acrobat

Adobe baru saja memamerkan sekilas kemampuan terbaru berbasis kecerdasan buatan (AI) yang sedang dikembangkan untuk...

Handphone
Realme GT 7 Siap Meluncur 23 April, Bawa Baterai 7.200mAh dalam Bodi Tipis 8,25mm

Realme resmi mengumumkan bahwa GT 7 akan diluncurkan di Tiongkok pada 23 April dan menjadi...

Electronic & Acc
Vivo Watch 5 Siap Meluncur 21 April, Tawarkan Baterai Tahan Hingga 22 Hari dan Fitur Kesehatan Canggih

Vivo akan meluncurkan Vivo Watch 5 pada 21 April di Tiongkok, bersamaan dengan kehadiran smartphone...

Cyber Life
YouTube Luncurkan Fitur AI Music Generator untuk Kreator, Gratis dan Bebas Hak Cipta

YouTube resmi menghadirkan fitur baru berbasis kecerdasan buatan (AI) untuk para kreator kontennya. Diumumkan pada...

Electronic & Acc
Oppo Enco Free 4 Resmi Diluncurkan, TWS dengan Tuning Dynaudio dan Sertifikasi IP55

Oppo resmi meluncurkan Oppo Enco Free 4 di Tiongkok sebagai lini terbaru dari jajaran earphone...

Handphone
Motorola Siapkan Peluncuran Smartphone Baru 24 April, Meskipun Nama Resmi nya Belum Dikonfirmasikan

Meskipun perangkat seluler ini belum ada kepastian nama nya, tapi banyak yang memperkirakan bahwa perangkat...

Hardware
NVIDIA Akhirnya Rilis Varian Terjangkau dari Kartu Grafis RTX 50 Series dengan RTX 5060 Terbaru

Nvidia baru saja meluncurkan GeForce RTX 5060 dan RTX 5060 Ti yang menandai era baru...

Handphone
Honor Luncurkan Smartphone Dengan Baterai Jumbo Yang Ramping

Honor kembali menggebrak pasar smartphone, kali ini dengan lini "Power" yang langsung mencuri perhatian. Sesuai...

Games
Bocoran Oblivion Remastered Gemparkan Industri Game, Detail dan Tampilan Baru Terungkap

Kehebohan baru saja melanda komunitas gamer setelah tangkapan layar dan detail proyek remaster dari game...