SHARE
Cyber Life

Laboratorium kecerdasan buatan Google DeepMind sedang mengembangkan teknologi baru yang dapat menghasilkan soundtrack, bahkan dialog, untuk video. Tim DeepMind telah membagikan kemajuan mereka pada proyek teknologi video-ke-audio (V2A), yang dapat dipasangkan dengan Google Veo dan alat pembuatan video lainnya seperti Sora dari OpenAI. Dalam blognya, tim DeepMind menjelaskan bahwa sistem ini dapat memahami piksel mentah dan menggabungkan informasi tersebut dengan petunjuk teks untuk menciptakan efek suara sesuai dengan apa yang terjadi di layar. Perlu dicatat, alat ini juga dapat digunakan untuk membuat soundtrack untuk rekaman tradisional, seperti film bisu dan video lain tanpa suara.

Para peneliti DeepMind melatih teknologi ini pada video, audio, dan anotasi yang dihasilkan oleh AI yang berisi deskripsi rinci tentang suara dan transkrip dialog. Mereka mengatakan bahwa dengan cara ini, teknologi ini belajar mengasosiasikan suara tertentu dengan adegan visual. Seperti yang dicatat oleh TechCrunch, tim DeepMind bukan yang pertama merilis alat AI yang dapat menghasilkan efek suara dan ini tidak akan menjadi yang terakhir. “Penelitian kami menonjol dari solusi video-ke-audio yang ada karena dapat memahami piksel mentah dan penambahan petunjuk teks adalah opsional,” tulis tim tersebut.

Meskipun petunjuk teks bersifat opsional, petunjuk tersebut dapat digunakan untuk membentuk dan menyempurnakan produk akhir agar seakurat dan serealistis mungkin. Anda dapat memasukkan petunjuk positif untuk mengarahkan output dalam menciptakan suara yang diinginkan, misalnya, atau petunjuk negatif untuk mengarahkannya menjauh dari suara yang tidak diinginkan.

Para peneliti mengakui bahwa mereka masih berusaha mengatasi keterbatasan teknologi V2A mereka saat ini, seperti penurunan kualitas audio output yang dapat terjadi jika ada distorsi dalam video sumber. Mereka juga masih bekerja untuk meningkatkan sinkronisasi bibir untuk dialog yang dihasilkan. Selain itu, mereka berjanji untuk menempatkan teknologi ini melalui penilaian dan pengujian keamanan yang ketat sebelum merilisnya ke dunia.

LAINNYA DARI MASTEKNO
Cyber Life
YouTube Siap Tantang OpenAI Sora, Hadirkan Shorts AI Pakai Wajah Kreator

YouTube mengungkapkan rencana besar untuk platform dan para kreatornya pada 2026 dengan memperdalam integrasi kecerdasan...

Games
Petualangan Baru Dimulai! Sekuel Super Mario Movie Meluncur April Mendatang

Ada kabar baik bagi para penggemar si tukang ledeng ikonik asal Jepang. Nintendo dan Illumination...

Handphone
Qualcomm Akan Hadirkan Kecepatan Desktop pada Smartphone

Industri semikonduktor global tengah bersiap menyaksikan lompatan teknis yang mungkin akan mengubah wajah perangkat genggam...

Hardware
Chipset NVIDIA N1 Muncul di Jejak Digital Lenovo, Pertanda Apa?

Jejak digital jarang sekali bisa benar-benar dihapus, terutama di dunia perangkat keras PC yang kompetitif....

Electronic & Acc
Sony LinkBuds Clip Resmi Meluncur dengan Desain Open-Ear dan Baterai hingga 9 Jam

Sony resmi meluncurkan LinkBuds Clip di sejumlah negara Amerika Utara, menghadirkan true wireless earbuds dengan...

Electronic & Acc
Tren Open-Ear, Realme Perkenalkan Buds Clip dengan Teknologi NextBass

Pasar audio personal tengah mengalami pergeseran paradigma. Jika selama bertahun-tahun pasar didominasi oleh desain in-ear...

Electronic & Acc
Apple Dikabarkan Kembangkan Wearable AI Pin, Siap Tantang Kegagalan Humane

Apple dikabarkan tengah mengembangkan perangkat wearable berbentuk AI pin, sebuah langkah ambisius untuk memasuki pasar...

Electronic & Acc
XREAL Gugat Viture, Sengketa Paten Smart Glasses Masuk Jalur Hukum

Produsen kacamata pintar XREAL resmi mengajukan gugatan hukum terhadap rivalnya, Viture, atas dugaan pelanggaran paten....

Cyber Life
Rayakan 25 Tahun Wikipedia! Meta dan Microsoft sebagai Mitra AI

Dalam rangka merayakan ulang tahun Wikipedia yang ke-25, Wikimedia selaku organisasi induk mengumumkan kemitraan strategis...