SHARE
Cyber Life

Laboratorium kecerdasan buatan Google DeepMind sedang mengembangkan teknologi baru yang dapat menghasilkan soundtrack, bahkan dialog, untuk video. Tim DeepMind telah membagikan kemajuan mereka pada proyek teknologi video-ke-audio (V2A), yang dapat dipasangkan dengan Google Veo dan alat pembuatan video lainnya seperti Sora dari OpenAI. Dalam blognya, tim DeepMind menjelaskan bahwa sistem ini dapat memahami piksel mentah dan menggabungkan informasi tersebut dengan petunjuk teks untuk menciptakan efek suara sesuai dengan apa yang terjadi di layar. Perlu dicatat, alat ini juga dapat digunakan untuk membuat soundtrack untuk rekaman tradisional, seperti film bisu dan video lain tanpa suara.

Para peneliti DeepMind melatih teknologi ini pada video, audio, dan anotasi yang dihasilkan oleh AI yang berisi deskripsi rinci tentang suara dan transkrip dialog. Mereka mengatakan bahwa dengan cara ini, teknologi ini belajar mengasosiasikan suara tertentu dengan adegan visual. Seperti yang dicatat oleh TechCrunch, tim DeepMind bukan yang pertama merilis alat AI yang dapat menghasilkan efek suara dan ini tidak akan menjadi yang terakhir. “Penelitian kami menonjol dari solusi video-ke-audio yang ada karena dapat memahami piksel mentah dan penambahan petunjuk teks adalah opsional,” tulis tim tersebut.

Meskipun petunjuk teks bersifat opsional, petunjuk tersebut dapat digunakan untuk membentuk dan menyempurnakan produk akhir agar seakurat dan serealistis mungkin. Anda dapat memasukkan petunjuk positif untuk mengarahkan output dalam menciptakan suara yang diinginkan, misalnya, atau petunjuk negatif untuk mengarahkannya menjauh dari suara yang tidak diinginkan.

Para peneliti mengakui bahwa mereka masih berusaha mengatasi keterbatasan teknologi V2A mereka saat ini, seperti penurunan kualitas audio output yang dapat terjadi jika ada distorsi dalam video sumber. Mereka juga masih bekerja untuk meningkatkan sinkronisasi bibir untuk dialog yang dihasilkan. Selain itu, mereka berjanji untuk menempatkan teknologi ini melalui penilaian dan pengujian keamanan yang ketat sebelum merilisnya ke dunia.

LAINNYA DARI MASTEKNO
Games
Siap Mengguncang! Pixelity Akan Gelar Playtest Game XR Evangelion

Penggemar Neon Genesis Evangelion kini berkesempatan merasakan langsung pengalaman dunia animenya. Pixelity, pengembang trilogi game...

Software
Spotify Wrapped 2025 Hadir dengan Fitur Party Mode untuk Kompetisi Statistik Secara Langsung

Spotify mulai meluncurkan Wrapped 2025, rangkuman pengalaman mendengarkan yang telah menjadi tradisi sejak 2019 setiap...

Cyber Life
Netflix Akuisisi Warner Bros Discovery US$ 72 Miliar, Peta Hollywood Resmi Bergeser

Industri hiburan global baru saja mengalami kejutan. Netflix, raksasa layanan streaming, akhirnya memenangkan pertempuran sengit...

Software
YouTube Luncurkan Recap 2025 dengan Kartu Personal dan Insight Kebiasaan Menonton

YouTube resmi menghadirkan fitur Recap 2025 pertama kalinya di platform utama, memberikan rangkuman personal tentang...

Handphone
Baterai Besar & Layar Lebar! Nubia Fold Hadir Bareng Nubia Flip 3

ZTE melalui lini Nubia resmi meluncurkan dua smartphone lipat terbaru di Jepang, menghadirkan opsi model...

Cyber Life
AWS Perkenalkan Frontier AI Agents untuk Perusahaan, Mampu Beroperasi Mandiri Selama Berhari-Hari

Amazon Web Services (AWS) resmi meluncurkan frontier agents, kelas baru agen kecerdasan buatan (AI) otonom...

Hardware
Samsung Kembangkan Memori Kencang GDDR7 40 Gbps

Samsung Electronics kembali mengukuhkan posisinya dalam peta persaingan semikonduktor global. Di tengah gelaran Korea Tech...

Games
Suda51 Percepat Perilisan ‘Romeo is a Dead Man’, Sindir Penundaan GTA 6

Teka-teki mengenai proyek ambisius Grasshopper Manufacture akhirnya terjawab. Studio yang identik dengan gaya punk-rock dalam...

Cyber Life
Kejar Ketertinggalan AI, Meta Pangkas Anggaran Metaverse

Ambisi Mark Zuckerberg membangun dunia virtual tampaknya harus berhadapan dengan realita pahit pasar. Laporan terbaru...