SHARE
Cyber Life

Laboratorium kecerdasan buatan Google DeepMind sedang mengembangkan teknologi baru yang dapat menghasilkan soundtrack, bahkan dialog, untuk video. Tim DeepMind telah membagikan kemajuan mereka pada proyek teknologi video-ke-audio (V2A), yang dapat dipasangkan dengan Google Veo dan alat pembuatan video lainnya seperti Sora dari OpenAI. Dalam blognya, tim DeepMind menjelaskan bahwa sistem ini dapat memahami piksel mentah dan menggabungkan informasi tersebut dengan petunjuk teks untuk menciptakan efek suara sesuai dengan apa yang terjadi di layar. Perlu dicatat, alat ini juga dapat digunakan untuk membuat soundtrack untuk rekaman tradisional, seperti film bisu dan video lain tanpa suara.

Para peneliti DeepMind melatih teknologi ini pada video, audio, dan anotasi yang dihasilkan oleh AI yang berisi deskripsi rinci tentang suara dan transkrip dialog. Mereka mengatakan bahwa dengan cara ini, teknologi ini belajar mengasosiasikan suara tertentu dengan adegan visual. Seperti yang dicatat oleh TechCrunch, tim DeepMind bukan yang pertama merilis alat AI yang dapat menghasilkan efek suara dan ini tidak akan menjadi yang terakhir. “Penelitian kami menonjol dari solusi video-ke-audio yang ada karena dapat memahami piksel mentah dan penambahan petunjuk teks adalah opsional,” tulis tim tersebut.

Meskipun petunjuk teks bersifat opsional, petunjuk tersebut dapat digunakan untuk membentuk dan menyempurnakan produk akhir agar seakurat dan serealistis mungkin. Anda dapat memasukkan petunjuk positif untuk mengarahkan output dalam menciptakan suara yang diinginkan, misalnya, atau petunjuk negatif untuk mengarahkannya menjauh dari suara yang tidak diinginkan.

Para peneliti mengakui bahwa mereka masih berusaha mengatasi keterbatasan teknologi V2A mereka saat ini, seperti penurunan kualitas audio output yang dapat terjadi jika ada distorsi dalam video sumber. Mereka juga masih bekerja untuk meningkatkan sinkronisasi bibir untuk dialog yang dihasilkan. Selain itu, mereka berjanji untuk menempatkan teknologi ini melalui penilaian dan pengujian keamanan yang ketat sebelum merilisnya ke dunia.

LAINNYA DARI MASTEKNO
Games
Stellar Blade Hadirkan DLC Nier: Automata, Mode Foto, dan Fitur Baru dalam Update Bulan Ini

Stellar Blade akan semakin menunjukkan inspirasi besar yang diambilnya. Game action-adventure hack-and-slash ini siap mendapatkan...

Software
Signal Hadirkan Beberapa Fitur, di antaranya Tautan Panggilan, Tombol Raise Hand, Reaksi Emoji, dan Peningkatan Lainnya

Signal kini hadir dengan pembaruan terbaru yang memperkenalkan berbagai fitur baru untuk meningkatkan pengalaman pengguna...

Cyber Life
Google Rilis Alat AI Eksperimental ‘Learn About’ dengan Gaya Edukasi Interaktif

Google baru saja merilis alat kecerdasan buatan (AI) eksperimental baru bernama Learn About, yang dirancang...

Cyber Life
Grok-2 dari xAI Mungkin Segera Tersedia Gratis di X

Elon Musk meluncurkan chatbot AI Grok dari xAI pada akhir 2023, namun hingga kini aksesnya...

Software
ChatGPT Desktop Kini Tersedia untuk Semua Pengguna, Tambahkan Fitur Baru

OpenAI terus memperluas aksesibilitas dan fungsionalitas ChatGPT Desktop. Setelah awalnya hanya tersedia untuk pengguna berlangganan...

Handphone
Vivo X200 Series Segera Meluncur di Malaysia

Pabrikan asal China, Vivo baru saja konfirmasikan perilisan smartphone terbarunya, X200 Series di Malaysia pada...

Electronic & Acc
Fiio JM21: DAP Kompak dengan Kualitas Audio Tinggi

Bagi para audiophile dan pencinta musik yang menginginkan kualitas suara resolusi tinggi dalam perangkat portabel,...

Hardware
Fujifilm sedang Mengembangkan Kamera Sinema Medium Format 102MP

Fujifilm secara mengejutkan mengumumkan bahwa mereka tengah mengembangkan kamera sinema medium format dengan resolusi 102...

Games
God of War Ragnarok untuk PS5 Akhirnya Membiarkan Kratos Menyelesaikan Teka-Teki dengan Tenang

Para penggemar Ghost of Sparta kini bisa bernapas lega, karena akhirnya Kratos bisa berpikir dengan...