Amazon Rilis Nova Sonic! Model AI Generasi Suara Real-Time untuk Interaksi Lebih Manusiawi

Eveline

Amazon resmi memperkenalkan Nova Sonic, model kecerdasan buatan (AI) terbaru dari keluarga Nova yang dirancang khusus untuk menghasilkan suara manusia secara real-time. Tidak seperti teknologi text-to-speech (TTS) konvensional, Nova Sonic mampu memahami input suara secara langsung dan memberikan respons yang terdengar alami, layaknya percakapan manusia. Teknologi ini ditujukan bagi para pengembang yang ingin membangun chatbot interaktif atau aplikasi AI percakapan yang lebih responsif dan kontekstual.

Dalam pengumuman resminya, Amazon menyebut bahwa pendekatan tradisional untuk aplikasi berbasis suara umumnya melibatkan serangkaian model terpisah, mulai dari pengenalan suara, konversi ucapan ke teks, pemrosesan data, hingga TTS. Hal ini tidak hanya memperlambat respons, tetapi juga sering gagal mempertahankan konteks bahasa secara alami. Nova Sonic hadir sebagai solusi terpadu yang menggabungkan pemahaman dan generasi suara dalam satu sistem, sehingga mampu merespons percakapan secara cepat dan relevan.

Keunggulan utama dari Nova Sonic terletak pada kemampuannya mengenali ritme, intonasi, dan gaya bicara pengguna, termasuk dalam kondisi suara tidak jelas, pelafalan yang kurang tepat, atau ketika pengguna berbicara dengan jeda. Model ini juga dapat membedakan karakter suara berdasarkan gender dan aksen yang berbeda, serta tetap berfungsi optimal dalam lingkungan yang bising.

Dalam menghasilkan respons, Nova Sonic mampu menyesuaikan gaya komunikasi sesuai konteks percakapan, lebih ekspresif dan menyerupai cara bicara manusia sebenarnya. Saat ini, model AI ini hanya mendukung bahasa Inggris, namun Amazon telah mengonfirmasi bahwa dukungan multibahasa akan segera menyusul. Nova Sonic memiliki kapasitas jendela konteks hingga 32.000 token audio dan tambahan ruang untuk mengakomodasi percakapan berdurasi panjang, dengan batas sesi standar selama delapan menit.

Bagi para pengembang yang ingin mencoba model ini, Nova Sonic tersedia di Amazon Bedrock dan dapat diakses melalui antarmuka API streaming dua arah, yang mampu memproses input audio sekaligus menghasilkan output secara simultan.

Kehadiran Nova Sonic menandai langkah besar Amazon dalam menghadirkan teknologi suara generatif yang semakin mendekati interaksi alami antar manusia, membuka peluang baru untuk pengembangan aplikasi AI yang lebih personal, ekspresif, dan adaptif.