SHARE
Cyber Life

Hume, perusahaan kecerdasan buatan (AI) berbasis di New York, meluncurkan fitur baru bernama Voice Control pada hari Senin. Fitur ini memungkinkan pengguna untuk menyesuaikan suara AI dengan lebih mendalam. Dirancang untuk mendukung pengembang dalam mengintegrasikan suara AI ke chatbot dan aplikasi berbasis AI lainnya, Voice Control menawarkan kontrol granular terhadap 10 dimensi suara, memberikan fleksibilitas tinggi dalam menciptakan suara unik yang sesuai kebutuhan aplikasi.  

Dalam sebuah blog resmi, Hume menjelaskan bahwa fitur ini hadir untuk membantu perusahaan menemukan suara AI yang selaras dengan identitas merek mereka. Pengguna dapat mengatur berbagai aspek suara, seperti kesan yang ditampilkan, untuk menghasilkan suara AI yang lebih tegas, santai, atau ceria.  

Voice Control saat ini tersedia dalam versi beta dan dapat diakses oleh siapa saja yang terdaftar di platform Hume. Ada 10 dimensi suara yang dapat disesuaikan oleh pengembang, antara lain gender, assertiveness (ketegasan), buoyancy (keceriaan), confidence (kepercayaan diri), enthusiasm (antusiasme), nasality (resonansi hidung), relaxedness (tingkat santai), smoothness (kelembutan), tepidity (kehangatan), dan tightness (kekencangan suara)  

Alih-alih menggunakan sistem berbasis teks, Hume mengadopsi antarmuka slider dengan rentang -100 hingga +100 untuk setiap dimensi. Pendekatan ini dipilih untuk menghindari ambiguitas deskripsi tekstual dan memberikan kontrol lebih rinci atas karakteristik suara dalam berbagai bahasa.  

Dalam pengujian awal, mengubah salah satu dari 10 dimensi menghasilkan perbedaan nyata pada suara AI. Alat ini juga berhasil memisahkan setiap dimensi tanpa mengganggu karakteristik dasar suara. Hume mengklaim keberhasilan ini dicapai melalui pendekatan baru berbasis “unsupervised learning,” yang mampu mempertahankan sebagian besar karakteristik suara utama meskipun parameter diubah secara ekstrem.  

Meski begitu, Hume tidak merinci sumber data suara yang digunakan untuk mengembangkan fitur ini.  

Setelah suara AI berhasil dibuat, pengembang perlu mengintegrasikannya ke aplikasi dengan mengonfigurasi model AI Empathic Voice Interface (EVI). Untuk versi eksperimental ini, kemungkinan besar Hume menggunakan model EVI-2.  

Ke depan, Hume berencana untuk menambah variasi suara dasar, memperkenalkan dimensi suara baru untuk kustomisasi lebih lanjut, meningkatkan kemampuan pelestarian karakteristik suara dalam modifikasi ekstrem, dan mengembangkan alat canggih untuk menganalisis dan memvisualisasikan karakteristik suara.  

Fitur Voice Control dari Hume memberikan inovasi menarik bagi pengembang yang ingin menciptakan suara AI yang benar-benar unik dan sesuai kebutuhan. Dengan kemampuan kustomisasi tingkat tinggi dan rencana pengembangan berkelanjutan, Hume siap menjadi pemain penting dalam dunia teknologi suara AI.  

LAINNYA DARI MASTEKNO
Electronic & Acc
Apple Siap Luncurkan Smart Home Hub Pertamanya Akhir Tahun Ini

Setelah lama menjadi bahan spekulasi, Apple akhirnya dikabarkan akan merilis smart home hub pertamanya pada...

Games
Legenda Bangkit Lagi! Dragon Quest 1 & 2 HD-2D Remake Siap Dirilis 30 Oktober di Semua Platform

Square Enix kembali menghadirkan nostalgia untuk para penggemar JRPG klasik dengan merilis Dragon Quest 1...

Cyber Life
Texas Siap Batasi Media Sosial untuk Anak di Bawah 18th! Prioritaskan Keselamatan Digital

Negara bagian Texas tengah bersiap menjadi wilayah Amerika Serikat berikutnya yang memberlakukan pembatasan ketat terhadap...

Software
Bluesky Buka Pendaftaran Verifikasi Akun, Kini Siapa Saja Bisa Ajukan Centang Biru

Bluesky resmi membuka program verifikasi untuk publik, memungkinkan pengguna mengajukan permohonan centang biru meskipun standar...

Software
Tak Perlu Lagi Klik Manual, Gemini di Gmail Kini Otomatis Rangkum Email Panjang!

Kabar gembira bagi pengguna Gmail yang kerap kewalahan dengan tumpukan email panjang. Asisten kecerdasan buatan...

Software
WhatsApp Resmi Hadir di iPad! Dukung Stage Manager dan Fitur Multitasking iPadOS

Setelah bertahun-tahun dinantikan, WhatsApp versi iPad akhirnya resmi diluncurkan, menjawab salah satu permintaan terbesar dari...

Handphone
Google Dilaporkan Beralih Ke TSMC Untuk Chipset Pixel Selanjutnya

Dalam waktu dekat Google dilaporkan akan meresmikan smartphone flagship terbarunya, Pixel 10. Laporan terbaru menyebut...

Hardware
Xeon 6 Meluncur, Ketika Intel dan NVIDIA Berkolaborasi untuk AI Super Cepat

Intel baru saja mengumumkan gebrakan baru di kancah kecerdasan buatan dengan merilis tiga prosesor Xeon...

Software
Bukan Sekadar AI! Apple Siap Rombak Total Tampilan iOS, iPadOS, hingga macOS dengan Solarium

Apple siap meluncurkan pembaruan perangkat lunak paling revolusioner dalam lebih dari satu dekade. Kabarnya, seluruh...