ChatGPT telah diperbarui dengan dukungan untuk percakapan suara dan pengenalan gambar, hal ini telah diumumkan oleh OpenAI. Chatbot perusahaan yang bertenaga AI sesaat lagi akan bisa mengerti penangkapan gambar atau pembagian gambar oleh pengguna dan memberikan detil atau informasi terkait diberbagai platform dimana chatbot tersedia. AI ini juga bisa melakukan percakapan menggunakan alat pengenalan percakapan OpenAI Whisper dan teknologi baru TTS dari perusahaan yang dikatakan menawarkan audio seperti manusia pada aplikasi ChatGPT perusahaan untuk ponsel.
OpenAI telah mengungkapkan dalam sebuah blog bahwa kapabilitas pengenalan gambar baru perusahaan untuk ChatGPT akan tersedia di semua platform, sementara fitur percakapan suara akan tersedia di iOS dan Android melalui pengaturan. Fitur ini akan tersedia untuk pelanggan ChatGPT dan Enterprise, dan tidak ada kabar apakah fitur tersebut akan keluar untuk pengguna pada tingkat gratis di masa depan.
Percakapan suara yang hadir ke ChatGPT bisa dinyalakan dengan menuju Settings > New Features dan menyalakan opsi percakapan suara. Kamu bisa memilih dari lima suara, OpenAI mengatakan bahwa mereka telah bekerja dengan aktor suara profesional untuk menawarkan fitur baru. Aplikasi ChatGPT akan bisa menjawab pertanyaan dengan mengubah pertanyaan suara menjadi teks yang bisa dimengerti oleh chatbot, dan respon akan diubah menjadi audio menggunakan teknologi TTS baru.
ChatGPT bukan satu-satunya layanan yang akan menggunakan teknologi baru TTS OpenAI, Spotify telah mengumumkan bahwa alat penerjemah suara berbasis AI baru untuk kreator podcast yang bisa secara otomatis menerjemahkan podcast dari Inggris ke Perancis, Jerman, dan Spanyol. Alat ini diuji dengan beberapa pembawa acara podcast dan episode terjemahan akan tersedia untuk semua pengguna dimanapun Spotify tersedia.
OpenAI mengatakan alat pengenalan gambar baru menjalankan model GPT 3.5 dan GPT 4 dan bisa menganalisa gambar dan teks yang berada di foto, tangkapan gambar, dan dokumen.