Baca Juga: Beasiswa Digital Talent Scholarship Kembali Dibuka untuk 2.500 Orang! Begini Cara Daftarnya
OpenAI meluncurkan alat baru bertenaga kecerdasan buatan (AI), bernama Voice Engine. Ini merupakan alat kloning suara, yang menggunakan masukan teks dan satu sampel audio berdurasi 15 detik.
Dengan sampel itu, mesin cerdas OpenAI dapat menghasilkan ucapan yang terdengar alami, emosional, realistis, dan sangat mirip dengan pembicara aslinya.
"Voice Engine kali pertama dikembangkan oleh OpenAI pada akhir 2022, dan telah menggunakannya untuk mendukung suara preset yang tersedia di API text-to-speech, ChatGPT Voice dan Read Aloud," tulis OpenAI dalam blognya, dikutip Sabtu (30/3/2024).
Baca Juga: Nissan Akan Kenalkan 16 Mobil Listrik Barunya Pada 2026
Sebelum merilis Voice Engine, OpenAI telah mengujinya secara privat kepada kelompok kecil mitra terpercaya mereka, pada akhir 2023.
Lewat uji coba, OpenAI menemukan bahwa Voice Engine dapat ditujukan untuk manfaat kebaikan di berbagai industri.
Membantu Anak-anak dalam Kegiatan Akademis
Adanya 'bantuan membaca' lewat suara kloning yang terdengar alami dan penuh emosi, ternyata bisa membantu anak-anak belajar dalam kegiatan akademis.
Age of Learning, sebuah perusahaan teknologi pendidikan yang didedikasikan untuk keberhasilan akademis anak-anak, telah menggunakan ini untuk menghasilkan konten sulih suara yang telah ditulis sebelumnya.
Mereka juga menggunakan Voice Engine dan GPT-4 untuk membuat respons yang dipersonalisasi dan real-time, dalam berinteraksi dengan siswa.
Dengan teknologi ini, Age of Learning mampu menciptakan lebih banyak konten untuk khalayak yang lebih luas.
Menerjemahkan Konten
Voice Engine dapat membantu menerjemahkan konten, seperti video dan podcast. Sehingga pembuat konten dan bisnis dapat menjangkau lebih banyak orang di seluruh dunia, dengan lancar dan dengan suara mereka sendiri.
Sebuah platform konten bernama HeyGen, menggunakan Voice Engine untuk penerjemahan video, sehingga mereka dapat menerjemahkan suara pembicara ke berbagai bahasa dan menjangkau pemirsa global.
Saat digunakan untuk penerjemahan, Voice Engine mempertahankan aksen asli penutur asli. Misalnya, menghasilkan bahasa Inggris dengan sampel audio dari penutur bahasa Prancis, akan menghasilkan ucapan dengan aksen Prancis.
Menjangkau Komunitas Global
NGO yang bekerja dengan memberi layanan penting di wilayah terpencil, Dimagi, sedang membangun alat bagi petugas kesehatan masyarakat untuk memberikan berbagai layanan penting, seperti konseling bagi ibu menyusui.
Dimagi menggunakan Voice Engine dan GPT-4, untuk memberikan umpan balik interaktif dalam bahasa utama setiap pekerja; termasuk Swahili atau bahasa informal seperti Sheng, bahasa campuran kode yang populer di Kenya. Tentunya, ini membuat pelayanan lebih mudah menjangkau sasaran.
Membantu Orang-orang dengan Gangguan Kemampuan Bicara
Voice Engine membantu orang-orang yang mengalami kekurangan bersifat non-verbal, atau orang yang sedang menjalani terapi karena kondisi mereka yang memengaruhi kemampuan bicara.
Livox, aplikasi komunikasi alternatif AI, mendukung perangkat Augmentative & Alternative Communication (AAC) yang memungkinkan penyandang disabilitas untuk berkomunikasi.
Voice Engine bisa memungkinkan penggunanya memilih ucapan yang paling mewakili dirinya, dan bagi pengguna multibahasa, sekaligus mempertahankan konsistensi suara di setiap bahasa lisan.
Membantu pasien memulihkan suaranya, bagi mereka yang menderita kondisi bicara mendadak atau degeneratif.
Norman Prince Neurosciences Institute di Lifespan, sebuah sistem kesehatan nirlaba yang berfungsi sebagai afiliasi pengajaran utama fakultas kedokteran Brown University, sedang menjajaki penggunaan AI dalam konteks klinis.
Mereka telah menguji coba program yang menawarkan kemampuan Voice Engine, kepada individu dengan etiologi onkologis atau neurologis, untuk gangguan bicara.
Baca Juga: Beasiswa Digital Talent Scholarship Kembali Dibuka untuk 2.500 Orang! Begini Cara Daftarnya
Meski memberikan banyak manfaat, OpenAI menyadari bahwa yang harus tetap menjadi perhatian dalam pengembangan Voice Engine adalah risiko serius yang ditimbulkan.
Untuk itu, OpenAI bekerja sama dengan mitra-mitra di Amerika Serikat dan internasional dari berbagai kalangan pemerintahan, media, hiburan, pendidikan, masyarakat sipil, dan lainnya, agar mereka dapat memberikan masukan kebijakan keamanan alat ini.
"Mitra yang menguji Voice Engine, telah menyetujui kebijakan penggunaan kami, yang melarang peniruan identitas individu atau organisasi lain tanpa izin atau hak hukum," kata perusahaan.
"Selain itu, persyaratan kami dengan mitra ini memerlukan persetujuan yang jelas dan terinformasi dari pembicara asli, dan kami tidak mengizinkan pengembang membangun cara bagi pengguna individu untuk menyuarakan pendapat mereka sendiri," lanjut OpenAI lagi.
OpenAI juga memberikan tanda air untuk melacak asal audio apa pun yang dihasilkan oleh Voice Engine, serta pemantauan proaktif terhadap cara penggunaannya.
Baca Juga: Pulang Kampung Naik Mobil Pribadi? Wajib Cek 8 Komponen Ini
Baca Juga: 8 Hal Yang Harus Diterapkan, Ketika Bawa Mobil Menyeberang Laut