OpenAI Hadirkan Kloning Suara

Uli Febriarni
Sabtu 30 Maret 2024, 12:46 WIB
Logo OpenAI (Sumber: OpenAI)

Logo OpenAI (Sumber: OpenAI)

Baca Juga: Beasiswa Digital Talent Scholarship Kembali Dibuka untuk 2.500 Orang! Begini Cara Daftarnya

OpenAI meluncurkan alat baru bertenaga kecerdasan buatan (AI), bernama Voice Engine. Ini merupakan alat kloning suara, yang menggunakan masukan teks dan satu sampel audio berdurasi 15 detik.

Dengan sampel itu, mesin cerdas OpenAI dapat menghasilkan ucapan yang terdengar alami, emosional, realistis, dan sangat mirip dengan pembicara aslinya.

"Voice Engine kali pertama dikembangkan oleh OpenAI pada akhir 2022, dan telah menggunakannya untuk mendukung suara preset yang tersedia di API text-to-speech, ChatGPT Voice dan Read Aloud," tulis OpenAI dalam blognya, dikutip Sabtu (30/3/2024).

Baca Juga: Nissan Akan Kenalkan 16 Mobil Listrik Barunya Pada 2026

Sebelum merilis Voice Engine, OpenAI telah mengujinya secara privat kepada kelompok kecil mitra terpercaya mereka, pada akhir 2023.

Lewat uji coba, OpenAI menemukan bahwa Voice Engine dapat ditujukan untuk manfaat kebaikan di berbagai industri.

  1. Membantu Anak-anak dalam Kegiatan Akademis

Adanya 'bantuan membaca' lewat suara kloning yang terdengar alami dan penuh emosi, ternyata bisa membantu anak-anak belajar dalam kegiatan akademis.

Age of Learning, sebuah perusahaan teknologi pendidikan yang didedikasikan untuk keberhasilan akademis anak-anak, telah menggunakan ini untuk menghasilkan konten sulih suara yang telah ditulis sebelumnya.

Mereka juga menggunakan Voice Engine dan GPT-4 untuk membuat respons yang dipersonalisasi dan real-time, dalam berinteraksi dengan siswa.

Dengan teknologi ini, Age of Learning mampu menciptakan lebih banyak konten untuk khalayak yang lebih luas.

  1. Menerjemahkan Konten

Voice Engine dapat membantu menerjemahkan konten, seperti video dan podcast. Sehingga pembuat konten dan bisnis dapat menjangkau lebih banyak orang di seluruh dunia, dengan lancar dan dengan suara mereka sendiri.

Sebuah platform konten bernama HeyGen, menggunakan Voice Engine untuk penerjemahan video, sehingga mereka dapat menerjemahkan suara pembicara ke berbagai bahasa dan menjangkau pemirsa global.

Saat digunakan untuk penerjemahan, Voice Engine mempertahankan aksen asli penutur asli. Misalnya, menghasilkan bahasa Inggris dengan sampel audio dari penutur bahasa Prancis, akan menghasilkan ucapan dengan aksen Prancis.

  1. Menjangkau Komunitas Global

NGO yang bekerja dengan memberi layanan penting di wilayah terpencil, Dimagi, sedang membangun alat bagi petugas kesehatan masyarakat untuk memberikan berbagai layanan penting, seperti konseling bagi ibu menyusui.

Dimagi menggunakan Voice Engine dan GPT-4, untuk memberikan umpan balik interaktif dalam bahasa utama setiap pekerja; termasuk Swahili atau bahasa informal seperti Sheng, bahasa campuran kode yang populer di Kenya. Tentunya, ini membuat pelayanan lebih mudah menjangkau sasaran.

  1. Membantu Orang-orang dengan Gangguan Kemampuan Bicara

  • Voice Engine membantu orang-orang yang mengalami kekurangan bersifat non-verbal, atau orang yang sedang menjalani terapi karena kondisi mereka yang memengaruhi kemampuan bicara.

Livox, aplikasi komunikasi alternatif AI, mendukung perangkat Augmentative & Alternative Communication (AAC) yang memungkinkan penyandang disabilitas untuk berkomunikasi.

Voice Engine bisa memungkinkan penggunanya memilih ucapan yang paling mewakili dirinya, dan bagi pengguna multibahasa, sekaligus mempertahankan konsistensi suara di setiap bahasa lisan.

  • Membantu pasien memulihkan suaranya, bagi mereka yang menderita kondisi bicara mendadak atau degeneratif.

Norman Prince Neurosciences Institute di Lifespan, sebuah sistem kesehatan nirlaba yang berfungsi sebagai afiliasi pengajaran utama fakultas kedokteran Brown University, sedang menjajaki penggunaan AI dalam konteks klinis.

Mereka telah menguji coba program yang menawarkan kemampuan Voice Engine, kepada individu dengan etiologi onkologis atau neurologis, untuk gangguan bicara.

Baca Juga: Beasiswa Digital Talent Scholarship Kembali Dibuka untuk 2.500 Orang! Begini Cara Daftarnya

Meski memberikan banyak manfaat, OpenAI menyadari bahwa yang harus tetap menjadi perhatian dalam pengembangan Voice Engine adalah risiko serius yang ditimbulkan.

Untuk itu, OpenAI bekerja sama dengan mitra-mitra di Amerika Serikat dan internasional dari berbagai kalangan pemerintahan, media, hiburan, pendidikan, masyarakat sipil, dan lainnya, agar mereka dapat memberikan masukan kebijakan keamanan alat ini.

"Mitra yang menguji Voice Engine, telah menyetujui kebijakan penggunaan kami, yang melarang peniruan identitas individu atau organisasi lain tanpa izin atau hak hukum," kata perusahaan.

"Selain itu, persyaratan kami dengan mitra ini memerlukan persetujuan yang jelas dan terinformasi dari pembicara asli, dan kami tidak mengizinkan pengembang membangun cara bagi pengguna individu untuk menyuarakan pendapat mereka sendiri," lanjut OpenAI lagi.

OpenAI juga memberikan tanda air untuk melacak asal audio apa pun yang dihasilkan oleh Voice Engine, serta pemantauan proaktif terhadap cara penggunaannya.

Baca Juga: Pulang Kampung Naik Mobil Pribadi? Wajib Cek 8 Komponen Ini

Baca Juga: 8 Hal Yang Harus Diterapkan, Ketika Bawa Mobil Menyeberang Laut

Follow Berita Techverse.Asia di Google News
Berita Terkait
Techno

Sam Altman Mulai Spill Tipis-Tipis GPT-5

Rabu 17 Januari 2024, 16:45 WIB
Sam Altman Mulai Spill Tipis-Tipis GPT-5
Berita Terkini
Techno12 Desember 2025, 19:39 WIB

TicNote Pods: Earbud Pencatat Catatan Bertenaga AI 4G Pertama di Dunia

Earbud ini tersedia dalam dua kelir dan harganya hampir mencapai Rp5 juta.
TicNote Pods. (Sumber: Mobvoi)
Hobby12 Desember 2025, 19:15 WIB

Sinopsis Film Para Perasuk, Ini Daftar Para Pemainnya

Ini adalah film terbaru garapan Wregas Bhanuteja, tapi belum diungkap tanggal rilisnya untuk 2026 mendatang.
Poster film Para Perasuk. (Sumber: istimewa)
Techno12 Desember 2025, 18:00 WIB

Instagram Beri Kendali Atas Algoritma Konten yang Muncul di Reels

Instagram akan memungkinkan penggunanya untuk mengontrol topik mana yang direkomendasikan oleh algoritmanya.
Pengguna bisa mempersonalisasi algoritma Reels yang muncul di Instagram. (Sumber: Instagram)
Lifestyle12 Desember 2025, 17:21 WIB

ASICS Hadirkan Sepatu Padel Sonicsmash FF, Ringan dan Terasa Lebih Lincah

Sepatu padel baru tersebut untuk membuat kecepatan terasa mudah.
ASICS Sonicsmash FF adalah sepatu khusus untuk padel. (Sumber: ASICS)
Techno12 Desember 2025, 15:16 WIB

Jenius x Zurich Luncurkan 2 Proteksi Perjalanan untuk Liburan yang Aman

Jenius adalah aplikasi perbankan digital.
Dua produk proteksi hasil kolaborasi Jenius x Zurich. (Sumber: Jenius)
Startup12 Desember 2025, 15:03 WIB

TransTRACK Raih Halal Logistics Excellence Award

Penghargaan ini didapat dari Halal Development Corporation Berhard pada World Halal Excellence Awards 2024 di Johor, Malaysia.
CEO TransTrack Anggie Meisesari saat menerima Halal Logistics Excellence Award. (Sumber: istimewa)
Techno12 Desember 2025, 14:50 WIB

Samsung Galaxy Watch Mendukung Pembayaran QRIS Tap di Aplikasi myBCA

QRIS Tap myBCA hadi di Samsung Galaxy Watch, bertransaksi kian praktis.
Transaksi pakai QRIS Tap myBCA kini bisa dilakukan langsung dari pergelangan tangan. (Sumber: Samsung)
Automotive12 Desember 2025, 14:08 WIB

Kawasaki Z1100 ABS MY2026 Dipasarkan di Indonesia, Harga Hampir Rp400 Juta

Performanya semakin buas dan agresif.
Kawasaki Z1100 ABS MY2026. (Sumber: Kawasaki)
Startup11 Desember 2025, 19:20 WIB

MDI Portofolio Impact Report 2025: 8 Startup Diklaim Beri Dampak Nyata

MDI Ventures melihat laporan-laporan ini bukan sekadar dokumen tahunan, tetapi sebagai landasan untuk pengambilan keputusan.
MDI Ventures.
Techno11 Desember 2025, 18:15 WIB

Pebble Hadirkan Index 01: Cincin Pintar untuk Merekam Pikiran

Tangkap ide-ide terbaikmu sebelum ide-ide itu hilang begitu saja.
Pebble Index 01. (Sumber: Pebble)