Kini ChatGPT Bisa Menerima Perintah Tulisan, Suara, dan Gambar

OpenAI meluncurkan versi baru layanan untuk super chatbot mereka, ChatGPT.

Layanan terbarunya memungkinkan pengguna untuk mengaktifkan bot AI itu, tidak hanya dengan mengetikkan kalimat ke dalam prompt perintah, tetapi juga dengan berbicara dengan suara keras atau hanya mengunggah gambar.

Ini mungkin mengingatkan kita dengan Asisten Google dan Google Lens, tapi coba kita baca dulu seperti apa penjelasan dari OpenAI.

OpenAI menyatakan bahwa lewat pembaruan ini, mereka menawarkan jenis antarmuka baru yang lebih intuitif dan model yang ditingkatkan.

"Kami meluncurkan [kemampuan perintah] suara dan gambar di ChatGPT kepada pengguna Plus dan Enterprise selama dua pekan ke depan. [Perintah] suara akan hadir di iOS dan Android, kemudian gambar akan tersedia di semua platform," kata OpenAI, seperti dikutip Selasa (26/9/2023).

Menggunakan Perintah Suara

Ketuk tombol yang dilengkapi dengan logo mikrofon, lalu ucapkan pertanyaan atau perintah yang ingin kamu sampaikan.

ChatGPT akan mengubahnya menjadi teks dan memasukkannya ke model bahasa besar. Kemudian, kamu mendapatkan jawaban, sistem mengubahnya kembali menjadi ucapan, dan mengucapkan jawabannya dengan lantang.

"Kami berkolaborasi dengan pengisi suara profesional untuk menciptakan setiap suara. Kami juga menggunakan Whisper, sistem pengenalan ucapan sumber terbuka kami, untuk menyalin kata-kata yang Anda ucapkan ke dalam teks," terang perusahaan.

Untuk fitur suara, pengguna bisa memilih satu dari lima suara berbeda untuk didengarkan. Kemampuan suara baru ini didukung oleh model text-to-speech baru, yang mampu menghasilkan audio mirip manusia hanya dari teks dan contoh ucapan beberapa detik.

OpenAI bekerja sama dengan Spotify, untuk menerjemahkan siniar ke bahasa lain, misalnya, sambil tetap mempertahankan suara podcaster.

Menggunakan Perintah Gambar

Untuk memulai, ketuk tombol foto untuk mengambil atau memilih gambar. Jika kamu menggunakan iOS atau Android, ketuk tombol plus terlebih dahulu.

Kamu juga dapat mendiskusikan banyak gambar atau menggunakan alat menggambar yang dimiliki ChatGPT untuk memandu asisten.

Pemahaman gambar didukung oleh multimodal GPT-3.5 dan GPT-4. Model ini menerapkan keterampilan penalaran bahasanya pada berbagai macam gambar, seperti foto, tangkapan layar, dan dokumen yang berisi teks dan gambar.

Kemampuan Dibangun Bertahap

OpenAI mengaku, perusahaan pada dasarnya ingin membangun Artificial General Intelligence (AGI) yang aman dan bermanfaat. Hal itu jadi alasan mereka menerapkan kemampuan perintah gambar dan suara ini secara bertahap.

Dengan demikian, memungkinkan perusahaan memperbaiki dan menyempurnakan mitigasi risiko dari waktu ke waktu, sekaligus mempersiapkan semua orang untuk sistem yang lebih kuat di masa depan.

Strategi ini menjadi lebih penting dengan model-model canggih yang melibatkan suara dan visi.

"Pengguna mungkin bergantung pada ChatGPT untuk topik khusus, misalnya di bidang seperti penelitian. Kami transparan mengenai keterbatasan model dan tidak menyarankan kasus penggunaan berisiko tinggi tanpa verifikasi yang tepat," terdengar seperti 'disclaimer' dari OpenAI.

Selain itu, model ini mahir dalam menyalin teks bahasa Inggris, namun performanya buruk pada beberapa bahasa lain, terutama yang menggunakan aksara non-romawi. OpenAI menyarankan pengguna non-Inggris agar tidak menggunakan ChatGPT untuk tujuan tersebut.

Kini ChatGPT Bisa Menerima Perintah Tulisan, Suara, dan Gambar

ChatGPT, Mekanisme Pintar Rilisan Open AI Yang Bisa Jawab Berbagai Pertanyaan

OpenAI Rilis GPT-4: Bisa Memahami Input Teks dan Gambar

OpenAI Rilis ChatGPT Enterprise: Tawarkan Kinerja Dua Kali Lebih Cepat dan Kemanan Data Lebih

ChatGPT Plus Terafiliasi Canva: Kemudahan Mendesain Apapun, Kecuali Mendesain Masa Depanmu

Batas Waktu Pelarangan TikTok Berlaku 5 April 2025, Apa yang Terjadi Selanjutnya?

Hyundai Ungkap IONIQ 6 dan IONIQ 6 N Line dengan Desain Terbaru

Spek Lengkap POCO M7 Pro 5G, Didukung Aplikasi Google Gemini

Elon Musk Sebut xAI Telah Resmi Mengakuisisi X

Kebijakan Tarif Trump Gemparkan Pasar Keuangan Global

Nintendo Switch 2 akan Dijual Seharga Rp7 Jutaan, Rilis 5 Juni 2025

Generator Gambar ChatGPT Sekarang Tersedia untuk Semua Pengguna Gratis

Grab Dilaporkan akan Akuisisi Gojek: Butuh Dana Rp33 Triliun

Banyak Pemudik Naik Mobil, Pemberlakuan One Way atau Contra Flow Cuma di Jalan Tol Pendek

Hyundai IONIQ 5 Limited Edition Dipasarkan Khusus di Indonesia, Jumlahnya Hanya 50 Unit

Spek Lengkap dan Harga Earbud Sony WF-C710N, Punya 4 Varian Warna

Konsumsi Belanja Saat Lebaran Anjlok, Ekonomi Sedang Buruk?

Ducati XDiavel V4 Mulai Diproduksi, Sport Cruise Baru dengan Mesin V4 Granturismo

Banyak Pemudik Naik Mobil, Pemberlakuan One Way atau Contra Flow Cuma di Jalan Tol Pendek

Hyundai Ungkap IONIQ 6 dan IONIQ 6 N Line dengan Desain Terbaru