Kini ChatGPT Bisa Menerima Perintah Tulisan, Suara, dan Gambar

Uli Febriarni
Selasa 26 September 2023, 19:29 WIB
simulasi penggunaan ChatGPT dengan memberikan perintah gambar (Sumber: OpenAI)

simulasi penggunaan ChatGPT dengan memberikan perintah gambar (Sumber: OpenAI)

Baca Juga: Ditambahkan ChatGPT, MyTelkomsel Veronika Lebih Pintar

OpenAI meluncurkan versi baru layanan untuk super chatbot mereka, ChatGPT.

Layanan terbarunya memungkinkan pengguna untuk mengaktifkan bot AI itu, tidak hanya dengan mengetikkan kalimat ke dalam prompt perintah, tetapi juga dengan berbicara dengan suara keras atau hanya mengunggah gambar.

Ini mungkin mengingatkan kita dengan Asisten Google dan Google Lens, tapi coba kita baca dulu seperti apa penjelasan dari OpenAI

OpenAI menyatakan bahwa lewat pembaruan ini, mereka menawarkan jenis antarmuka baru yang lebih intuitif dan model yang ditingkatkan.

"Kami meluncurkan [kemampuan perintah] suara dan gambar di ChatGPT kepada pengguna Plus dan Enterprise selama dua pekan ke depan. [Perintah] suara akan hadir di iOS dan Android, kemudian gambar akan tersedia di semua platform," kata OpenAI, seperti dikutip Selasa (26/9/2023).

Menggunakan Perintah Suara

Ketuk tombol yang dilengkapi dengan logo mikrofon, lalu ucapkan pertanyaan atau perintah yang ingin kamu sampaikan.

ChatGPT akan mengubahnya menjadi teks dan memasukkannya ke model bahasa besar. Kemudian, kamu mendapatkan jawaban, sistem mengubahnya kembali menjadi ucapan, dan mengucapkan jawabannya dengan lantang.

"Kami berkolaborasi dengan pengisi suara profesional untuk menciptakan setiap suara. Kami juga menggunakan Whisper, sistem pengenalan ucapan sumber terbuka kami, untuk menyalin kata-kata yang Anda ucapkan ke dalam teks," terang perusahaan.

Untuk fitur suara, pengguna bisa memilih satu dari lima suara berbeda untuk didengarkan. Kemampuan suara baru ini didukung oleh model text-to-speech baru, yang mampu menghasilkan audio mirip manusia hanya dari teks dan contoh ucapan beberapa detik.

OpenAI bekerja sama dengan Spotify, untuk menerjemahkan siniar ke bahasa lain, misalnya, sambil tetap mempertahankan suara podcaster

Baca Juga: Free Fire x Demon Slayer: Dapatkan Item Terbatas dengan Menjalankan Misi Khusus, Mulai Hari Ini!

Menggunakan Perintah Gambar

Untuk memulai, ketuk tombol foto untuk mengambil atau memilih gambar. Jika kamu menggunakan iOS atau Android, ketuk tombol plus terlebih dahulu.

Kamu juga dapat mendiskusikan banyak gambar atau menggunakan alat menggambar yang dimiliki ChatGPT untuk memandu asisten.

Pemahaman gambar didukung oleh multimodal GPT-3.5 dan GPT-4. Model ini menerapkan keterampilan penalaran bahasanya pada berbagai macam gambar, seperti foto, tangkapan layar, dan dokumen yang berisi teks dan gambar.

Baca Juga: Tomps, Platform Digital yang Bantu Kelola Aset Perusahaan Jadi lebih Mudah

Kemampuan Dibangun Bertahap

OpenAI mengaku, perusahaan pada dasarnya ingin membangun Artificial General Intelligence (AGI) yang aman dan bermanfaat. Hal itu jadi alasan mereka menerapkan kemampuan perintah gambar dan suara ini secara bertahap.

Dengan demikian, memungkinkan perusahaan memperbaiki dan menyempurnakan mitigasi risiko dari waktu ke waktu, sekaligus mempersiapkan semua orang untuk sistem yang lebih kuat di masa depan.

Strategi ini menjadi lebih penting dengan model-model canggih yang melibatkan suara dan visi.

"Pengguna mungkin bergantung pada ChatGPT untuk topik khusus, misalnya di bidang seperti penelitian. Kami transparan mengenai keterbatasan model dan tidak menyarankan kasus penggunaan berisiko tinggi tanpa verifikasi yang tepat," terdengar seperti 'disclaimer' dari OpenAI.

Selain itu, model ini mahir dalam menyalin teks bahasa Inggris, namun performanya buruk pada beberapa bahasa lain, terutama yang menggunakan aksara non-romawi. OpenAI menyarankan pengguna non-Inggris agar tidak menggunakan ChatGPT untuk tujuan tersebut.

Baca Juga: Spotify Rilis Jam: Pengguna Lain Bisa Sumbang Lagu ke Playlist

Follow Berita Techverse.Asia di Google News
Berita Terkait Berita Terkini
Techno22 Januari 2025, 22:43 WIB

Instagram Hadirkan 2 Pembaruan untuk Reels dan Postingan Berubah Jadi Persegi Panjang

Reels kini bisa menggungah konten dengan durasi sampai tiga menit, padahal sebelumnya cuma 90 detik.
Instagram Reels sekarang bisa unggah video selama tiga menit. (Sumber: Instagram)
Automotive22 Januari 2025, 22:11 WIB

Toyota Hilux Rangga SUV Concept Hasil Karoseri New Armada, Bisa Muat 8 Penumpang

Kendaraan ini menawarkan Pilihan Basis dari 3 Tipe Hilux Rangga.
Toyota Hilux Rangga SUV Concept. (Sumber: Toyota)
Startup22 Januari 2025, 18:56 WIB

Openspace Ventures Beri Pendanaan Lanjutan untuk MAKA Motors

Pendanaan ini datang setelah startup tersebut melansir motor listrik pertamanya, MAKA Cavalry.
MAKA Cavalry.
Techno22 Januari 2025, 18:34 WIB

Huawei FreeBuds SE 3: TWS Entry-level Seharga Rp400 Ribuan

Gawai ini akan menghadirkan keseimbangan sempurna antara performa dan kenyamanan.
Huawei FreeBuds SE 3. (Sumber: Huawei)
Techno22 Januari 2025, 16:28 WIB

Apa yang Diharapkan pada Samsung Galaxy Unpacked 2025, Bakal Ada S25 Slim?

Galaxy Unpacked Januari 2025: Lompatan Besar Berikutnya dalam Pengalaman AI Seluler.
Samsung Galaxy Unpacked 2025 akan digelar pada Rabu (22/1/2025). (Sumber: Samsung)
Startup22 Januari 2025, 16:02 WIB

Antler Salurkan Pendanaan Senilai Rp49 Miliar kepada 25 Startup Tahap Awal di Indonesia

Antler Pertahankan Momentum Kuat di Indonesia, Mencatatkan 50 Investasi Selama Dua Tahun Terakhir Di Tengah Tantangan Pasar.
Antler. (Sumber: antler)
Automotive22 Januari 2025, 15:33 WIB

Harga dan Spesifikasi New Yamaha R25, Bawa Kapasitas Mesin 250CC

Tampil Sebagai Urban Super Sport, New Yamaha R25 Siap Geber Maksimal.
Yamaha R25 2025. (Sumber: Yamaha)
Techno22 Januari 2025, 14:51 WIB

Tak Disebut Pada Pelantikan Presiden AS Donald Trump, Bagaimana Nasib Bitcoin?

Bitcoin terkoreksi ke US$100 ribu pasca Presiden AS Donald Trump tidak menyebut soal kripto pada sesi pelantikan.
ilustrasi bitcoin (Sumber: freepik)
Techno21 Januari 2025, 18:55 WIB

Insta360 Luncurkan Flow 2 Pro, Tripod Khusus untuk iPhone

Gimbal ini memungkinkan pembuatan film menggunakan kamera iPhone dan punya fitur-fitur AI.
Insta360 Flow 2 Pro. (Sumber: Insta360)
Techno21 Januari 2025, 18:37 WIB

Fossibot S3 Pro: Ponsel Entry Level dengan Pengaturan Layar Ganda

Gawai ini menawarkan fitur premium, tapi harganya ramah di kantong.
Fossibot S3 Pro. (Sumber: istimewa)