Baca Juga: Ditambahkan ChatGPT, MyTelkomsel Veronika Lebih Pintar
OpenAI meluncurkan versi baru layanan untuk super chatbot mereka, ChatGPT.
Layanan terbarunya memungkinkan pengguna untuk mengaktifkan bot AI itu, tidak hanya dengan mengetikkan kalimat ke dalam prompt perintah, tetapi juga dengan berbicara dengan suara keras atau hanya mengunggah gambar.
Ini mungkin mengingatkan kita dengan Asisten Google dan Google Lens, tapi coba kita baca dulu seperti apa penjelasan dari OpenAI.
OpenAI menyatakan bahwa lewat pembaruan ini, mereka menawarkan jenis antarmuka baru yang lebih intuitif dan model yang ditingkatkan.
"Kami meluncurkan [kemampuan perintah] suara dan gambar di ChatGPT kepada pengguna Plus dan Enterprise selama dua pekan ke depan. [Perintah] suara akan hadir di iOS dan Android, kemudian gambar akan tersedia di semua platform," kata OpenAI, seperti dikutip Selasa (26/9/2023).
Menggunakan Perintah Suara
Ketuk tombol yang dilengkapi dengan logo mikrofon, lalu ucapkan pertanyaan atau perintah yang ingin kamu sampaikan.
ChatGPT akan mengubahnya menjadi teks dan memasukkannya ke model bahasa besar. Kemudian, kamu mendapatkan jawaban, sistem mengubahnya kembali menjadi ucapan, dan mengucapkan jawabannya dengan lantang.
"Kami berkolaborasi dengan pengisi suara profesional untuk menciptakan setiap suara. Kami juga menggunakan Whisper, sistem pengenalan ucapan sumber terbuka kami, untuk menyalin kata-kata yang Anda ucapkan ke dalam teks," terang perusahaan.
Untuk fitur suara, pengguna bisa memilih satu dari lima suara berbeda untuk didengarkan. Kemampuan suara baru ini didukung oleh model text-to-speech baru, yang mampu menghasilkan audio mirip manusia hanya dari teks dan contoh ucapan beberapa detik.
OpenAI bekerja sama dengan Spotify, untuk menerjemahkan siniar ke bahasa lain, misalnya, sambil tetap mempertahankan suara podcaster.
Baca Juga: Free Fire x Demon Slayer: Dapatkan Item Terbatas dengan Menjalankan Misi Khusus, Mulai Hari Ini!
Menggunakan Perintah Gambar
Untuk memulai, ketuk tombol foto untuk mengambil atau memilih gambar. Jika kamu menggunakan iOS atau Android, ketuk tombol plus terlebih dahulu.
Kamu juga dapat mendiskusikan banyak gambar atau menggunakan alat menggambar yang dimiliki ChatGPT untuk memandu asisten.
Pemahaman gambar didukung oleh multimodal GPT-3.5 dan GPT-4. Model ini menerapkan keterampilan penalaran bahasanya pada berbagai macam gambar, seperti foto, tangkapan layar, dan dokumen yang berisi teks dan gambar.
Baca Juga: Tomps, Platform Digital yang Bantu Kelola Aset Perusahaan Jadi lebih Mudah
Kemampuan Dibangun Bertahap
OpenAI mengaku, perusahaan pada dasarnya ingin membangun Artificial General Intelligence (AGI) yang aman dan bermanfaat. Hal itu jadi alasan mereka menerapkan kemampuan perintah gambar dan suara ini secara bertahap.
Dengan demikian, memungkinkan perusahaan memperbaiki dan menyempurnakan mitigasi risiko dari waktu ke waktu, sekaligus mempersiapkan semua orang untuk sistem yang lebih kuat di masa depan.
Strategi ini menjadi lebih penting dengan model-model canggih yang melibatkan suara dan visi.
"Pengguna mungkin bergantung pada ChatGPT untuk topik khusus, misalnya di bidang seperti penelitian. Kami transparan mengenai keterbatasan model dan tidak menyarankan kasus penggunaan berisiko tinggi tanpa verifikasi yang tepat," terdengar seperti 'disclaimer' dari OpenAI.
Selain itu, model ini mahir dalam menyalin teks bahasa Inggris, namun performanya buruk pada beberapa bahasa lain, terutama yang menggunakan aksara non-romawi. OpenAI menyarankan pengguna non-Inggris agar tidak menggunakan ChatGPT untuk tujuan tersebut.
Baca Juga: Spotify Rilis Jam: Pengguna Lain Bisa Sumbang Lagu ke Playlist