Google Hadirkan Obrolan Suara Gemini Live, Tandingan ChatGPT Advanced Voice Mode?

Gemini mendapatkan mode obrolan suara baru. (Sumber: Google)

Techverse.asia - Google meluncurkan mode obrolan suara baru untuk Gemini, yang disebut Gemini Live, perusahaan tersebut mengumumkannya di acara Pixel 9 yang bertajuk Made by Google pada hari ini.

Tersedia untuk pelanggan Gemini Advanced, cara kerjanya sangat mirip dengan fitur obrolan suara ChatGPT, dengan beberapa suara untuk dipilih dan kemampuan untuk berbicara secara percakapan, bahkan sampai menyela tanpa mengetuk tombol.

Google mengatakan bahwa percakapan dengan Gemini Live dapat mengalir bebas, jadi pengguna dapat melakukan hal-hal seperti menyela jawaban di tengah kalimat atau menjeda percakapan dan kembali lagi nanti. Gemini Live juga akan berfungsi di latar belakang atau saat ponsel terkunci.

Baca Juga: Google Pixel Buds Pro 2: Earbud Pertama yang Bekerja dengan Gemini AI

Gemini Live memungkinkan pengguna melakukan obrolan suara "mendalam" dengan Gemini, chatbot bertenaga AI generatif Google, di smartphone mereka.

Berkat mesin ucapan yang disempurnakan yang memberikan apa yang diklaim Google sebagai dialog multi-putaran yang lebih konsisten, ekspresif secara emosional, dan realistis, orang dapat menyela Gemini saat chatbot berbicara untuk mengajukan pertanyaan lanjutan, dan chatbot akan beradaptasi dengan pola bicara mereka secara real-time.

Berikut cara Google mendeskripsikannya dalam sebuah posting blog: “Dengan Gemini Live (melalui aplikasi Gemini), Anda dapat berbicara dengan Gemini dan memilih dari (10) suara baru yang terdengar alami yang dapat ditanggapinya. Anda bahkan dapat berbicara dengan kecepatan Anda sendiri atau menyela di tengah tanggapan dengan pertanyaan klarifikasi, seperti yang Anda lakukan dalam percakapan apapun.”

Baca Juga: Google Pixel Watch 3 Hadir dalam 2 Ukuran, Punya Fitur Loss of Pulse Detection

Gemini Live bersifat hands-free jika menginginkannya. Pengguna dapat terus berbicara dengan aplikasi Gemini di latar belakang atau saat ponsel mereka terkunci, dan percakapan dapat dijeda dan dilanjutkan kapan saja.

Jadi, bagaimana ini dapat bermanfaat? Google memberikan contoh latihan untuk wawancara kerja. Gemini Live dapat berlatih dengan si pengguna, memberikan kiat berbicara dan menyarankan keterampilan untuk ditonjolkan saat berbicara dengan manajer perekrutan. Salah satu kelebihan Gemini Live dibandingkan ChatGPT Advanced Voice Mode adalah memori yang lebih baik.

Arsitektur model AI generatif yang mendukung Live, Gemini 1.5 Pro dan Gemini 1.5 Flash, memiliki 'jendela konteks' yang lebih panjang dari rata-rata. Artinya, mereka dapat menyerap dan menalar banyak data - secara teori, percakapan bolak-balik selama berjam-jam - sebelum menyusun respons.

Mengenai hal itu, Gemini Live belum memiliki salah satu kemampuan yang dipamerkan Google di I/O: input multimodal.

Baca Juga: Samsung Galaxy Z Fold 6 dan Z Flip 6 Hadir dengan Galaxy AI dan Google Gemini

Pada Mei 2024, Google merilis video prarekaman yang memperlihatkan Gemini Live melihat dan merespons lingkungan sekitar pengguna melalui foto dan rekaman yang diambil oleh kamera ponsel mereka - misalnya, menyebutkan bagian pada sepeda yang rusak atau menjelaskan fungsi sebagian kode pada layar komputer.

Input multimodal akan hadir 'akhir tahun ini,' kata Google, meski mereka menolak memberikan rinciannya. Akhir tahun ini, Gemini Live juga akan diperluas ke bahasa tambahan dan ke iOS melalui aplikasi Google; untuk sementara ini hanya tersedia dalam bahasa Inggris.

Gemini Live, seperti Advanced Voice Mode, tidak gratis. Fitur ini eksklusif untuk Gemini Advanced, versi Gemini yang lebih canggih yang dilindungi oleh Google One AI Premium Plan, dengan harga US$20 atau kurang lebih Rp300 ribuan per bulan. Akan tetapi, fitur Gemini baru lainnya yang akan segera hadir gratis.

Baca Juga: Honor Akan Tanamkan Google Gemini Pada Perangkat Terbaru, Termasuk Imagen 2

Pengguna Android akan segera (dalam beberapa minggu mendatang) dapat menampilkan overlay Gemini di atas aplikasi apapun yang mereka gunakan untuk mengajukan pertanyaan tentang apa yang ada di layar (misalnya video Youtube) dengan menahan tombol daya ponsel mereka atau mengucapkan, "Hai Google."

Google Gemini akan dapat menghasilkan gambar (tetapi sayangnya masih bukan gambar orang) langsung dari overlay - gambar yang dapat diseret dan dilepas ke aplikasi seperti Gmail dan Google Messages.

Tags :
BERITA TERKAIT
BERITA TERKINI