Google Mendebutkan Gemini 1.5 Flash dan Jajaran Model Gemma Terbaru

Gemini 1.5 Flash (Sumber: Google)

Google menyatakan mereka bakal mendebutkan Gemini 1.5 Flash dan pembaruan untuk Gemini 1.5 Pro, di tengah Google I/O 2024.

Model AI baru yang disebut Gemini 1.5 Flash, dikatakan Google telah dioptimalkan untuk kecepatan dan efisiensi.

Baca Juga: Netflix Membangun Server Iklannya Sendiri

CEO Google DeepMind, Demis Hassabis, menjelaskan bahwa Flash berada di antara Gemini 1.5 Pro dan Gemini 1.5 Nano, yang merupakan model terkecil perusahaan yang berjalan secara lokal di perangkat.

Google menciptakan Flash karena pengembang menginginkan model yang lebih ringan dan lebih murah daripada Gemini Pro, untuk membangun aplikasi dan layanan yang didukung AI, sambil mempertahankan beberapa hal seperti jendela konteks panjang satu juta token yang membedakan Gemini Pro dari model pesaing.

"Akhir tahun ini, Google akan menggandakan jendela konteks Gemini menjadi dua juta token, yang berarti Google akan mampu memproses dua jam video, 22 jam audio, lebih dari 60.000 baris kode, atau lebih dari 1,4 juta kata secara bersamaan," kata dia, seperti dikutip dari keterangannya, Kamis (16/5/2024).

Demis menyebut, baik 1.5 Pro dan Gemini 1.5 Flash tersedia dalam pratinjau publik dengan jendela konteks 1 juta token di Google AI Studio dan Vertex AI.

Ia menambahkan, meskipun model ini lebih ringan dibandingkan 1.5 Pro, model ini sangat mampu melakukan penalaran multimodal pada sejumlah besar informasi, dan memberikan kualitas yang mengesankan untuk ukurannya.

Gemini 1.5 Flash unggul dalam peringkasan, aplikasi obrolan, pembuatan teks gambar dan video, ekstraksi data dari dokumen dan tabel panjang, dan banyak lagi. Hal ini karena model ini telah dilatih oleh 1.5 Pro melalui proses yang disebut 'distilasi', yang mana pengetahuan dan keterampilan paling penting dari model yang lebih besar ditransfer ke model yang lebih kecil dan lebih efisien.

Menurut perusahaan, selain memperluas jendela konteksnya hingga 2 juta token, mereka telah meningkatkan pembuatan kode, penalaran dan perencanaan logis, percakapan multi-putaran, serta pemahaman audio dan gambar melalui kemajuan data dan algoritmik.

Baca Juga: Casio Rilis G-SHOCK x Surfrider Foundation dan Baby-G Two-Way

Baca Juga: Fitur Shot Suggestion di Galaxy A35 5G, Dibekali Machine Learning untuk Bantu Hasilkan Foto Oke

Mereka juga telah meningkatkan kontrol atas respons model untuk kasus penggunaan tertentu, seperti menyusun persona dan gaya respons agen obrolan atau mengotomatiskan alur kerja melalui beberapa panggilan fungsi.

"Dan kami telah memungkinkan pengguna untuk mengarahkan perilaku model dengan menetapkan instruksi sistem. Kami menambahkan pemahaman audio di Gemini API dan Google AI Studio, sehingga 1.5 Pro kini dapat mempertimbangkan seluruh gambar dan audio untuk video yang diunggah di Google AI Studio," lanjut Demis.

Gemini 1.5 Pro kini dapat mengikuti instruksi yang semakin kompleks dan beragam, termasuk instruksi yang menentukan perilaku tingkat produk yang melibatkan peran, format, dan gaya.

"Kami telah meningkatkan kontrol atas respons model untuk kasus penggunaan tertentu, seperti menyusun persona dan gaya respons agen obrolan atau mengotomatiskan alur kerja melalui beberapa panggilan fungsi," imbuh Demis.

Google telah memungkinkan pengguna 1.5 Pro untuk mengarahkan perilaku model dengan menetapkan instruksi sistem.

Mereka juga menambahkan pemahaman audio di Gemini API dan Google AI Studio, sehingga 1.5 Pro kini dapat mempertimbangkan seluruh gambar dan audio untuk video yang diunggah di Google AI Studio.

Baca Juga: Honor of Kings akan Rilis Global Mulai 20 Juni 2024 untuk Perangkat Seluler

1.5 Pro telah diintegrasikan pula ke dalam produk Google, termasuk Gemini Advanced dan aplikasi Workspace.

Berikutnya terkait dua model terbaru Gemma, Google menyebutnya sebagai model terbuka generasi berikutnya untuk inovasi AI yang bertanggung jawab.

VP, ML Developer Google, Mat Velloso, mengungkap bahwa Gemma 2 memiliki arsitektur baru yang dirancang untuk terobosan kinerja dan efisiensi, dan akan tersedia dalam ukuran baru.

Jajaran Gemma juga berkembang dengan PaliGemma, model bahasa visi pertama Google yang terinspirasi oleh PaLI-3. Mereka juga telah meningkatkan Perangkat AI Generatif yang Bertanggung Jawab (Responsible Generative AI Toolkit), dengan LLM Comparator untuk mengevaluasi kualitas respons model.

Tags :
BERITA TERKAIT
BERITA TERKINI