Google Bard Bisa Hasilkan Gambar Fotorealistik Hanya Lewat Perintah Tulisan

gambar AI dengan perintah prompt "Tulis postingan media sosial dan buat gambar menggiurkan yang dapat saya gunakan untuk festival sayap kerbau" (Sumber: Google.com)

Google Bard, asisten digital bertenaga Artificial Intelligence (AI) milik Google, diberikan kemampuan baru untuk dapat menghasilkan gambar; bersamaan dengan keterampilan pemrosesan bahasanya.

"Pembuatan gambar di Bard akan tersedia gratis di sebagian besar negara secara global, didukung oleh model Imagen 2 Google yang diperbarui," ungkap laman blog Google.com, dilansir Jumat (2/2/2024).

Jadi, pemilik akun Google Bard dapat membuat visual khusus berdasarkan deskripsi yang diberikan kepada Bard. Dari konsep sederhana hingga pemandangan yang rumit, Google berjanji bahwa Bard memberikan 'hasil fotorealistik berkualitas tinggi.'

Tetapi, sebagai upaya untuk membantu masyarakat membedakan karya original dan kecerdasan buatan (AI), maka Google akan menyematkan tanda air pada hasil gambar. Watermark yang disematkan dengan SynthID itu dapat diidentifikasi secara digital pada tingkat piksel.

Baca Juga: Apple Menjadwalkan Peluncuran Fitur AI Generatif Akhir Tahun Ini

Untuk dorongan kreatif ekstra, pengguna bisa menghasilkan gambar dalam Bard yang berbahasa Inggris, tanpa biaya.

Kemampuan baru ini didukung oleh model Imagen 2, yang dirancang untuk menyeimbangkan kualitas dan kecepatan, menghasilkan keluaran fotorealistik berkualitas tinggi.

Jika tertarik menerapkannya, maka kita cukup mengetik deskripsi di kolom promt, misalnya: 'buat gambar anjing yang sedang menaiki papan selancar.' Kemudian Bard akan menghasilkan visual khusus dan luas, untuk membantu mewujudkan ide kita tadi.

Bard miliki fitur membuat gambar dari perintah tulisan (sumber: Google.com)

Imagen adalah sistem kecerdasan buatan atau Artificial Intelligence (AI) yang dikembangkan oleh Google, yang membuat gambar fotorealistik dari teks input. Dengan kata lain, ini adalah tools AI generatif yang mampu membuat ulang sebuah gambar hanya dengan bantuan satu kalimat.

Sistem pada Imagen bekerja dengan tingkat pemahaman bahasa yang mendalam. Imagen dibangun di atas kekuatan model bahasa transformator besar dalam memahami teks.

Seperti telah dijelaskan di atas tadi, kini Imagen telah diperbarui dalam Imagen 2.

Baca Juga: Ortuseight Catalyst Legion V4, Sepatu Sepak Bola untuk Berbagai Medan Lapangan

Baca Juga: Amazon Hadirkan Rufus, Asisten Belanja Bertenaga AI

Batasan teknis dan investasi Google dalam keamanan data pelatihan bahasa Imagen 2 berupaya membatasi konten kekerasan, ofensif, atau seksual vulgar.

"Selain itu, kami menerapkan filter yang dirancang untuk menghindari pembuatan gambar orang yang disebutkan namanya. Kami akan terus berinvestasi dalam teknik baru, untuk meningkatkan keamanan dan perlindungan privasi model kami," lanjut Google.

gambar AI dengan perintah prompt "Hasilkan gambar peragaan busana dalam seni digital gaya steampunk. Perbesar wajah mereka" (sumber: Google.com)

Pembaruan terbaru pada Bard juga menghadirkan model Gemini Pro AI Google. Jika sebelumnya hanya tersedia dalam bahasa Inggris, kini tersedia lebih dari 40 bahasa dan lebih dari 230 negara dan wilayah. Ini menandai tonggak penting dalam aksesibilitas Bard di seluruh dunia.

Google mengatakan, Gemini Pro meningkatkan pemahaman, penalaran, merangkum, dan kemampuan pengodean Bard.

Google merilis Gemini, model bahasa besar yang paling mumpuni dan canggih hingga saat ini, yang kali pertama diumumkan pada Mei 2023 di Google I/O.

Bersamaan dengan peluncuran LLM adalah pengumuman bahwa pengguna akan dapat merasakan versi Gemini Pro untuk Bahasa Inggris, yang disetel secara khusus di Google Bard.

Gemini Pro mengacu pada ukuran Gemini, yang dirilis dalam tiga ukuran berbeda: Gemini Ultra, Gemini Pro, dan Gemini Nano. Setiap ukuran membuat Gemini cocok untuk tugas yang berbeda.

Baca Juga: POCO M6 Pro Meluncur di Indonesia, Gunakan Chipset Helio G99-Ultra

Gemini Nano dianggap paling efisien untuk tugas pada perangkat; Gemini Pro adalah model terbaik untuk menskalakan berbagai tugas; dan Gemini Ultra adalah yang paling canggih, menjadikannya versi paling cocok untuk tugas-tugas kompleks, menurut Google.

Awal tahun depan, Google berencana memperkenalkan Bard Advanced, yang akan didukung oleh versi paling canggih dari Gemini Ultra. Diklaim mampu memahami dan bertindak dengan cepat pada input multimodal seperti teks, gambar, audio, video, dan kode.

"Hanya saja,sebelum meluncurkan Bard Advanced, perusahaan akan menyelesaikan pemeriksaan keamanan ekstensif terlebih dahulu dan meluncurkan program penguji tepercaya," tulis ZDnet.

Baca Juga: Bitcoin Masih Jadi Kripto Paling Dominan di Pasar

Tags :
BERITA TERKAIT
BERITA TERKINI