Mark Zuckerberg Sebut Meta Butuh Daya Komputasi Lebih Besar untuk Latih Llama 4

Rahmat Jiwandono
Rabu 21 Agustus 2024, 17:19 WIB
Meta Llama 3.

Meta Llama 3.

Techverse.asia - Meta, yang mengembangkan salah satu model bahasa sumber terbuka terbesar yang mendasar, Llama, yakin bahwa mereka akan membutuhkan daya komputasi yang jauh lebih besar untuk melatih model di masa mendatang.

Baca Juga: Samsung Odyssey 3D: Suguhkan Tampilan 3D Tanpa Perlu Pakai Kacamata

Mark Zuckerberg mengatakan pada panggilan pendapatan kuartal kedua (Q2) Meta menyampaikan bahwa untuk melatih Llama 4, perusahaan akan membutuhkan komputasi 10x lebih banyak daripada yang dibutuhkan untuk melatih Llama 3.

Kendati demikian, ia tetap ingin Meta membangun kapasitas untuk melatih model daripada tertinggal dari pesaingnya. “Jumlah komputasi yang dibutuhkan untuk melatih Llama 4 kemungkinan akan hampir 10 kali lebih banyak daripada yang kami gunakan untuk melatih Llama 3, dan model masa depan akan terus tumbuh melampaui itu,” kata Zuckerberg.

Sulit untuk memprediksi bagaimana tren ini akan berlanjut hingga beberapa generasi ke depan. Namun, pada titik ini, ia lebih suka mengambil risiko membangun kapasitas sebelum dibutuhkan daripada terlambat, mengingat waktu tunggu yang lama untuk meluncurkan proyek inferensi baru.

Baca Juga: EXAONE 3.0: Model AI Open Source LG yang Berbahasa Korea, Diklaim Tak Kalah dengan Meta Llama 3.1 dan Google Gemma 2

Meta merilis Llama 3 dengan delapan miliar parameter pada April tahun ini. Raksasa teknologi tersebut minggu lalu merilis versi model yang ditingkatkan, yang disebut Llama 3.1 405B, yang memiliki 405 miliar parameter, menjadikannya model sumber terbuka terbesar Meta.

Chief Financial Officer (CFO) Meta Susan Li juga mengatakan bahwa perusahaannya sedang memikirkan berbagai proyek pusat data dan membangun kapasitas untuk melatih model AI masa depan. Ia mengatakan Meta mengharapkan investasi ini akan meningkatkan belanja modal pada 2025.

Pelatihan model bahasa yang besar bisa menjadi bisnis yang mahal. Belanja modal Meta naik hampir 33 persen menjadi US$8,5 miliar pada Q2 2024, dari US$6,4 miliar setahun sebelumnya, didorong oleh investasi pada server, pusat data, dan infrastruktur jaringan.

Baca Juga: Vivo V40 Pro dan V40 Rilis Global, Tengok Harga dan Spek Lengkapnya

Menurut laporan dari The Information, OpenAI menghabiskan US$3 miliar untuk model pelatihan dan tambahan US$4 miliar untuk menyewa server dengan tarif diskon dari Microsoft.

“Seiring dengan peningkatan kapasitas pelatihan AI generatif untuk memajukan model dasar kami, kami akan terus membangun infrastruktur kami dengan cara yang memberi kami fleksibilitas dalam cara kami menggunakannya dari waktu ke waktu,” ujar Li.

Hal tersebut akan memungkinkan Meta untuk mengarahkan kapasitas pelatihan ke inferensi AI generatif atau ke pekerjaan pemeringkatan dan rekomendasi inti mereka, ketika perusahaan berharap hal itu akan lebih berharga.

Selama panggilan tersebut, Meta juga berbicara tentang penggunaan Meta AI yang berhadapan dengan konsumen dan mengatakan India adalah pasar terbesar untuk chatbot-nya. Namun, Li mencatat bahwa perusahaan tidak mengharapkan produk AI generatif untuk berkontribusi terhadap pendapatan secara signifikan.

Baca Juga: LLaMA: Kecerdasan Buatan Milik Meta untuk Bantu Para Peneliti

Sebelumnya, pada akhir Juli lalu, Meta meluncurkan model AI generatif Llama 3.1 atau yang juga disebut sebagai Llama 3.1 405B. Model Llama 3.1 405 B merupakan AI open source tingkat pertama, sedangkan pembaruan untuk kecerdasan buatan pada model Llama 3.1 70B dan 8B diberikan pembelajaran yang lebih baik.

Pendiri dan CEO Meta, Mark Zuckerberg, mengatakan bahwa selain memiliki biaya atau kinerja yang jauh lebih baik dibandingkan dengan model tertutup, fakta bahwa model 405B bersifat terbuka akan menjadikannya pilihan terbaik untuk menyempurnakan dan menyaring model yang lebih kecil.

Tahun lalu, Llama 2 hanya sebanding dengan model generasi lama yang berada di balik teknologi terdepan. Tahun ini, Llama 3 mampu bersaing dengan model-model tercanggih dan memimpin di beberapa area.

Baca Juga: Meta Menambahkan Chatbot Kecerdasan Buatannya yang Didukung Llama 3, Tersedia di 4 Aplikasinya

Follow Berita Techverse.Asia di Google News
Berita Terkait Berita Terkini
Techno05 April 2025, 11:11 WIB

Jiplak Fitur TikTok, Reels Instagram Kini Bisa Dipercepat Saat Dilihat

Instagram kini memungkinkan pengguna untuk mempercepat Reels seperti di TikTok.
Reels Instagram sekarang bisa dipercepat saat diputar. (Sumber: istimewa)
Lifestyle05 April 2025, 11:00 WIB

Casio G-SHOCK x Barbie Rilis Jam Tangan Serba Pink

Jam Tangan GMAS110BE-4A Edisi Terbatas Mengekspresikan Pandangan Dunia Barbie.
Casio G-SHOCK GMAS110BE-4A x Barbie. (Sumber: Casio)
Techno04 April 2025, 16:36 WIB

Batas Waktu Pelarangan TikTok Berlaku 5 April 2025, Apa yang Terjadi Selanjutnya?

Trump menegaskan bahwa TikTok harus menjual platform mereka agar bisa tetap beroperasi di AS.
TikTok.
Automotive04 April 2025, 16:12 WIB

Hyundai Ungkap IONIQ 6 dan IONIQ 6 N Line dengan Desain Terbaru

Dua mobil listrik baru tersebut diperkenalkan di Seoul Mobility Show 2025.
Hyundai IONIQ 6.
Techno04 April 2025, 15:37 WIB

Spek Lengkap POCO M7 Pro 5G, Didukung Aplikasi Google Gemini

Mendefinisikan Ulang Hiburan 5G dengan Gaya dan Harga Terjangkau untuk Generasi Berikutnya.
POCO M7 Pro 5G. (Sumber: POCO)
Startup04 April 2025, 15:15 WIB

Elon Musk Sebut xAI Telah Resmi Mengakuisisi X

Masa depan kedua perusahaan tersebut saling terkait.
Elon Musk (Sumber: Istimewa)
Techno04 April 2025, 14:28 WIB

Kebijakan Tarif Trump Gemparkan Pasar Keuangan Global

Hal ini berpotensi kembali memicu kenaikan inflasi dan akan semakin menunda dimulainya kembali tren penurunan suku bunga.
Presiden AS Donald Trump. (Sumber: null)
Techno03 April 2025, 16:29 WIB

Nintendo Switch 2 akan Dijual Seharga Rp7 Jutaan, Rilis 5 Juni 2025

Perusahaan tersebut mendalami perangkat keras, fitur, dan permainan selama Nintendo Direct yang sangat sukses.
Nintendo Switch 2. (Sumber: Nintendo)
Techno03 April 2025, 16:05 WIB

Generator Gambar ChatGPT Sekarang Tersedia untuk Semua Pengguna Gratis

Sekarang semua orang dapat membuat karya seni ChatGPT ala Studio Ghibli.
Logo OpenAI (Sumber: OpenAI)
Startup03 April 2025, 14:52 WIB

Grab Dilaporkan akan Akuisisi Gojek: Butuh Dana Rp33 Triliun

Yang jadi kekhawatiran atas akuisisi ini adalah terjadinya monopoli di sektor startup layanan ride hailing.
Grab (Sumber: GRAB)