Mengenal DeepSeek: Perusahaan AI yang Viral karena Mampu Saingi OpenAI

DeepSeek. (Sumber: istimewa)

Techverse.asia - DeepSeek, perusahaan Artificial Intelligence (AI) atau kecerdasan buatan yang kini sedang naik daun, telah merilis serangkaian model AI multimoda baru yang diklaim dapat mengungguli DALL-E 3 milik OpenAI.

Model-model tersebut, yang sudah tersedia untuk diunduh (download) dari platform pengembangan AI Hugging Face, merupakan bagian dari keluarga model baru yang disebut DeepSeek sebagai Janus-Pro. Ukurannya berkisar antara satu miliar hingga tujuh miliar parameter.

Baca Juga: Pemerintah Perlu Evaluasi Kebijakan Literasi Digital yang Telah Dilakukan Komdigi

Parameter secara kasar sesuai dengan keterampilan pemecahan masalah suatu model, dan model dengan lebih banyak parameter umumnya berkinerja lebih baik daripada model dengan lebih sedikit parameter. Janus-Pro berada di bawah lisensi MIT, yang berarti dapat digunakan secara komersial tanpa batasan.

Janus-Pro, yang digambarkan DeepSeek sebagai 'kerangka kerja autoregresif baru,' dapat menganalisis dan membuat gambar baru. Menurut perusahaan, pada dua tolok ukur evaluasi AI, GenEval dan DPG-Bench, model Janus-Pro terbesar, Janus-Pro-7B, mengalahkan DALL-E 3 serta model seperti PixArt-alpha, Emu3-Gen, dan Stable Diffusion XL dari Stability AI.

Memang, beberapa model tersebut tergolong lawas, dan sebagian besar model Janus-Pro hanya dapat menganalisis gambar kecil dengan resolusi hingga 384x384 piksel. Namun, kinerja Janus-Pro sangat mengesankan, mengingat ukuran model yang ringkas.

“Janus-Pro melampaui model terpadu sebelumnya dan menyamai atau melampaui kinerja model khusus tugas. Kesederhanaan, fleksibilitas tinggi, dan efektivitas Janus-Pro menjadikannya kandidat kuat untuk model multimoda terpadu generasi berikutnya,” tulis DeepSeek dalam sebuah posting di Hugging Face kami kutip, Rabu (29/1/2025).

Baca Juga: Alibaba Cloud Memperkenalkan Model AI Image Generation, Tongyi Wanxiang

Di sisi lain, DeepSeek telah menjadi aplikasi gratis dengan peringkat teratas di App Store Apple di Amerika Serikat (AS) dan tempat lain, mengalahkan ChatGPT dan pesaing lainnya.

Aplikasi ini didukung oleh model DeepSeek V3 sumber terbuka (open-source), yang kabarnya membutuhkan daya komputasi yang jauh lebih sedikit daripada pesaing dan dikembangkan dengan biaya di bawah US$6 juta atau sekitar Rp97,1 miliar, menurut klaim perusahaan tersebut.

Pada saat yang sama, aplikasi ini menawarkan kinerja yang setara dengan Claude-3.5, GPT-4o, dan pesaing lainnya. DeepSeek sendiri berkantor pusat di Hangzhou, China dan didirikan pada 2023 oleh Liang Wenfeng, yang juga meluncurkan dana lindung nilai yang mendukung DeepSeek.

Untuk mengembangkan teknologi tersebut, ia dilaporkan menimbun cip Nvidia A100 sebelum larangan ekspor yang diberlakukan oleh AS dan memasangkannya dengan cip yang kurang bertenaga yang masih dapat diimpor.

Baca Juga: OpenAI Akhirnya Merilis Sora, Harus Langganan ChatGPT Plus dan Pro

Namun demikian, DeepSeek masih memiliki kerugian perangkat keras (hardware) yang signifikan dibandingkan dengan model pesaing dari OpenAI, Google, dan lainnya.

Hal itu memaksa perusahaan untuk lebih efisien dengan model kecerdasan buatannya, dan konon perusahaan itu mampu membangun dan melatihnya dengan biaya yang jauh lebih rendah daripada yang diperkirakan sebelumnya.

DeepSeek menggunakan perangkat lunak canggih

Model AI generatif didukung oleh GPU Nvidia. Chatbot arus utama dari OpenAI, Google, dan Anthropic menggunakan lebih dari setengah juta GPU ini.

Pembatasan ekspor AS pada teknologi canggih berarti bahwa DeepSeek hanya mampu memperoleh sekitar 50 ribu GPU, yang berarti perusahaan itu memberikan hasil yang sebanding dengan hanya 10 persen dari daya pemrosesan.

Baca Juga: Chatbot Claude dari Anthropic Bisa Diunduh di Android, Ini Bedanya dengan ChatGPT

Wired melaporkan bahwa hal ini memaksa perusahaan Negeri Tirai Bambu itu untuk fokus pada perangkat lunak (software).

“Tidak seperti banyak perusahaan AI China yang sangat bergantung pada akses ke perangkat keras canggih, DeepSeek telah berfokus pada memaksimalkan pengoptimalan sumber daya yang digerakkan oleh software,” jelas Marina Zhang, seorang profesor madya di University of Technology Sydney, yang mempelajari inovasi China.

Tags :
BERITA TERKAIT
BERITA TERKINI