Galaxy AI pada perangkat Samsung saat ini mendukung 16 bahasa, termasuk Bahasa Indonesia.
Berkat adanya pembaruan bahasa dalam fitur di Galaxy AI, ada lebih banyak orang yang kini dapat meningkatkan kemampuan berbahasa yang dimiliki secara langsung. Baik itu dengan mengoptimalkan fitur on-device translation seperti Live Translate, Interpreter, Note Assist, maupun Browsing Assist.
Namun sesungguhnya, apa saja yang dilibatkan dalam pengembangan bahasa dalam AI?
Lewat artikel kali ini, bersama dengan tim Samsung R&D Institute Indonesia (SRIN), kita akan mempelajari bagaimana seseorang mengajarkan kecerdasan buatan (AI) untuk berbicara dalam bahasa baru. Mereka inilah yang baru-baru ini telah berhasil menambahkan Bahasa Indonesia ke dalam Galaxy AI.
Baca Juga: Honda Super Cub C125 Punya Warna Pearl Cadet Gray
Menurut Head of AI di SRIN, Junaidillah Fadlil, langkah pertama yang perlu dilakukan adalah menetapkan target.
AI yang hebat dimulai dari dua hal: data yang berkualitas dan relevan.
"Setiap bahasa menuntut cara yang berbeda untuk memproses data. Jadi, kami menggali lebih dalam untuk memahami kebutuhan linguistik dan keunikan dari Bahasa Indonesia," ujarnya, dalam pernyataan tertulis diakses Sabtu (11/5/2024).
Fadlil menjelaskan, pengembangan bahasa lokal harus didasarkan pada pemahaman dan ilmu pengetahuan. Sehingga penambahan bahasa ke Galaxy AI dimulai dengan merencanakan informasi yang dibutuhkan oleh tim, secara legal dan etis.
Diperlukan sumber daya yang besar untuk bisa merencanakan pengembangan banyak data, maka SRIN bekerja sama dengan para ahli linguistik di Indonesia.
"Tantangan ini membutuhkan kombinasi kreativitas, ketangkasan, dan keahlian dalam Bahasa Indonesia dan machine learning," imbuhnya.
Baca Juga: Akhir Pekan Masih Kerja: Kamu Pekerja Keras Atau Gila Kerja?
Baca Juga: Huawei Eyewear 2 Meluncur dengan Warna Hitam dan Bingkai Bergaya
Ia menilai, filosofi Samsung yang terus membuka ruang kolaborasi, memainkan peran penting dalam menyelesaikan pekerjaan ini, bersama dengan skala pekerjaan dan sejarah pengembangan AI yang mereka miliki.
Lebih dalam ia mengungkap, bagi tim, proyek penambahan Bahasa Indonesia pada Galaxy AI memiliki makna yang baru. Tim di SRIN mengaku bangga dengan pencapaian mereka, apalagi ini adalah proyek AI pertama mereka.
"Tentunya, ini bukan yang terakhir karena kami akan terus menyempurnakan dan meningkatkan kualitas model AI kami. Perluasan ini tidak hanya mencerminkan nilai-nilai kami, tetapi juga menghormati serta mengintegrasikan identitas budaya Indonesia melalui bahasa," demikian ia menutup pandangannya.
Fitur-fitur Galaxy AI seperti Live Translate menjalankan tiga proses inti: pengenalan ucapan otomatis (automatic speech recognition/ASR), mesin terjemahan (neural machine translation/NMT), dan teks-ke-suara (text-to-speech/TTS). Masing-masing proses tersebut memerlukan kumpulan informasi yang unik.
Baca Juga: Spek Lengkap Vivo V30e: Pakai Prosesor Snapdragon 6 Gen 1
Pemimpin tim ASR, Muchlisin Adi Saputra, menjelaskan perihal Automatic Speech Recognition. Yang mana pengembangkan fitur ini membutuhkan rekaman suara yang mencakup beragam situasi di berbagai kondisi, dan setiap rekaman dilengkapi transkripsi teks yang akurat.
"Tingkat kebisingan rekaman suara yang bervariasi membantu mengakomodasi kondisi lingkungan yang berbeda. Tidak cukup hanya menambahkan suara lalu lintas jalan raya ke rekaman," ungkap Saputra.
Selain data yang mereka peroleh secara legal dari pihak ketiga, tim Saputra harus pergi ke kafe atau lingkungan kerja untuk merekam suara mereka sendiri.
Baca Juga: Google Izinkan Pengguna Pakai AI untuk Membuat Rencana Perjalanan Liburan
Baca Juga: Google Cloud Hadirkan Pelatihan Online Gratis Bersertifikat Global
"Hal ini memungkinkan kami untuk bisa menangkap suara-suara autentik yang unik dari kehidupan sehari-hari, seperti orang yang sedang memanggil atau ketikan keyboard," imbuhnya.
"Sifat bahasa yang dinamis dan selalu berubah juga harus dipertimbangkan. Kami perlu terus memperbarui bahasa slang terbaru dan cara penggunaannya. Kami banyak temukan dari media sosial," terangnya lebih jauh.
Dalam pengembangannya, Neural Machine Training juga membutuhkan data untuk melatih terjemahan.
Situasi itu kemudian membuat pemimpin Tim NMT, Muhammad Faisal, melihat bahwa menerjemahkan Bahasa Indonesia penuh dengan tantangan.
"Penggunaan makna kontekstual dan implisit yang luas bergantung pada petunjuk sosial dan situasional. Data yang digunakan harus berisi banyak teks terjemahan, sebagai referensi bagi AI untuk memahami kata-kata baru, kata-kata asing, kata benda, dan angka," tuturnya.
Faisal menyebut, semua informasi tadi dibutuhkan untuk membantu AI memahami konteks dan aturan komunikasi.
Baca Juga: Yellow.ai Lansir Orchestrator LLM: Kemampuan Percakapan Pelanggan yang Kontekstual
Sementara itu, Text To Speech (TTS) memerlukan rekaman yang melibatkan berbagai macam suara dan nada, dengan konteks tambahan tentang bagaimana setiap kata terdengar dalam situasi yang berbeda.
Terkait itu, pemimpin pengembangan fitur TTS, Harits Abdurrohman akan menerangkan lebih lanjut.
Rekaman suara yang baik mempercepat pekerjaan yang dilakukan, karena mencakup satuan bunyi terkecil yang diperlukan AI untuk membedakan makna, kata dia.
"Setelah mendapat rekaman suara yang baik pada fase awal, kami dapat fokus pada tahap selanjutnya, yaitu penyempurnaan model AI, agar dapat mengucapkan setiap kata dengan jelas," pungkas Harits.
Berkolaborasi dengan sejumlah pusat penelitian Samsung di seluruh dunia, turut membuat tim SRIN mampu dengan cepat mengadopsi praktik terbaik, dan mengatasi tantangan kompleks dalam menetapkan target data.
Selain itu, ketika tim SRIN bergabung dengan rekan-rekan di Bangalore, India, mereka mengamati tradisi lokal dan menjalin ikatan layaknya keluarga, membangun koneksi yang lebih dalam dan mengembangkan pemahaman mereka tentang kebudayaan yang berbeda-beda.