OpenAI Sebut Platform Sora akan Tersedia untuk Umum Akhir 2024

Techverse.asia - Publik akan segera bisa mencoba sendiri generator teks-ke-video OpenAI yang menarik. Dalam sebuah wawancara dengan The Wall Street Journal (WSJ), Chief Technology Officer (CTO) OpenAI Mira Murati menyatakan bahwa platform Sora akan tersedia 'tahun ini' dan mungkin memerlukan waktu beberapa bulan.

OpenAI pertama kali memamerkan Sora, yang mampu menghasilkan adegan hiperrealistis berdasarkan perintah teks, pada Februari 2024. Perusahaan ini awalnya hanya menyediakan alat tersebut bagi seniman visual, desainer, dan pembuat film, namun hal tersebut tidak menghentikan beberapa video buatan Sora untuk masuk ke platform seperti X/Twitter.

Selain membuat alat tersebut tersedia untuk umum, Murati mengatakan bahwa OpenAI memiliki rencana untuk menggabungkan audio, yang berpotensi membuat pemandangan menjadi lebih realistis.

OpenAI juga ingin mengizinkan pengguna untuk menyunting konten dalam video yang diproduksi Sora, karena alat AI generatif tidak selalu menghasilkan gambar yang akurat. “Kami mencoba mencari cara untuk menggunakan teknologi ini sebagai alat yang dapat digunakan untuk mengedit dan berkreasi,” kata Murati.

Saat ditanya data apa yang digunakan OpenAI untuk melatih Sora, Murati tidak menjelaskan secara spesifik dan sepertinya menghindari pertanyaan tersebut. “Saya tidak akan menjelaskan secara rinci data yang digunakan, tetapi data tersebut tersedia untuk umum atau data berlisensi,” katanya.

Murati juga mengatakan dia tidak yakin apakah itu menggunakan video dari Youtube, Facebook, dan Instagram. Dia hanya mengonfirmasi kepada WSJ bahwa Sora menggunakan konten dari Shutterstock, yang bermitra dengan OpenAI.

Murati juga mengatakan kepada WSJ bahwa Sora jauh lebih mahal dalam hal tarif langanannya. OpenAI mencoba membuat alat tersebut tersedia dengan biaya yang sama dengan DALL-E, model teks-ke-gambar AI milik perusahaan, ketika dirilis ke publik.

Publik dapat melihat lebih banyak contoh jenis video yang dapat dihasilkan oleh Sora ini di laporan WSJ, termasuk animasi banteng di toko Tiongkok dan ulasan ponsel pintar putri duyung.

Sebagaimana diketahui, OpenAI telah meluncurkan Sora, model AI generatif yang dapat membuat video beresolusi tinggi dari teks yang dimasukkan (input), durasi video yang dihasilkan maksimal satu menit. Sora, yang berarti 'langit' dalam bahasa Jepang.

Sebaliknya, OpenAI menyediakannya bagi sekelompok kecil akademisi dan peneliti yang akan menilai bahaya dan potensi penyalahgunaannya.

Dengan deskripsi singkat - atau mendetail - atau gambar diam, Sora dapat menghasilkan adegan seperti film 1080 piksel dengan banyak karakter, jenis gerakan berbeda, dan detail latar belakang. Sora juga dapat memperluas klip video yang ada - melakukan yang terbaik untuk mengisi detail yang hilang.

“Sora memiliki pemahaman bahasa yang mendalam, memungkinkannya menafsirkan perintah secara akurat dan menghasilkan karakter menarik yang mengekspresikan emosi yang hidup. Model ini memahami tidak hanya apa yang diminta pengguna dalam prompt, tetapi juga bagaimana hal-hal tersebut ada di dunia nyata,” tulis OpenAI dalam postingan blognya.

OpenAI sangat memposisikan Sora sebagai pratinjau penelitian, mengungkapkan sedikit tentang data apa yang digunakan untuk melatih model (kurang dari lebih dari 10 ribu jam video berkualitas tinggi) dan tidak membuat Sora tersedia secara umum.

Alasannya adalah adanya potensi penyalahgunaan; OpenAI dengan tepat menunjukkan bahwa pelaku kejahatan dapat menyalahgunakan model seperti Sora dengan berbagai cara.

OpenAI mengatakan bahwa pihaknya bekerja sama dengan para ahli untuk menyelidiki model eksploitasi dan membangun alat untuk mendeteksi apakah suatu video dibuat oleh Sora. Perusahaan menambahkan, jika mereka memilih untuk membuat model menjadi produk publik, mereka akan memastikan bahwa metadata asal disertakan dalam konten yang dihasilkan.