OpenAI, perusahaan yang menciptakan ChatGPT, sebuah chatbot yang bisa berbicara dengan manusia, kembali membuat heboh dunia internet dengan pengumuman terbaru mereka – sebuah tools video AI bernama Sora yang bisa membuat video yang sangat mirip dengan kenyataan. Beberapa contoh yang sudah dirilis oleh OpenAI sulit dibedakan dari rekaman kamera asli.
Sora adalah sebuah model difusi dengan arsitektur transformer, yang berarti jaringan sarafnya berfungsi dengan cara yang mirip dengan ChatGPT. OpenAI belum memberitahu kapan tanggal rilis resmi Sora, tetapi mereka mengatakan bahwa mereka ingin menunjukkan kepada orang-orang apa yang ada di “cakrawala” untuk kecerdasan buatan.
Berikut ini adalah beberapa hal yang kami ketahui tentang Sora sejauh ini, dan mengapa peluncuran alat video ini ke publik mungkin tidak akan segera terjadi.
Apa itu Sora?
Sora adalah sebuah model AI teks-ke-video yang dikembangkan oleh pencipta ChatGPT, OpenAI. “Teks-ke-video” berarti bahwa Sora mengambil teks sebagai masukan dan mengubahnya menjadi klip video pendek, intinya kita dapat membuat sebuah video hanya dengan kata-kata saja.
Kumpulan video yang dirilis oleh OpenAI minggu ini sungguh menakjubkan. Lihatlah video ini yang sepenuhnya dibuat oleh AI:
Prompt yang digunakan:
The camera follows behind a white vintage SUV with a black roof rack as it speeds up a steep dirt road surrounded by pine trees on a steep mountain slope, dust kicks up from it’s tires, the sunlight shines on the SUV as it speeds along the dirt road, casting a warm glow over the scene. The dirt road curves gently into the distance, with no other cars or vehicles in sight. The trees on either side of the road are redwoods, with patches of greenery scattered throughout. The car is seen from the rear following the curve with ease, making it seem as if it is on a rugged drive through the rugged terrain. The dirt road itself is surrounded by steep hills and mountains, with a clear blue sky above with wispy clouds.
Hasilnya:
“Sora mampu menghasilkan adegan yang kompleks dengan beberapa karakter, jenis gerakan tertentu, dan detail yang akurat dari subjek dan latar belakang,” OpenAI menjelaskan dalam sebuah postingan blog yang dipublikasikan minggu ini, di mana mereka merilis lebih banyak video. “Model ini tidak hanya memahami apa yang diminta oleh pengguna dalam teks, tetapi juga bagaimana hal-hal tersebut ada di dunia nyata.”
Siapa yang Bisa Mengakses Sora Sekarang?
Sora saat ini sedang diuji oleh para peneliti keamanan yang bertanggung jawab untuk memastikan bahwa teknologi video ini aman dan terlindungi sebelum dirilis ke publik, dan menilai “risiko kritis” yang mungkin timbul.
Namun, OpenAI mengatakan bahwa sekelompok kecil seniman visual, pembuat film, dan desainer juga telah diberi akses ke Sora. Tidak ada nama-nama seniman atau desainer yang terlibat dalam percobaan ini yang disebutkan.
Beberapa akun yang mengetahui di forum OpenAI tampaknya memberi sinyal bahwa akan ada daftar tunggu yang diluncurkan pada suatu saat, yang akan menjadi kesempatan pertama untuk mencoba Sora.
Sayangnya, tidak ada indikasi kapan kita akan bisa mendaftar untuk menggunakan Sora.
Kapan Sora Akan Tersedia untuk Publik?
Sayangnya, saat ini tidak ada tanggal rilis untuk Sora. Semua konten yang telah menjadi viral di internet selama 24 jam terakhir berasal dari postingan blog pengumuman yang dipublikasikan oleh OpenAI.
Yang menarik, sepertinya OpenAI bahkan tidak memberikan indikasi samar kapan Sora mungkin tersedia secara umum – tidak ada indikasi bahwa Sora akan dirilis tahun ini.
Hal ini cukup tidak biasa untuk pengumuman sebesar ini, dan bisa menunjukkan bahwa Sora masih jauh dari rilis publik – tetapi lagi-lagi, OpenAI mengakui bahwa mereka berbagi penelitian mereka lebih awal. Dengan kecepatan yang ditunjukkan oleh industri kecerdasan buatan selama dua tahun terakhir, tanggal rilis sebenarnya adalah tebakan siapa saja.
Apa yang Menunda Sora?
Seperti yang telah kami bahas, OpenAI belum siap untuk merilis Sora ke publik, belum puas bahwa teknologi video ini telah diuji keamanannya dengan cukup baik. Hal ini baik, mengingat banyaknya masalah etis yang terkait dengan pembuatan video yang sangat mirip dengan kenyataan – apalagi di tahun dengan banyak pemilihan.
“Kami akan mengambil beberapa langkah keamanan penting sebelum membuat Sora tersedia di produk OpenAI” “Kami bekerja dengan red teamer – ahli di bidang seperti misinformasi, konten kebencian, dan bias – yang akan menguji model ini secara bermusuhan” tambahnya.
OpenAI juga mengatakan bahwa mereka sedang mengerjakan sebuah klasifikasi deteksi video AI yang bisa mengidentifikasi apakah sebuah video telah diproduksi oleh Sora atau tidak.
Hal ini tampaknya seperti langkah yang sama dengan yang diambil setelah ChatGPT diluncurkan, setelah itu perusahaan AI meluncurkan sebuah klasifikasi teks. Namun, klasifikasi teks itu kemudian ditutup karena tidak dapat diandalkan. Ketika kami mengujinya untuk melihat apakah ia bisa mengungkap Plagiarisme ChatGPT, ia tidak mampu mendeteksi konten yang dihasilkan oleh dirinya sendiri.
Bagaimana Cara Kerja Sora?
“Sora adalah sebuah model difusi yang menghasilkan sebuah video dengan memulai dari satu yang terlihat seperti noise statis dan secara bertahap mengubahnya dengan menghapus noise selama banyak langkah,” OpenAI mengatakan minggu ini.
Teknologi ini bekerja dengan cara yang mirip dengan keluarga model bahasa GPT yang menggerakkan chatbot perusahaan, ChatGPT. Mereka semua menggunakan arsitektur “transformer” – sebuah jenis jaringan saraf yang mengambil masukan dan “mentransformasikannya” menjadi keluaran. Mereka juga telah menggabungkan elemen dari DALLE-3, seperti sistem recaptioning.
OpenAI telah memberi Sora video dan gambar sebagai unit data – atau “patch”. “Dengan menyatukan cara kami merepresentasikan data” OpenAI mengatakan, “kami dapat melatih transformer difusi pada rentang data visual yang lebih luas daripada yang mungkin sebelumnya, mencakup durasi, resolusi, dan rasio aspek yang berbeda.