OpenAI Perkenalkan Sora, AI yang Bisa Jadikan Teks ke Video

Milenianews.com OpenAI baru saja meluncurkan model pembuatan video terbaru mereka yang diberi nama Sora. Perusahaan kecerdasan buatan ini mengklaim bahwa Sora dapat menciptakan adegan yang realistis dan imajinatif dari instruksi teks.

Model teks-ke-video ini memungkinkan pengguna untuk membuat video fotorealistik hingga satu menit lamanya. Semuanya berdasarkan petunjuk yang telah mereka tulis.

Menurut pos blog perkenalan OpenAI, Sora mampu menciptakan adegan yang kompleks dengan beberapa karakter, jenis gerakan tertentu, dan detail yang akurat dari subjek dan latar belakang”.

Perusahaan juga mencatat bahwa model ini dapat memahami bagaimana objek “ada di dunia fisik”. Sora juga bisa menafsirkan properti secara akurat dan menghasilkan karakter yang memikat yang mengekspresikan emosi yang hidup.

Baca juga: Jadi Keempat Dunia, NVIDIA Lewati Nilai Perusahaan Amazon!

OpenAI nilai Sora punya kapabilitas luar biasa sebagai AI

Foto: Model Ai dari OpenAI (sumber: OpenAi)

Sora juga memiliki kemampuan untuk menghasilkan video berdasarkan gambar diam. Sora juga bisa mengisi bingkai yang hilang pada video yang sudah ada atau memperpanjangnya. Demo yang dihasilkan oleh Sora yang disertakan dalam pos blog OpenAI mencakup adegan udara California selama demam emas, video yang terlihat seolah-olah diambil dari dalam kereta di Tokyo, dan lainnya.

Banyak yang memiliki tanda-tanda khas kecerdasan buatan, seperti lantai yang bergerak dengan mencurigakan dalam video sebuah museum, dan OpenAI mengatakan bahwa model ini mungkin kesulitan dalam mensimulasikan fisika dari adegan yang kompleks. Tetapi hasilnya secara keseluruhan cukup mengesankan.

Beberapa tahun yang lalu, fokus utamanya adalah pada generator teks-ke-gambar seperti Midjourney yang memiliki kemampuan untuk mengubah kata-kata menjadi gambar.

Namun, baru-baru ini, video telah mulai meningkat dengan pesat. Perusahaan seperti Runway dan Pika telah menunjukkan model teks-ke-video yang mengesankan. Lumiere dari Google dianggap sebagai salah satu pesaing utama OpenAI di ruang ini. Serupa dengan Sora, Lumiere memberikan alat teks-ke-video kepada pengguna dan juga memungkinkan mereka membuat video dari gambar diam.

Saat ini, Sora hanya tersedia untuk “red team” yang sedang menilai model untuk potensi kerusakan dan risiko. OpenAI juga menawarkan akses kepada beberapa seniman visual, desainer, dan pembuat film untuk mendapatkan umpan balik.

Perusahaan mencatat bahwa model yang ada saat ini mungkin tidak akurat dalam mensimulasikan fisika dari adegan yang kompleks dan mungkin tidak memahami dengan benar beberapa contoh sebab dan akibat.

Baca juga: OpenAI Luncurkan ChatGPT untuk Apple Vision Pro

Pada awal bulan ini, OpenAI mengumumkan bahwa mereka akan menambahkan watermark ke alat teks-ke-gambar mereka, DALL-E 3, tetapi mencatat bahwa watermark tersebut dapat dengan mudah dihapus.

Seperti produk kecerdasan buatan lainnya, OpenAI harus berurusan dengan konsekuensi dari video fotorealistik palsu yang disalahartikan sebagai sesuatu yang nyata.

Tonton podcast Milenianews yang menghadirkan bintang tamu beragam dari Sobat Milenia dengan cerita yang menghibur, inspiratif serta gaul hanya di youtube Milenianews.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *