Jaringan Saraf Telah Belajar Membuat Video Berdasarkan Deskripsi - Pandangan Alternatif

Jaringan Saraf Telah Belajar Membuat Video Berdasarkan Deskripsi - Pandangan Alternatif
Jaringan Saraf Telah Belajar Membuat Video Berdasarkan Deskripsi - Pandangan Alternatif

Video: Jaringan Saraf Telah Belajar Membuat Video Berdasarkan Deskripsi - Pandangan Alternatif

Video: Jaringan Saraf Telah Belajar Membuat Video Berdasarkan Deskripsi - Pandangan Alternatif
Video: Bagaimana Sel Saraf Bekerja? 2024, Mungkin
Anonim

Kecerdasan buatan membuat video bernaskah - sejauh ini pendek dan buram, tetapi suatu hari itu saja akan menggantikan seluruh studio film.

Jaringan saraf sudah cukup baik (dan dalam banyak kasus lebih baik daripada orang) dalam mengenali pola dalam gambar dan mampu menggambarkan secara umum seluruh adegan. Jaringan saraf generatif melakukan transformasi terbalik dan dapat membentuk gambar berdasarkan deskripsinya, atau memprediksi bingkai berikutnya berdasarkan yang sebelumnya.

Pengembang Belgia telah melangkah lebih jauh, menggabungkan kemampuan ini ke dalam satu sistem yang membuat video "dari ketiadaan", berdasarkan pengalaman pembelajaran mesin dan teks skrip mereka sendiri. Tinne Tuytelaars membicarakan hal ini pada pertemuan Association for the Advancement of Artificial Intelligence (AAAI) yang diadakan di Amerika Serikat.

Jaringan saraf bekerja dalam dua tahap - menurut Tinne, seolah-olah meniru proses kreatif seseorang: pada tahap pertama, "sketsa" perkiraan yang kabur dari setiap bingkai terbentuk, setelah itu detail ditentukan dan ditambahkan. Salah satu bagian penting dari sistem semacam itu adalah jaringan saraf yang diskriminatif, yang membandingkan hasil dengan video "nyata" yang sesuai dengan skenario tertentu, dan memungkinkan Anda menilai kualitasnya, meningkatkan kerja bagian generatif sistem.

Jaringan saraf dilatih pada 10 adegan ("bermain golf di atas rumput", "selancar layang di laut", dll.) Dan belajar untuk memisahkan tindakan dan keadaan satu sama lain, dan juga dapat menggabungkannya dengan cara apa pun, membuat video, misalnya "Golf di kolam renang":

Image
Image

atau "berlayar di salju":

Image
Image

Video promosi:

Tentu saja, kualitas animasi tersebut masih jauh dari bisa diterima: "video" yang berdurasi sekitar satu detik hanya terdiri dari 32 frame dengan dimensi 64x64 piksel.

Tetapi dengan keyakinan yang sama, kami dapat menjamin bahwa angka-angka ini akan cepat meningkat, karena belum lama ini, bioskop itu sendiri hanya dapat menampilkan gambar yang berlumpur, berkedut, dan bodoh. Jika jaringan saraf semacam itu dapat dibuat sangat cepat dan efisien, Hollywood mungkin akan berakhir: cukup untuk mengambil naskah dan filmnya siap. Peluang ini akan berguna dalam menghasilkan set besar untuk melatih jaringan saraf lainnya, dan dalam membuat algoritme baru untuk mengompresi dan mentransmisikan video streaming.

Sergey Vasiliev

Direkomendasikan: