Jaringan Saraf Diajarkan Untuk "menganimasikan" Potret Hanya Berdasarkan Satu Gambar Statis - Pandangan Alternatif

Video: Jaringan Saraf Diajarkan Untuk "menganimasikan" Potret Hanya Berdasarkan Satu Gambar Statis - Pandangan Alternatif

Video: Membuat Deepfakes: Menganimasikan Gambar dengan AI 2024, Mungkin

2024 Pengarang: Keith Bush | [email protected]. Terakhir diubah: 2023-12-16 14:25

Spesialis Rusia dari Samsung AI Center-Moscow Center for Artificial Intelligence, bekerja sama dengan para insinyur dari Institut Sains dan Teknologi Skolkovo, telah mengembangkan sistem yang mampu membuat gambar animasi realistis dari wajah manusia hanya berdasarkan beberapa bingkai statis manusia. Biasanya, dalam hal ini, penggunaan database gambar yang besar diperlukan, namun, dalam contoh yang disajikan oleh pengembang, sistem dilatih untuk membuat gambar animasi wajah manusia hanya dari delapan frame statis, dan dalam beberapa kasus satu sudah cukup. Untuk detail lebih lanjut tentang pengembangan, lihat artikel yang diterbitkan di repositori online ArXiv.org.

Biasanya, agak sulit untuk mereproduksi modul fotorealistik yang dipersonalisasi dari wajah manusia karena kompleksitas fotometrik, geometris, dan kinematik yang tinggi dalam mereproduksi kepala manusia. Ini dijelaskan tidak hanya oleh kompleksitas pemodelan wajah secara keseluruhan (untuk ini ada banyak pendekatan untuk pemodelan), tetapi juga oleh kompleksitas pemodelan fitur-fitur tertentu: rongga mulut, rambut, dan sebagainya. Faktor rumit kedua adalah kecenderungan kita untuk menangkap bahkan kekurangan kecil dalam model akhir kepala manusia. Toleransi rendah untuk kesalahan pemodelan ini menjelaskan prevalensi saat ini dari avatar non-fotorealistik yang digunakan dalam telekonferensi.

Menurut penulis, sistem tersebut, yang disebut pembelajaran Fewshot, mampu menciptakan model yang sangat realistis dari kepala orang yang berbicara dan bahkan lukisan potret. Algoritme tersebut mensintesis gambar kepala orang yang sama dengan garis referensi wajah yang diambil dari fragmen video lain, atau menggunakan titik referensi wajah orang lain. Sebagai sumber materi untuk pelatihan sistem, para pengembang menggunakan database gambar video selebriti yang ekstensif. Untuk mendapatkan kepala bicara seakurat mungkin, sistem perlu menggunakan lebih dari 32 gambar.

Untuk membuat gambar wajah animasi yang lebih realistis, pengembang menggunakan pengembangan sebelumnya dalam pemodelan adversarial generatif (GAN, di mana jaringan saraf memikirkan detail gambar, menjadi seorang seniman), serta pendekatan pembelajaran meta mesin, di mana setiap elemen sistem dilatih dan dirancang untuk menyelesaikan beberapa tugas spesifik.

Skema pembelajaran meta.

Video promosi:

Tiga jaringan saraf digunakan untuk memproses gambar statis kepala orang dan mengubahnya menjadi animasi: Embedder (jaringan implementasi), Generator (jaringan pembangkitan) dan Diskriminator (jaringan diskriminator). Partisi pertama gambar kepala (dengan perkiraan landmark wajah) menjadi vektor embedding, yang berisi informasi yang tidak bergantung pada pose, jaringan kedua menggunakan landmark wajah yang diperoleh dari jaringan embedding dan menghasilkan data baru berdasarkan gambar tersebut melalui serangkaian lapisan konvolusional yang memberikan ketahanan terhadap perubahan skala, perpindahan, belokan, perubahan sudut dan distorsi lain dari gambar wajah asli. Diskriminator jaringan digunakan untuk menilai kualitas dan keaslian dari dua jaringan lainnya. Hasilnya, sistem mengubah landmark wajah seseorang menjadi foto hasil personalisasi yang tampak realistis.

Pengembang menekankan bahwa sistem mereka mampu menginisialisasi parameter jaringan generator dan jaringan diskriminator secara individual untuk setiap orang dalam gambar, sehingga proses pembelajaran dapat didasarkan hanya pada beberapa gambar, yang meningkatkan kecepatannya, meskipun perlu memilih puluhan juta parameter.

Nikolay Khizhnyak

Direkomendasikan:

Pembangkit Listrik Tenaga Gelombang Pelamis P-750 Atau "ular Laut" Pemandangan Alternatif

Raksasa ular logam menaklukkan energi lautan dan samudra dengan izin manusia. Kedengarannya seperti dongeng, bukan? Gelombang samudra dan lautan menghasilkan banyak energi

"Chess Turk" Oleh Wolfgang Von Kempelen - Pemandangan Alternatif

Pada 1770, mekanisme catur pertama dibuat oleh insinyur Hongaria Wolfgang von Kempelen. Perangkat berbentuk orang Turki yang duduk ini menjadi mesin catur paling terkenal dalam sejarah umat manusia.Seperti apa "catur Turki" itu? Terdiri dari kotak kayu setinggi 1 meter dengan papan catur besar di atasnya

Kisah Dramatis "anak Yatim" Dari Titanic - Michel Dan Edmond Navratil - Pemandangan Alternatif

Pada malam tanggal 15 April 1912, Michelle yang berusia tiga tahun dan Edmond yang berusia dua tahun menaiki kapal terakhir yang berangkat dari Titanic yang hancur. Tetapi fakta bahwa mereka meninggalkan kapal yang hilang belum mengakhiri cerita mereka dengan bahagia

Artis Takut Berada Di Studio TV Karena "aktivitas Paranormal". Pemandangan Alternatif

Studio TV Manchester yang terkenal Old Granada Studios, di mana The Beatles memainkan salah satu pertunjukan pertama di TV, dan serial terkenal Coronation Street difilmkan, sepertinya ditangkap oleh hantu

Kebijakan Privasi untuk greatplainsparanormal.com

Jaringan Saraf Diajarkan Untuk "menganimasikan" Potret Hanya Berdasarkan Satu Gambar Statis - Pandangan Alternatif

Video: Jaringan Saraf Diajarkan Untuk "menganimasikan" Potret Hanya Berdasarkan Satu Gambar Statis - Pandangan Alternatif

Direkomendasikan:

Pembangkit Listrik Tenaga Gelombang Pelamis P-750 Atau "ular Laut" Pemandangan Alternatif

"Chess Turk" Oleh Wolfgang Von Kempelen - Pemandangan Alternatif

Kisah Dramatis "anak Yatim" Dari Titanic - Michel Dan Edmond Navratil - Pemandangan Alternatif

Artis Takut Berada Di Studio TV Karena "aktivitas Paranormal". Pemandangan Alternatif

Kebijakan Privasi untuk greatplainsparanormal.com

Proyek Alkitab: Kontrak Prediktor Global Dengan Bangsa - Pandangan Alternatif

Tengkorak "alien", Atau Oh, Betapa Banyak Penemuan Indah Yang Kita Miliki - Pandangan Alternatif

Dari Sejarah Keadilan, Sulit Dipahami Dan Tak Kenal Ampun - Pandangan Alternatif

Ilmuwan Meyakinkan Bahwa Dia Menjelajahi Kota Kuno Annunaki Di Afrika - Pandangan Alternatif

Mengapa Orang Tidak Melihat Dan Tidak Pernah Melihat Reptil? - Pandangan Alternatif

10 Misteri Ilmiah Yang Masih Belum Bisa Kita Pecahkan - Pandangan Alternatif

Nuclear Orlan: Apa Yang Mampu Dilakukan Oleh Kapal Penjelajah Terbesar Di Dunia - Pandangan Alternatif

Dengan Bantuan Editor Genom CRISPR, Distrofi Otot Dapat Disembuhkan - Pandangan Alternatif

Misteri Campo Del Cielo - Pandangan Alternatif

Empat Kisah Nyata Dan Menyeramkan Dari Mereka Yang Terkubur Hidup-hidup - Pandangan Alternatif

Rahasia Utama Joseph Stalin - Pandangan Alternatif

"Muromets" Montenegro Melawan Samurai - Pandangan Alternatif

Dibalsem Kotovsky. Mausoleum Bukan Lenin - Pandangan Alternatif

Hantu Dari Apsintus Hitam - Pandangan Alternatif

Mumi Orang Kulit Putih Di China - Pandangan Alternatif