Kecerdasan Buatan Mulai Belajar 10 Kali Lebih Cepat Dan Lebih Efisien - Pandangan Alternatif

Kecerdasan Buatan Mulai Belajar 10 Kali Lebih Cepat Dan Lebih Efisien - Pandangan Alternatif
Kecerdasan Buatan Mulai Belajar 10 Kali Lebih Cepat Dan Lebih Efisien - Pandangan Alternatif

Video: Kecerdasan Buatan Mulai Belajar 10 Kali Lebih Cepat Dan Lebih Efisien - Pandangan Alternatif

Video: Kecerdasan Buatan Mulai Belajar 10 Kali Lebih Cepat Dan Lebih Efisien - Pandangan Alternatif
Video: Artificial Intelligence: Inilah Hebatnya Kecerdasan Buatan 2024, April
Anonim

Divisi kecerdasan buatan Google mengumumkan pembuatan metode baru untuk melatih jaringan saraf, menggabungkan penggunaan algoritme canggih dan video game lama. Video game Atari lama digunakan sebagai lingkungan belajar.

Pengembang DeepMind (ingat bahwa orang-orang ini menciptakan jaringan saraf AlphaGo, yang telah berulang kali mengalahkan pemain terbaik dalam permainan logika pergi) percaya bahwa mesin dapat belajar dengan cara yang sama seperti manusia. Menggunakan sistem pelatihan DMLab-30, berdasarkan Quake III shooter dan game arcade Atari (57 game berbeda digunakan), para insinyur telah mengembangkan algoritma pembelajaran mesin IMPALA (Importance Weighted Actor-Learner Architectures) baru. Ini memungkinkan bagian individu untuk belajar bagaimana melakukan beberapa tugas sekaligus, dan kemudian bertukar pengetahuan di antara mereka sendiri.

Image
Image

Dalam banyak hal, sistem baru ini didasarkan pada sistem arsitektur Asynchronous Actor-Critic Agents (A3C) sebelumnya, di mana agen individu menyelidiki lingkungan, kemudian proses dihentikan sementara dan mereka bertukar pengetahuan dengan komponen pusat, "siswa". Sedangkan untuk IMPALA, mungkin memiliki lebih banyak agen, dan proses pembelajarannya sendiri berlangsung dengan cara yang sedikit berbeda. Di dalamnya, agen mengirimkan informasi kepada dua "mahasiswa" sekaligus, yang kemudian juga saling bertukar data. Selain itu, jika dalam A3C penghitungan gradien fungsi kerugian (dengan kata lain selisih antara nilai parameter yang diprediksi dan diperoleh) dilakukan oleh agen itu sendiri, yang mengirimkan informasi ke inti pusat, maka dalam sistem IMPALA, tugas ini dilakukan oleh "mahasiswa".

Contoh seseorang yang bermain melalui permainan:

Berikut cara sistem IMPALA menangani tugas yang sama:

Salah satu tantangan utama dalam mengembangkan AI adalah waktu dan kebutuhan daya komputasi yang tinggi. Bahkan ketika otonom, mesin membutuhkan aturan yang dapat mereka ikuti dalam eksperimen mereka sendiri dan menemukan cara untuk memecahkan masalah. Karena kami tidak bisa hanya membuat robot dan membiarkan mereka belajar, pengembang menggunakan simulasi dan teknik pembelajaran mendalam.

Agar jaringan saraf modern dapat mempelajari sesuatu, mereka harus memproses sejumlah besar informasi, dalam hal ini, miliaran bingkai. Dan semakin cepat mereka melakukannya, semakin sedikit waktu yang dibutuhkan untuk mempelajarinya.

Video promosi:

Dengan prosesor yang cukup, DeepMind mengatakan IMPALA mencapai 250.000 frame per detik, atau 21 miliar frame per hari. Ini adalah rekor mutlak untuk tugas-tugas semacam ini, menurut The Next Web. Pengembang sendiri berkomentar bahwa sistem AI mereka mengatasi tugas lebih baik daripada mesin dan orang serupa.

Di masa depan, algoritma AI serupa dapat digunakan dalam robotika. Dengan mengoptimalkan sistem pembelajaran mesin, robot akan beradaptasi dengan lingkungannya lebih cepat dan bekerja lebih efisien.

Nikolay Khizhnyak

Direkomendasikan: