Cara Kerja Kecerdasan Buatan: Pengenalan Ucapan - Pandangan Alternatif

Daftar Isi:

Cara Kerja Kecerdasan Buatan: Pengenalan Ucapan - Pandangan Alternatif
Cara Kerja Kecerdasan Buatan: Pengenalan Ucapan - Pandangan Alternatif

Video: Cara Kerja Kecerdasan Buatan: Pengenalan Ucapan - Pandangan Alternatif

Video: Cara Kerja Kecerdasan Buatan: Pengenalan Ucapan - Pandangan Alternatif
Video: Artificial Intelligence: Inilah Hebatnya Kecerdasan Buatan 2024, September
Anonim

Masing-masing dari kita dihadapkan pada fenomena misterius seperti kecerdasan buatan dalam kehidupan sehari-hari - dialah yang memungkinkan asisten suara dan mesin pencari untuk mengenali ucapan manusia dan menebak keinginan pengguna. Hari ini kita akan berbicara tentang bagaimana tepatnya teknologi ini diatur dan prospek apa yang menunggu bidang pengembangan ini dalam waktu dekat.

Kecerdasan buatan adalah istilah yang sangat luas, di mana banyak algoritme sudah ada dan masih dalam pengembangan, dirancang untuk melakukan berbagai tugas praktis. Tapi apa yang sebenarnya mampu dilakukan oleh program kecerdasan buatan modern, dan prinsip apa yang dipandu selama bekerja? Hari ini kita akan berbicara tentang salah satu fitur utama dari pikiran mesin, yang secara teratur kita temui dalam kehidupan sehari-hari - kemampuan asisten suara untuk mengenali ucapan manusia.

Pengenalan suara

Untuk mengukur suara, program menggunakan sejumlah parameter suara: frekuensi dan panjang gelombang suara pada titik waktu tertentu. Misalnya, saat Anda mengobrol dengan asisten suara populer Alexa, perangkat lunak membagi suara Anda menjadi slide 25 milidetik, lalu mengubah setiap segmen menjadi tanda tangan digital. Setelah itu, blok tanda tangan dibandingkan dengan katalog internal suara program sampai jumlah kecocokan cukup tinggi bagi AI untuk "menerjemahkan" angka ke dalam kueri alfabet yang dimengerti.

Image
Image

Perhatikan layar ponsel Anda saat menggunakan Siri atau Google Assistant dan Anda akan melihat bahwa kosakata berubah saat Anda mengucapkan kata-kata. Hal ini terjadi karena fakta bahwa dengan setiap "langkah" berikutnya perangkat lunak juga membandingkan hasil yang diperoleh dengan database internal dan membangun kata-kata tergantung pada kecocokannya. Menurut Rohit Prasad, kepala ilmuwan di divisi Alexa Amazon, "model bahasa mempelajari miliaran kata dalam bentuk teks." Urutan kata juga memainkan peran penting: ini dapat diperhatikan dengan bantuan mesin pencari Google biasa, yang terkadang memberikan data berbeda untuk kueri yang identik, di mana hanya beberapa kata yang disusun ulang.

Video promosi:

Perspektif pengenalan ucapan

Alan Black dari Carnegie Institute for Language Technology berpendapat bahwa bagi semua profesional di perusahaan besar, hal yang paling menarik adalah menemukan batasan sistem mereka sendiri. “Ketika program mengatakan, 'Saya tidak bisa melakukan ini,' maka situasinya menjadi sangat menarik,” candanya. Namun, ini memang masalahnya: menanggapi permintaan pengguna yang tidak dapat diprediksi bahkan merupakan salah satu tugas utama yang diselidiki oleh lingkaran siswa yang bersaing untuk Hadiah Alexa - dan ini mencapai $ 2,5 juta -. Tugas mereka adalah membuat chatbot yang dirancang untuk berkomunikasi dengan orang-orang yang mengajukan pertanyaan yang konsisten dan bermakna. Informasi dalam kasus ini diperbarui setiap 20 menit. Kedengarannya seperti tugas yang cukup mudah bahkan untuk programmer rata-rata,Namun dalam prakteknya, komunikasi program dengan masyarakat nyata selalu dikaitkan dengan penyimpangan dari topik dialog, ungkapan spontan dan pelanggaran lainnya. Program yang belajar untuk bekerja dengan mereka dan juga orang yang nyata akan menjadi terobosan besar bagi seluruh industri AI.

Vasily Makarov

Direkomendasikan: