Kecerdasan Buatan Telah Belajar Mengenali Ucapan Dengan Benar Di Antara Kebisingan - Pandangan Alternatif

Kecerdasan Buatan Telah Belajar Mengenali Ucapan Dengan Benar Di Antara Kebisingan - Pandangan Alternatif
Kecerdasan Buatan Telah Belajar Mengenali Ucapan Dengan Benar Di Antara Kebisingan - Pandangan Alternatif

Video: Kecerdasan Buatan Telah Belajar Mengenali Ucapan Dengan Benar Di Antara Kebisingan - Pandangan Alternatif

Video: Kecerdasan Buatan Telah Belajar Mengenali Ucapan Dengan Benar Di Antara Kebisingan - Pandangan Alternatif
Video: Artificial Intelligence: Inilah Hebatnya Kecerdasan Buatan 2024, Mungkin
Anonim

Asisten virtual dan sistem pengenalan suara telah belajar untuk "mengenali" apa yang dikatakan seseorang kepada mereka dan mengikuti perintahnya. Tetapi untuk pengoperasian yang benar dari Siri dan Cortana yang sama, kebisingan asing bisa menjadi masalah besar. Para ahli dari Mitsubishi Electric dapat membantu mengatasi kekurangan teknis ini, yang menghadirkan teknologi baru untuk memisahkan ucapan satu orang dari kebisingan umum.

Teknologi perusahaan Jepang disebut Deep Clustering, yang fungsinya dibangun di atas prinsip pembelajaran mesin. Sebagai permulaan, kecerdasan buatan belajar untuk secara mandiri memisahkan ucapan seseorang dari aliran umum berbagai suara dan suara. Jaringan saraf memisahkan data audio yang masuk menjadi berbagai elemen dan menganalisis masing-masing secara terpisah, setelah itu ia sudah dapat memproses suara manusia. Pekerjaan serupa diamati ketika dua atau lebih lawan bicara "terhubung".

Selama demonstrasi teknologi dari sebuah perusahaan Jepang, sistem berhasil memisahkan ucapan dua orang yang mengucapkan kalimat yang sama dalam bahasa berbeda ke dalam satu mikrofon. Semua pemrosesan dilakukan secara real time, dan penundaan tidak lebih dari tiga detik. Akurasi pengenalan adalah 90 persen, dan ketika tiga orang mulai berbicara ke mikrofon, persentase "hit" turun menjadi 80, yang juga merupakan hasil yang bagus. Menurut penulis proyek Anthony Vetro dan Yohei Okato,

“Tidak seperti memisahkan ucapan dari suara latar, memisahkan ucapan satu orang dari suara“suara”orang yang berbicara pada saat yang sama adalah tugas yang sangat sulit, karena suara dari suara orang yang berbeda memiliki banyak keanehan. Di kebanyakan sistem, masalah pemisahan suara diselesaikan dengan memasang dua atau lebih mikrofon, tetapi dalam kasus hanya menggunakan satu mikrofon, hanya kecerdasan buatan yang dapat menangani tugas pemisahan suara. Teknologi ini dapat digunakan di mana pun diperlukan pengenalan pesan suara dengan akurasi tinggi. Misalnya, dalam sistem kontrol suara untuk mobil, lift, rumah tangga, dan perangkat elektronik lainnya."

VLADIMIR KUZNETSOV

Direkomendasikan: