Anda Langsung Tahu Bahwa Ini Porno. Akankah Komputer Mengerti? - Pandangan Alternatif

Daftar Isi:

Anda Langsung Tahu Bahwa Ini Porno. Akankah Komputer Mengerti? - Pandangan Alternatif
Anda Langsung Tahu Bahwa Ini Porno. Akankah Komputer Mengerti? - Pandangan Alternatif

Video: Anda Langsung Tahu Bahwa Ini Porno. Akankah Komputer Mengerti? - Pandangan Alternatif

Video: Anda Langsung Tahu Bahwa Ini Porno. Akankah Komputer Mengerti? - Pandangan Alternatif
Video: Turbulensi Era New Normal Dalam Perspektif Teknik (Webinar Series UNIDHA Malang 2020) 2024, Mungkin
Anonim

Tumblr mengumumkan awal bulan lalu bahwa mereka akan melarang pornografi. Ketika kebijakan konten baru diberlakukan, sekitar dua minggu kemudian - pada 17 Desember - terlihat jelas bahwa akan ada masalah. Setelah menerapkan sistem kecerdasan buatan yang seharusnya melarang semua pornografi di situs, situs tersebut secara keliru menandai postingan tidak bersalah di 455,4 juta blog di situs tersebut di antara 168,2 miliar postingan: vas, penyihir, ikan, dan semua musik jazz itu.

Pornografi untuk kecerdasan buatan

Meskipun tidak jelas filter otomatis mana yang digunakan atau dibuat Tumblr sendiri - perusahaan tidak menanggapi pertanyaan tentang topik tersebut - jelas bahwa jejaring sosial terjebak antara politik dan teknologinya sendiri. Misalnya, pendirian situs yang tidak konsisten tentang "wanita menunjukkan puting" dan ketelanjangan artistik, misalnya, telah menyebabkan keputusan kontekstual yang menunjukkan bahwa Tumblr pun tidak tahu apa yang harus dilarang di platformnya. Bagaimana sebuah perusahaan reguler dapat menentukan apa yang dianggapnya cabul?

Pertama, memblokir konten berisiko itu sulit karena sulit untuk didefinisikan sejak awal. Definisi kecabulan adalah perangkap beruang yang berusia lebih dari seratus tahun, pada tahun 1896, Amerika Serikat pertama kali mengeluarkan undang-undang yang mengatur kecabulan. Pada tahun 1964, dalam Jacobellis v. Ohio, mengenai apakah Ohio dapat melarang pemutaran film Louis Malle, Mahkamah Agung mengeluarkan definisi yang mungkin paling terkenal dari pornografi hardcore saat ini: “Saya tidak akan mencoba mendefinisikan materi semacam ini lebih jauh hari ini, yang, seperti yang saya pahami, ini akan dimasukkan dalam deskripsi kata demi kata; dan saya mungkin tidak akan pernah bisa membuatnya menjadi jelas,”kata Hakim Potter Stewart. "Tapi saya tahu apa itu ketika saya melihatnya, dan film yang terkait dengan kasus ini tidak."

Algoritme pembelajaran mesin memiliki masalah yang sama. Inilah masalah yang coba dipecahkan oleh Brian Delorge, CEO Picnix, sebuah perusahaan yang menjual teknologi kecerdasan buatan khusus. Salah satu produk mereka, Iris, adalah aplikasi sisi klien untuk mendeteksi pornografi untuk "membantu orang," seperti yang dikatakan Delorge, "yang tidak menginginkan pornografi dalam hidup mereka." Dia mencatat bahwa masalah khusus dengan pornografi adalah bahwa itu bisa berupa apa saja, banyak hal yang berbeda - dan gambar yang bukan pornografi dapat memiliki elemen yang serupa. Gambar pesta pantai mungkin diblokir bukan karena kulitnya lebih banyak daripada foto kantor, tetapi karena ada di tepinya. “Inilah sebabnya mengapa sangat sulit melatih algoritme pengenalan gambar untuk melakukan semuanya sekaligus,” kata DeLorge."Ketika definisi menjadi sulit bagi manusia, komputer juga mengalami kesulitan." Jika orang tidak setuju tentang apa itu pornografi dan apa yang tidak, dapatkah komputer berharap untuk mengetahui perbedaannya?

Untuk mengajari AI mendeteksi pornografi, hal pertama yang perlu Anda lakukan adalah memberinya konten pornografi. Banyak sekali pornografi. Di mana saya bisa mendapatkannya? Nah, hal pertama yang dilakukan orang adalah mengunduh banyak video dari Pornhub, XVideos, kata Dan Shapiro, salah satu pendiri Lemay.ai, sebuah startup yang membuat filter AI untuk kliennya. "Ini adalah salah satu area abu-abu dari sifat hukum - misalnya, jika Anda belajar dari konten orang lain, apakah itu milik Anda?"

Setelah programmer mendownload berton-ton film porno, mereka memotong footage non-pornografi dari video untuk memastikan footage yang digunakan tidak menghalangi pengantar pizza. Platform membayar orang, kebanyakan di luar AS, untuk menandai konten semacam itu; pekerjaannya bergaji rendah dan membosankan, seperti memasukkan captcha. Mereka hanya duduk dan mencatat: ini porno, ini ini. Anda harus menyaring sedikit, karena semua film porno memiliki label. Belajar lebih baik jika Anda tidak hanya menggunakan foto, tetapi sampel data yang besar.

Video promosi:

“Seringkali, Anda tidak hanya harus memfilter film porno, tetapi juga materi yang menyertainya,” kata Shapiro. "Seperti profil palsu dengan foto dan telepon seorang gadis." Ia merujuk pada pekerja seks yang mencari klien, tetapi bisa juga apa saja yang tidak sepenuhnya legal. "Ini bukan porno, tapi ini adalah jenis hal yang tidak ingin Anda tonton di platform Anda, bukan?" Moderator otomatis yang baik belajar dari jutaan - jika bukan puluhan juta - konten sampel, yang dapat menghemat banyak jam kerja Anda.

“Anda dapat membandingkannya dengan perbedaan antara anak-anak dan orang dewasa,” kata Matt Zeiler, CEO dan pendiri Clarifai, startup computer vision yang melakukan pemfilteran gambar semacam ini untuk klien korporat. “Saya dapat memberi tahu Anda dengan pasti - beberapa bulan yang lalu kami punya bayi. Mereka tidak tahu apa-apa tentang dunia, semuanya baru bagi mereka. " Anda harus menunjukkan banyak hal kepada anak (algoritme) agar dia memahami sesuatu. “Jutaan dan jutaan contoh. Namun sebagai orang dewasa - ketika kita telah menciptakan begitu banyak konteks tentang dunia dan memahami cara kerjanya - kita dapat mempelajari sesuatu yang baru hanya dari beberapa contoh. " (Ya, mengajar AI untuk memfilter konten dewasa seperti menunjukkan banyak pornografi kepada seorang anak.) Perusahaan seperti Clarifai berkembang pesat saat ini. Mereka memiliki database dunia yang bagus, mereka dapat membedakan anjing dari kucing, berpakaian dari telanjang. Perusahaan Zeiler menggunakan modelnya untuk melatih algoritme baru untuk kliennya - karena model asli memproses banyak data, versi yang dipersonalisasi hanya memerlukan kumpulan data baru agar berfungsi.

Namun, sulit bagi algoritme untuk melakukannya dengan benar. Ia bekerja dengan baik dengan konten yang jelas-jelas pornografi; tetapi pengklasifikasi mungkin salah menandai iklan pakaian dalam sebagai terlarang karena gambar tersebut memiliki lebih banyak bahan kulit daripada, katakanlah, kantor. (Dengan bikini dan celana dalam, menurut Zeiler, sangat sulit). Ini berarti bahwa pemasar harus fokus pada kasus tepi ini dalam pekerjaan mereka, memprioritaskan model yang sulit diklasifikasikan.

Apa bagian tersulitnya?

"Anime porno," kata Zeiler. "Versi pertama dari detektor ketelanjangan kami tidak menggunakan pornografi kartun untuk pendidikan." Seringkali AI salah karena tidak mengenali hentai. “Setelah mengerjakan ini untuk klien, kami memasukkan banyak datanya ke dalam model dan secara signifikan meningkatkan keakuratan filter kartun sambil mempertahankan keakuratan foto asli,” kata Zeiler.

Teknologi yang telah diajarkan untuk mengendus pornografi dapat digunakan pada hal-hal lain juga. Teknologi di balik sistem ini sangat fleksibel. Ini lebih dari payudara anime. Jigsaw dari Alphabet, misalnya, banyak digunakan sebagai moderator komentar otomatis di sebuah surat kabar. Perangkat lunak ini bekerja dengan cara yang mirip dengan pengklasifikasi gambar, hanya saja perangkat lunak ini diurutkan berdasarkan toksisitas daripada ketelanjangan. (Toksisitas dalam komentar tekstual sama sulitnya dengan pornografi dalam gambar.) Facebook menggunakan jenis pemfilteran otomatis ini untuk mendeteksi pesan bunuh diri dan konten terkait terorisme, dan telah mencoba menggunakan teknologi ini untuk mendeteksi berita palsu di platform masifnya.

Semua ini masih bergantung pada pengawasan manusia; kami lebih baik dalam menangani ambiguitas dan konteks ambigu. Zeiler mengatakan dia tidak berpikir produknya telah mengambil alih pekerjaan siapa pun. Ini memecahkan masalah penskalaan internet. Manusia tetap akan melatih AI dengan memilah dan memberi label pada konten agar AI dapat membedakannya.

Ini adalah masa depan moderasi: solusi siap pakai yang disesuaikan yang diberikan kepada perusahaan yang menjalankan seluruh bisnis mereka dengan mengajarkan lebih banyak dan lebih banyak lagi pengklasifikasi tingkat lanjut lebih banyak data. Sama seperti Stripe dan Square yang menawarkan solusi pembayaran out-of-the-box untuk bisnis yang tidak ingin memprosesnya sendiri, startup seperti Clarifai, Picnix, dan Lemay.ai akan melakukan moderasi online.

Dan Shapiro dari Lemay.ai berharap. “Seperti halnya teknologi lainnya, teknologi ini masih dalam proses untuk ditemukan. Jadi saya tidak berpikir kita akan menyerah jika kita gagal. " Tetapi apakah AI akan dapat beroperasi secara mandiri tanpa pengawasan manusia? Tidak jelas. “Tidak ada orang kecil di kotak tembakau yang menyaring setiap tembakan,” katanya. "Anda perlu mendapatkan data dari mana saja untuk melatih algoritme di dalamnya."

Zeiler, di sisi lain, percaya bahwa suatu hari kecerdasan buatan akan memoderasi semuanya sendiri. Pada akhirnya, jumlah intervensi manusia akan dikurangi menjadi nol atau sedikit usaha. Secara bertahap, upaya manusia akan berubah menjadi sesuatu yang tidak dapat dilakukan AI sekarang, seperti penalaran tingkat tinggi, kesadaran diri - semua yang dimiliki manusia.

Mengakui pornografi adalah bagian dari itu. Identifikasi adalah tugas yang relatif sepele bagi manusia, tetapi jauh lebih sulit melatih algoritme untuk mengenali nuansa. Menentukan ambang batas ketika filter menandai gambar sebagai pornografi atau non-pornografi juga merupakan tugas yang sulit, sebagian bersifat matematis.

Kecerdasan buatan adalah cerminan tidak sempurna dari cara kita memandang dunia, seperti halnya pornografi yang merupakan cerminan dari apa yang terjadi di antara orang-orang ketika mereka sendirian. Memang ada benarnya, tapi tidak ada gambaran lengkapnya.

Ilya Khel

Direkomendasikan: