Bagaimana Rahasia Naskah Voynich Diungkap: Investigasi - Pandangan Alternatif

Daftar Isi:

Bagaimana Rahasia Naskah Voynich Diungkap: Investigasi - Pandangan Alternatif
Bagaimana Rahasia Naskah Voynich Diungkap: Investigasi - Pandangan Alternatif

Video: Bagaimana Rahasia Naskah Voynich Diungkap: Investigasi - Pandangan Alternatif

Video: Bagaimana Rahasia Naskah Voynich Diungkap: Investigasi - Pandangan Alternatif
Video: BERITA VIRAL ~ APA PENYEBAABNYA 2024, Mungkin
Anonim

Apa yang ada di balik berita sensasional tentang manuskrip Voynich dan tentang ilmuwan Rusia, apakah mungkin untuk secara akurat menentukan bahasa dari teks, seberapa memadai matematikawan dalam bekerja di "bidang" linguistik.

Pada tanggal 19 April, media Rusia menyebarkan berita tentang penemuan ahli matematika Rusia yang "membuat zaman": ilmuwan yang menggunakan metode baru tidak hanya membuktikan kebermaknaan "manuskrip Voynich" yang terkenal, tetapi juga dapat menentukan bahwa naskah itu ditulis dalam dua bahasa dan dengan pengecualian huruf untuk vokal.

Naskah Voynich adalah naskah bergambar abad pertengahan yang dibeli pada tahun 1912 oleh barang antik Wilfred Voynich. Dibuat pada abad ke-15 (berdasarkan analisis radiokarbon pada perkamen - tetapi sebagian besar ahli saat ini tidak menganggap teks itu sendiri sebagai pemalsuan belakangan), teks ini ditulis dalam bahasa yang tidak dikenal menggunakan alfabet yang tidak diketahui. Dilihat dari ilustrasinya, teks terdiri dari blok tematik: botani, astronomi, farmakologis dan lain-lain. Kompleksitas decoding teks membuat naskah Voynich menjadi "cawan suci" bagi para kriptografer dan objek dari banyak studi, termasuk mereka yang menggunakan metode Big Data.

Kabar naskah pun diberitakan sebagai sesuatu yang sensasional. Ini segera menimbulkan kekhawatiran. “Sebelumnya, semua upaya untuk menguraikan dokumen unik dan bahkan hanya memahami apakah itu teks yang bermakna gagal. 600 tahun upaya tidak berguna!.. Kriptografer CIA dan NSA, superkomputer dan bahkan dokter "ilmu gaib" menandatangani impotensi total mereka. Posting terbaru oleh ahli kriptologi Gordon Rugg dari Universitas Keele di Inggris berbunyi: “Naskah Voynich adalah palsu. "Teks kompleks" seperti itu mudah dibuat untuk siapa saja yang terbiasa dengan metode penyalinan sederhana, "kata artikel itu.

Pertama, kebermaknaan teks diakui pada tahun 1970-an dan beberapa kali dikonfirmasi dalam studi tahun 2010-an, yang ditulis dengan cukup rinci bahkan di media dalam negeri. Kedua, penemuan yang disampaikan ke berita hanya disajikan dalam bentuk pracetak institut, dan bukan dalam artikel di jurnal peer-review internasional (pracetak juga diterbitkan pada 2016).

Keanehan dalam penyajian materi ini memaksa kami untuk mencari klarifikasi terlebih dahulu dari penulis studi, dan kemudian kepada ahli independen - ahli bahasa yang bekerja dengan metode statistik dan matematika, serta dengan decoding skrip kuno.

Mudah untuk menulis rumus, tetapi sangat mahal untuk melakukan analisis numerik

Video promosi:

Pertama, secara singkat tentang inti dari kajian tersebut. Para penulis pracetak, matematikawan dari Institut Fisika dan Teknologi Moskow dan Institut Matematika Terapan dari Akademi Ilmu Pengetahuan Rusia, mengandalkan karya mereka, yang menurutnya "distribusi frekuensi simbol teks adalah karakteristik yang stabil, bukan dari penulis atau subjek teks, tetapi dari bahasanya." Artinya, dengan menggunakan himpunan dengan bantuan alat matematika, Anda dapat menentukan dalam bahasa apa ia ditulis, karena fakta bahwa setiap bahasa memiliki karakteristik "profil" (distribusi eksponen Hurst) sendiri. Selanjutnya, dengan menggunakan metode ini sebagai dasar, para ilmuwan menetapkan bahwa teks manuskrip ditulis dalam campuran beberapa bahasa. Pada saat yang sama, spasi palsu ditambahkan padanya dan simbol yang menunjukkan suara vokal dihapus.

Penulis utama studi tersebut, Yuri Orlov (IPM RAS dan MIPT), menekankan bahwa naskah Voynich sama sekali bukan tujuan utama pekerjaan mereka. "Naskah 'sensasional' hanyalah ilustrasi dari metode matematika untuk mengenali bahasa dari teks - masalah, sebenarnya, untuk pembelajaran mesin," kata Orlov.

Naskah itu sendiri sama sekali tidak menarik bagi kami. Sains mengacu secara khusus pada statistik bahasa. Melalui itu, kita dapat memahami dalam bahasa apa naskah ini ditulis. Tapi bukan apa yang tertulis di sana, ini poin penting. - Yuri Orlov. MIPT dan Institut Matematika Terapan dinamai M. V. Keldysh

Mengenai metode linguistik yang digunakan dalam karya tersebut, Orlov mencatat bahwa analisis frekuensi kombinasi huruf dalam teks itu sendiri adalah hal yang terkenal. Namun, indikator Hurst kurang diketahui oleh ahli bahasa, karena sulit untuk dihitung bahkan dalam istilah matematika. Rumusnya sendiri mudah untuk ditulis, tetapi analisis numerik sangat mahal. Untuk ini, superkomputer yang terletak di Institut dinamai M. V. Keldysh, ahli matematika itu menekankan.

Pilihan bahasa Indo-Eropa untuk analisis dijelaskan oleh fakta bahwa mereka semua sangat mirip, kata Orlov. Indikator yang dikembangkan oleh ahli matematika memudahkan untuk membedakan bahasa dalam kelompok bahasa yang sama, tetapi tidak antar rumpun. Tentu saja, secara teoritis mungkin untuk melakukan pekerjaan yang sama dengan kelompok lain (Ural, Altai atau lainnya), tetapi nilai analisis terletak pada kelengkapannya, Orlov yakin. Dalam kasus bahasa Indo-Eropa, tidak sulit untuk mengetik kumpulan teks untuk setiap bahasa; lebih sulit untuk melakukannya dengan rumpun lain.

Kembali ke manuskrip Voynich, Orlov mencatat bahwa ia dan rekan-rekannya mengutip lima bukti (profil logaritmik dari urutan frekuensi huruf dalam teks dalam satu dan beberapa bahasa, distribusi eksponen Hurst, potret spektral dari matriks probabilitas bersyarat, dan lain-lain) dari hipotesis tentang campuran bahasa dalam manuskrip dan penghapusan. huruf untuk vokal. Mereka dengan tegas menjauhkan diri dari "hangout di sekitar manuskrip", tetapi mereka menyajikan hasil yang unik - metode terbuka, analisis statistik dengan penilaian keandalan yang dapat diverifikasi secara independen.

Kesimpulannya disusutkan oleh fakta bahwa kami tidak memahami materi apa yang mereka peroleh dan tentang apa - mereka memeriksa formula mereka

Asumsi bahwa teks manuskrip Voynich tidak memiliki huruf untuk vokal, dengan spasi yang salah itu indah dan bagus, catat ahli bahasa Evgenia Korovina, yang terlibat dalam statistik matematika bahasa (Institut Linguistik, Akademi Ilmu Pengetahuan Rusia). Sebelumnya, tidak ada yang mengemukakan hipotesis seperti itu. Dia, misalnya, dengan indah menjelaskan mengapa ada lebih sedikit huruf daripada yang diharapkan untuk teks Eropa. Tetapi masalahnya adalah bahwa penulis penelitian bahkan tidak menunjukkan teks mana dalam bahasa berbeda yang mereka bandingkan dan berapa volume tes ini. Sejumlah besar bahasa disebutkan dalam pracetak. Oleh karena itu, penelitian ini tidak dapat direproduksi: jika Anda mengambil teks sembarang dalam bahasa yang sama, itu bukanlah fakta bahwa pola yang sama akan muncul.

Maria Molina, seorang spesialis dalam metode korpus dalam studi bahasa kuno (Institute of Linguistics, RAS), setuju dengan Korovina. Metode baru dalam mengolah data linguistik, menurutnya, membantu memperoleh informasi tentang apa yang sebelumnya tertutup bagi peneliti bahasa. Namun, bahan masukan yang tidak dipersiapkan dengan baik sering kali mendiskreditkan teknik pemrosesan data terbaik sekalipun.

Kesimpulannya disusutkan oleh fakta bahwa kami tidak memahami materi apa yang mereka peroleh dan atas dasar apa mereka menguji formula mereka. Untuk materi saya, saya tahu pasti bahwa ada kesalahan metodologis kecil - dan saya mendapatkan angka yang sangat berbeda. - Maria Molina. Institut Linguistik RAS

"Sampah masuk - sampah keluar," tambah Molina (GIGO adalah prinsip dalam ilmu komputer yang berarti bahwa input data yang salah akan menghasilkan hasil yang salah, bahkan jika algoritme itu sendiri benar, - catat Indicator. Ru).

Metode statistik masih merupakan petunjuk hasil, bukan hasil

Albert Davletshin (seorang karyawan dari Pusat Studi Perbandingan Linguistik dari Institut Studi Perbandingan Universitas Negeri Rusia untuk Kemanusiaan, mempelajari bahasa Maya dan Polinesia) berbicara lebih tajam. Jika penulis pracetak tidak akan menguraikan manuskrip Voynich, mengapa mereka melakukannya? Dan lebih jauh lagi, jika kita berbicara secara khusus tentang penguraian kode tulisan yang tidak diketahui, pertanyaan demi pertanyaan muncul: “Tidak ada data awal tentang tulisan - jenis huruf apa? Bagaimana transkripsi yang berbeda diperoleh? Berapa banyak karakter? Apa yang mendasari asumsi yang ada tentang hakikat tulisan? Berapa panjang kata yang dipisahkan oleh spasi dan tanpa spasi? Apa arti spasi? Seberapa besar kamusnya? Berapa rasio tanda tangan dan gambar?

Pada awalnya, ternyata teksnya adalah Denmark dan hanya Denmark (dan ini secara historis tidak mungkin, yang tidak ada kata dalam karya itu). Kemudian ternyata teks tersebut dalam dua bahasa yang tidak diketahui (verifikasi pada tahap ini ternyata tidak mungkin dan diambil dengan keyakinan). Selain itu, ada banyak cara konservatif untuk menunjukkan bahwa dua halaman (besar) ditulis dalam satu huruf, tetapi dalam bahasa yang berbeda, tanpa menggunakan model matematika yang rumit. Terakhir, jika vokal dihilangkan dari teks, seberapa besar hal ini dikonfirmasi oleh metode standar yang telah lama dikenal (misalnya, Sukhotin, Shevoroshkina, dan Ventris)?"

Davletshin juga mengkritik ketidakpekaan terhadap filologi dan sejarah, karakteristik dari penelitian semacam ini:

Apa yang saya lihat dalam teks: sering ada orang yang ingin mengambil sumber X dan lupa bahwa itu adalah sumber dan ada dalam beberapa sejarah, termasuk bahasa, konteks, dan entah bagaimana menghitung sesuatu di dalamnya. Hipotesis bahwa ada lebih dari satu bahasa dalam sebuah naskah menarik. Tapi entah bagaimana Anda bisa menunjukkannya secara manusiawi. Metode statistik tetap merupakan petunjuk hasil, bukan hasil. -Albert Davletshin. Pusat Studi Banding Linguistik, IVKA RSUH

Tidak ada kriteria untuk membedakan hasil yang menarik dari yang buruk

Posisi yang lebih seimbang diambil oleh Georgy Starostin, seorang ahli linguistik sejarah komparatif (RSUH). Dia lebih tertarik pada betapa berguna metode matematika baru untuk memecahkan masalah yang dihadapi ahli bahasa. “Model yang disajikan dalam artikel membuat kesan yang aneh. Di satu sisi, ini tampaknya termasuk dalam kategori "buta", menganalisis data teks tanpa penilaian awal tentang struktur alfabet (misalnya, digraf, seperti bahasa Inggris ch, sh, harus dianggap sebagai kombinasi dari dua huruf, meskipun ini sebenarnya adalah satu suara). Di sisi lain, vokal dibuang dari string yang dibandingkan, yang menurut penulis teks, mengandung lebih sedikit informasi dan agak menambah kebisingan. Secara umum, basis pengujiannya jelas sangat kecil, tidak mungkin membicarakan sesuatu yang fundamental dalam banyak bahasa."

Hasil perbandingan bahasa Indo-Eropa dan Uralik, yang disajikan dalam tabel perbandingan 3 di artikel, tidak membangkitkan optimisme tertentu di Starostin. Beberapa indikator tingkat kedekatan bahasa ditangkap dengan baik (misalnya, koneksi intra-Jermanik atau intra-Romanesque), beberapa buruk (misalnya, metodologi tidak lagi mengidentifikasi rumpun Indo-Eropa). Hal utama adalah bahwa tidak ada kriteria untuk membedakan hasil yang menarik dari yang buruk. Dalam kasus terbaik, metode ini memungkinkan untuk memilih kelompok linguistik kecil (meskipun di sini metode ini tidak berhasil antara bahasa Finlandia dan Estonia yang berkerabat dekat), tetapi semua kelompok ini dapat diidentifikasi dengan andal tanpanya.

Tabel 3 dari pracetak, yang menyajikan hasil perbandingan bahasa Indo-Eropa dan Ural. Warna yang sama di tabel. 3 kelompok bahasa diidentifikasi berpasangan dekat (dalam arti norma L1 distribusi frekuensi teratur dalam teks tanpa vokal). Beberapa pasangan bahasa yang tidak terduga ditandai dengan warna merah, seperti Jerman / Hungaria, Inggris / Estonia, Latin / Basque, dan Yunani / Finlandia. Penulis pracetak: Arutyunov A. A., Borisov L. A., Zenyuk D. A., Ivchenko A. Yu., Kirina-Lilinskaya E. P., Orlov Yu. N., Osminin K. P., Fedorov S. L., Shilin S. A
Tabel 3 dari pracetak, yang menyajikan hasil perbandingan bahasa Indo-Eropa dan Ural. Warna yang sama di tabel. 3 kelompok bahasa diidentifikasi berpasangan dekat (dalam arti norma L1 distribusi frekuensi teratur dalam teks tanpa vokal). Beberapa pasangan bahasa yang tidak terduga ditandai dengan warna merah, seperti Jerman / Hungaria, Inggris / Estonia, Latin / Basque, dan Yunani / Finlandia. Penulis pracetak: Arutyunov A. A., Borisov L. A., Zenyuk D. A., Ivchenko A. Yu., Kirina-Lilinskaya E. P., Orlov Yu. N., Osminin K. P., Fedorov S. L., Shilin S. A

Tabel 3 dari pracetak, yang menyajikan hasil perbandingan bahasa Indo-Eropa dan Ural. Warna yang sama di tabel. 3 kelompok bahasa diidentifikasi berpasangan dekat (dalam arti norma L1 distribusi frekuensi teratur dalam teks tanpa vokal). Beberapa pasangan bahasa yang tidak terduga ditandai dengan warna merah, seperti Jerman / Hungaria, Inggris / Estonia, Latin / Basque, dan Yunani / Finlandia. Penulis pracetak: Arutyunov A. A., Borisov L. A., Zenyuk D. A., Ivchenko A. Yu., Kirina-Lilinskaya E. P., Orlov Yu. N., Osminin K. P., Fedorov S. L., Shilin S. A.

Akhirnya, adalah ide yang menarik untuk menentukan karakteristik genetik suatu bahasa dengan distribusi eksponen Hurst dan, mungkin, bahkan dibawa ke beberapa poin ilmiah. Tetapi ini membutuhkan pemrosesan sejumlah besar teks dalam berbagai bahasa. Dan masalah segera muncul: banyak bahasa tidak tertulis, dan seberapa benar membandingkan sistem pencatatan alfabet dengan transkripsi fonetik masih belum jelas. Hanya akan ada sedikit pengertian praktis dari gagasan ini, Starostin yakin. Paling banter, ini benar-benar dapat diterapkan pada insiden seperti manuskrip Voynich, ketika ada hipotesis bahwa beberapa bahasa dengan tulisan alfabet standar dienkripsi sesuai dengan prinsip tertentu (misalnya, dengan penghapusan vokal, dll.). Namun, hanya ada sedikit insiden seperti itu di dunia.

Menyimpulkan

Apa intinya? Diskusi seputar penelitian IPM dan MIPT mengungkapkan celah yang dalam antara komunitas linguistik (bahkan mereka yang menggunakan metode statistik) dan “orang luar” mengenai spesialis linguistik yang memutuskan untuk menerapkan alat matematika mereka pada materi linguistik.

Fakta bahwa matematikawan tidak mau bekerja sama dengan ahli bahasa tidak hanya menimbulkan kesalahan besar, yang kemudian bermigrasi ke media (misalnya bahasa Basque di pracetak disebut Indo-Eropa, ada frase "huruf vokal"). Keindahan model dan kekuatan komputasi superkomputer sebenarnya didevaluasi oleh kesalahan pada titik masuknya. Sekali lagi, dengan keinginan dan keterbukaan kontak dengan kolega dari disiplin lain, kesalahan ini dapat dengan mudah dihindari.

Lihat Manuskrip Voynich sendiri di sini.

Direkomendasikan: