https://frosthead.com

Bisakah Komputer Menguraikan Bahasa Berusia 5.000 Tahun?

Peradaban Indus, yang berkembang hampir sepanjang milenium ketiga SM, adalah masyarakat paling luas pada masanya. Pada puncaknya, ia meliputi area seluas lebih dari setengah juta mil persegi yang berpusat di tempat yang sekarang menjadi perbatasan India-Pakistan. Sisa-sisa Indus telah ditemukan sejauh utara Himalaya dan sejauh selatan Mumbai. Itu adalah budaya urban paling awal yang diketahui dari anak benua dan membual dua kota besar, satu di Harappa dan satu di Mohenjo-daro. Namun terlepas dari ukuran dan umur panjangnya, dan meskipun hampir satu abad penyelidikan arkeologis, banyak tentang Indus yang masih diselimuti misteri.

Apa yang sedikit kita ketahui berasal dari penggalian arkeologis yang dimulai pada 1920-an dan berlanjut hingga hari ini. Selama beberapa dekade, para arkeolog telah menemukan banyak sekali artefak, termasuk meterai perangko, jimat dan tablet kecil. Banyak dari artefak-artefak ini mengandung spesimen-spesimen tulisan yang tampak — figur-figur berukir yang menyerupai, antara lain, sepatu kuda bersayap, roda spoked, dan ikan tegak. Apa sebenarnya arti dari simbol-simbol itu, tetap merupakan salah satu teka-teki terpecahkan yang paling terkenal dalam keilmuan peradaban kuno.

Ada kode sulit lainnya untuk dipecahkan dalam sejarah. Ilmuwan Mesir yang bingung menemukan keberuntungan saat menemukan batu Rosetta yang terkenal pada tahun 1799, yang berisi teks dalam bahasa Mesir dan Yunani. Studi tentang hieroglif Maya merana sampai seorang ahli bahasa Rusia bernama Yury Knorozov menggunakan bahasa Maya kontemporer yang pandai di tahun 1950-an. Tetapi tidak ada batu Rosetta dari Indus, dan para sarjana tidak tahu bahasa mana, jika ada, yang mungkin diturunkan dari yang diucapkan oleh orang-orang Indus.

Sekitar 22 tahun yang lalu, di Hyderabad, India, seorang siswa kelas delapan bernama Rajesh Rao membalik halaman buku teks sejarah dan pertama kali belajar tentang peradaban yang menarik ini dan aksara misteriusnya. Pada tahun-tahun berikutnya, sekolah dan profesi Rao membawanya ke arah yang berbeda — ia akhirnya mengejar ilmu komputer, yang ia ajarkan hari ini di Universitas Washington di Seattle — tetapi ia memantau beasiswa Indus dengan cermat, mengawasi lusinan orang gagal. mencoba memahami naskah. Bahkan ketika ia mempelajari kecerdasan buatan dan robotika, Rao mengumpulkan perpustakaan kecil buku dan monograf pada naskah Indus, sekitar 30 di antaranya. Di rak buku terdekat, ia juga menyimpan buku pelajaran sejarah kelas delapan yang berharga yang mengenalkannya pada Indus.

“Sungguh menakjubkan melihat sejumlah ide yang disarankan orang, ” katanya. Beberapa cendekiawan mengklaim bahwa tulisan itu adalah sejenis naskah Sumeria; yang lain menempatkannya di keluarga Dravida; yang lain lagi berpikir itu terkait dengan bahasa Pulau Paskah. Rao mulai menghargai bahwa ini "mungkin salah satu masalah yang paling menantang dalam hal sejarah kuno."

Ketika upaya demi upaya gagal menguraikan naskah, beberapa ahli mulai kehilangan harapan bahwa itu bisa diterjemahkan. Pada tahun 2004, tiga sarjana berpendapat dalam sebuah makalah kontroversial bahwa simbol Indus tidak memiliki konten linguistik sama sekali. Sebaliknya, simbol-simbol itu mungkin lebih dari piktogram yang mewakili tokoh politik atau agama. Para penulis melangkah lebih jauh dengan menyarankan bahwa Indus sama sekali bukan peradaban melek. Bagi sebagian orang di lapangan, seluruh upaya mencari bahasa di balik lukisan Indus itu mulai menyerupai latihan sia-sia.

Beberapa tahun kemudian, Rao memasuki medan pertempuran. Sampai saat itu, orang yang mempelajari skrip adalah arkeolog, sejarawan, ahli bahasa atau cryptologis. Tetapi Rao memutuskan untuk membongkar rahasia naskah Indus menggunakan alat yang paling dikenalnya — ilmu komputer.

Terpesona oleh peradaban Indus sejak kelas delapan, Rajesh Rao menggunakan ilmu komputer dan sebuah konsep yang disebut "conditional entropy" untuk membantu memecahkan kode skrip Indus. (Atas perkenan David Zax) Selama beberapa dekade, para arkeolog telah menemukan banyak sekali artefak dari peradaban Indus, termasuk meterai perangko, jimat dan tablet kecil. (Robert Harding / Robert Harding World Imagery / Corbis) Rao dan rekan-rekannya menerbitkan temuan mereka di jurnal Science pada bulan Mei. Mereka tidak menguraikan bahasa tersebut tetapi temuan mereka mempertajam pemahamannya. (Robert Harding / Robert Harding World Imagery / Corbis) Rao dan rekan-rekannya sekarang melihat rangkaian karakter yang lebih panjang daripada yang mereka analisis dalam makalah Science . Menemukan pola pada gilirannya akan membantu menentukan keluarga bahasa script mana yang mungkin dimiliki. (Atas perkenan David Zax)

Pada suatu hari musim panas di Seattle, Rao menyambut saya ke kantornya untuk menunjukkan kepada saya bagaimana ia dan rekan-rekannya mendekati masalah tersebut. Dia menetapkan koleksi replika tayangan stempel tanah liat yang muncul dari para arkeolog dari situs Indus. Mereka kecil — seperti cokelat kotak kecil — dan sebagian besar menampilkan gambar binatang di bawah serangkaian simbol Indus. Sebagian besar contoh skrip Indus adalah miniatur seperti ini, hanya memiliki beberapa karakter; tidak ada grand monolith yang ditemukan. Para sarjana tidak yakin dengan fungsi segel kecil, kata Rao kepada saya, tetapi satu teori adalah bahwa mereka mungkin telah digunakan untuk menyatakan kualitas barang yang diperdagangkan. Yang lain menunjukkan bahwa segel mungkin merupakan cara untuk memastikan bahwa pedagang membayar pajak saat memasuki atau meninggalkan kota — banyak segel ditemukan di antara reruntuhan rumah gerbang, yang mungkin berfungsi seperti pintu tol kuno.

Rao dan rekan-rekannya tidak berusaha untuk membuat mukjizat — mereka tahu bahwa mereka tidak memiliki cukup informasi untuk menguraikan naskah kuno — tetapi mereka berhipotesis bahwa dengan menggunakan metode komputasi, mereka setidaknya bisa mulai membuat tulisan seperti apa Indus skrip adalah: apakah itu menyandikan bahasa, atau tidak? Mereka melakukan ini dengan menggunakan konsep yang disebut "kondisional entropi."

Terlepas dari nama yang mengesankan, entropi kondisional adalah konsep yang cukup sederhana: ini adalah ukuran jumlah keacakan dalam suatu urutan. Pertimbangkan alfabet kami. Jika Anda mengambil ubin Scrabble dan melemparkannya ke udara, Anda mungkin menemukan huruf lama muncul setelah yang lain. Tetapi dalam kata-kata bahasa Inggris yang sebenarnya, surat-surat tertentu lebih mungkin terjadi setelah orang lain. A q dalam bahasa Inggris hampir selalu diikuti oleh a. A dapat diikuti oleh r atau e, tetapi kecil kemungkinannya diikuti oleh n atau a.

Rao dan rekan-rekannya — kelompok internasional termasuk ilmuwan komputer, astrofisikawan, dan ahli matematika — menggunakan program komputer untuk mengukur entropi kondisional dari naskah Indus. Kemudian mereka mengukur entropi kondisional dari jenis sistem lain — bahasa alami (Sumeria, Tamil, Sansekerta, dan Inggris), bahasa buatan (bahasa pemrograman komputer Fortran) dan sistem non-linguistik (sekuens DNA manusia, sekuens protein bakteri, dan dua set data buatan yang mewakili entropi kondisional ekstrem tinggi dan rendah). Ketika mereka membandingkan jumlah keacakan dalam naskah Indus dengan yang ada di sistem lain, mereka menemukan bahwa itu sangat mirip dengan tingkat yang ditemukan dalam bahasa alami. Mereka menerbitkan temuan mereka pada bulan Mei di jurnal Science .

Jika terlihat seperti bahasa, dan itu bertindak seperti bahasa, maka itu mungkin bahasa, makalah mereka menyarankan. Temuan tidak menguraikan naskah, tentu saja, tetapi mereka mempertajam pemahaman kita tentang hal itu, dan telah memberikan jaminan kepada para arkeolog yang telah bekerja di bawah asumsi bahwa naskah Indus mengkode bahasa.

Setelah menerbitkan koran, Rao mendapat kejutan. Pertanyaannya, dari keluarga bahasa mana naskah itu berasal, adalah yang sensitif: karena usia dan signifikansi peradaban Indus, banyak kelompok kontemporer di India ingin mengklaimnya sebagai leluhur langsung. Misalnya, orang-orang India yang berbahasa Tamil di selatan lebih suka mengetahui bahwa naskah Indus adalah sejenis proto-Dravida, karena Tamil diturunkan dari proto-Dravida. Penutur bahasa Hindi di utara lebih suka bahasa Arab kuno, nenek moyang bahasa Hindi. Makalah Rao tidak menyimpulkan dari keluarga bahasa mana naskah itu berasal, meskipun ia mencatat bahwa entropi bersyarat serupa dengan Tamil Tua — menyebabkan beberapa kritikus ringkasnya “menuduh kami sebagai nasionalis Dravida, ” kata Rao. "Kegigihan tuduhan dan serangan sama sekali tidak terduga."

Kadang-kadang Rao merasa lega ketika kembali ke dunia neuroscience dan robotika yang tidak begitu sengit. Tetapi panggilan naskah Indus tetap memikat, dan “apa yang dulunya hobi sekarang memonopoli lebih dari sepertiga waktu saya, ” katanya. Rao dan rekan-rekannya sekarang melihat rangkaian karakter yang lebih panjang daripada yang mereka analisis dalam makalah Science . “Jika ada pola, ” kata Rao, “kita bisa membuat aturan tata bahasa. Itu pada gilirannya akan memberi kendala pada jenis keluarga bahasa apa ”naskah itu mungkin berasal.

Dia berharap bahwa penemuannya di masa depan akan berbicara untuk diri mereka sendiri, menghasut lebih sedikit dendam dari lawan rooting untuk satu wilayah India versus yang lain. Sementara itu, ketika Rao berbicara tentang apa arti naskah Indus baginya, ia cenderung berbicara dalam istilah India secara keseluruhan. “Warisan India akan sangat diperkaya jika kita dapat memahami peradaban Indus, ” katanya. Rao dan rekan-rekannya sedang mengerjakannya, satu baris kode sumber sekaligus.

Bisakah Komputer Menguraikan Bahasa Berusia 5.000 Tahun?