https://frosthead.com

Tes Turing Mengukur Sesuatu, Tapi Itu Bukan “Kecerdasan”

Alan Turing, salah satu bapak zaman komputer, adalah pria yang luar biasa pandai. Begitu pintar, sehingga ia mengerti bahwa istilah "kecerdasan mesin" hampir tidak berarti. Lebih baik, ia beralasan, untuk berbicara tentang apa yang sebenarnya dapat dilakukan mesin: Bisakah itu berbicara? Bisakah itu menahan pembicaraan? Setidaknya itu adalah sesuatu yang bisa kita coba pelajari. Turing akhirnya mengusulkan apa yang kemudian dikenal sebagai "tes Turing": Jika seorang hakim tidak dapat membedakan mana dari dua entitas tersembunyi yang merupakan manusia dan mana yang merupakan buatan, mesin tersebut telah "lulus" tes - yang persis seperti itu. dikatakan telah terjadi Sabtu lalu di London.

Konten terkait

  • Silicon Valley Berutang Keberhasilannya Pada Jenius Teknologi Ini yang Belum Pernah Anda Dengar
  • Prediksi Alan Turing yang Berusia 60 Tahun Tentang Pola di Alam Terbukti Benar

"Kami ... bangga menyatakan bahwa tes Alan Turing telah lulus untuk pertama kalinya, " kata salah satu panitia, Kevin Warwick dari Universitas Reading, ketika hasilnya diumumkan. Chatbot yang menang bernama "Eugene Goostman, " sebuah program komputer yang meniru kepribadian bocah Ukraina berusia 13 tahun. "Eugene" berhasil meyakinkan 33 persen hakim bahwa itu adalah manusia pada acara hari Sabtu, yang diadakan di kantor Royal Society di London pada peringatan 60 tahun kematian Turing. (Turing, seorang homoseksual, dihukum karena ketidaksenonohan pada tahun 1952 dan diperintahkan untuk menjalani "pengobatan" hormonal sebagai bagian dari perjanjian pembelaan. Dua tahun kemudian ia meninggal karena keracunan sianida karena bunuh diri.)

Tapi kata hati-hati dalam urutan. "Kecerdasan" selalu menjadi subjek yang licin, dan tes Turing khususnya telah lama penuh dengan kontroversi. Turing menggambarkan bagaimana itu akan bekerja di sebuah makalah tahun 1950 berjudul "Mesin komputer dan kecerdasan." Dia mengambil ide dari permainan ruang tamu tradisional Victoria, di mana Anda mencoba mencari tahu apakah orang yang bersembunyi di balik tirai adalah pria atau wanita, hanya dengan mengajukan pertanyaan. (Jawaban atas pertanyaan harus dituliskan, karena suara itu akan menjadi hadiah.) Berikut adalah cara kerja versi Turing: Anda akan memiliki hakim, duduk di depan dua tirai, tanpa mengetahui apa yang ada di belakang mereka . Di belakang satu tirai adalah manusia; di belakang yang lain adalah sebuah komputer. Hakim dapat mengajukan pertanyaan dari salah satu dari dua entitas yang tersembunyi. Berdasarkan tanggapan, hakim mencoba mencari tahu apakah entitas yang disembunyikan adalah manusia atau mesin. (Turing membayangkan percakapan itu dimediasi oleh mesin teletype; hari ini, kita dapat menggunakan segala jenis elektronik, antarmuka berbasis teks, seperti yang digunakan di ruang obrolan Internet, atau pesan instan.)

Turing berspekulasi bahwa pada tahun 2000 "seorang interogator rata-rata tidak akan memiliki lebih dari 70 persen peluang untuk membuat identifikasi yang benar" - yaitu, program komputer akan menghalangi para hakim 30 persen dari waktu - setelah lima menit interogasi. "Lima menit" itu penting. Turing tidak berbicara tentang batas waktu sebagai bagian dari tes, dan orang dapat berargumen bahwa untuk sebuah mesin yang benar - benar lulus ujian, ia harus mampu menangani sejumlah pertanyaan. Agaknya kriteria lima menit adalah batas yang sewenang-wenang tetapi perlu. Tahun 2000 datang dan pergi, dengan chatbots hanya membuat kemajuan terhenti. (Dalam momen yang lebih bijaksana, menanggapi pertanyaan dari pewawancara BBC pada tahun 1952, Turing mengatakan itu akan 100 tahun sebelum sebuah mesin lulus ujian.)

Kembali pada tahun 2012, saya adalah seorang juri dalam "marathon tes Turing, " set tes Turing terbesar yang pernah dilakukan pada satu waktu; itu diadakan di Bletchley Park, di Inggris, tempat pekerjaan pemecahan kode penting Turing selama tahun-tahun terakhir Perang Dunia Kedua. (Diorganisir oleh tim yang sama yang menjalankan acara hari Sabtu, dan versi sebelumnya dari Eugene adalah pemenangnya waktu itu juga.) Pengaturan untuk acara hari Sabtu adalah sama seperti pada tahun 2012: Para hakim mengetik pertanyaan mereka di komputer, lalu tunggu balasan muncul di layar mereka; obrolan, bersama dengan "manusia tersembunyi, " berada di ruangan lain, tidak terlihat.

Hal pertama yang saya menjadi sangat sadar adalah bahwa ketika Anda seorang hakim dalam tes Turing, lima menit berlalu dengan sangat cepat. Dan semakin pendek pembicaraan, semakin besar keunggulan komputer; semakin lama interogasi, semakin tinggi kemungkinan komputer memberikan dirinya sendiri. Saya suka menyebutnya efek manekin: Pernahkah Anda meminta maaf kepada manekin department store, dengan anggapan bahwa Anda baru saja bertemu dengan manusia hidup? Jika pertemuan itu hanya berlangsung sepersekian detik, dengan Anda menghadap ke arah lain, Anda mungkin membayangkan bahwa Anda baru saja berhadapan dengan manusia. Semakin lama pertemuan itu, semakin jelas manekin-manekinnya.

Itu sama dengan chatbots. Pertukaran hello tidak mengungkapkan apa-apa - tetapi semakin Anda masuk ke dalamnya, semakin banyak masalah muncul. Chatbots, saya temukan, cenderung mengubah topik pembicaraan tanpa alasan. Seringkali, mereka tidak dapat menjawab pertanyaan sederhana. Dengan risiko terdengar samar-samar, mereka tidak terdengar manusia . Dalam salah satu percakapan saya di tahun 2012, saya mengetik lelucon sederhana - dan entitas yang saya ajak bicara langsung mengubah topik pembicaraan menjadi hamburger. (Ilmuwan komputer Scott Aaronson baru-baru ini memiliki pengalaman serupa ketika ia mengobrol dengan Eugene melalui situs web bot. Aaronson bertanya kepada Eugene berapa banyak kaki yang dimiliki unta; ia menjawab, "Sesuatu antara 2 dan 4. Mungkin, tiga? :-)))" Kemudian, ketika Aaronson bertanya berapa banyak kaki yang dimiliki seekor semut, Eugene mengeluarkan jawaban yang sama persis, triple-smiley dan semuanya.)

Perhatikan juga bahwa Eugene tidak meniru orang dewasa berbahasa Inggris; itu berpura-pura menjadi remaja Ukraina muda dan agak kurang ajar, berbicara dalam bahasa Inggris yang cukup baik (tapi jauh dari sempurna). Seperti yang dikatakan Vladimir Veselov, salah satu pengembang program, kepada Mashable.com : "Kami menghabiskan banyak waktu mengembangkan karakter dengan kepribadian yang dapat dipercaya." Meskipun Eugene akan melibatkan siapa pun pada topik apa pun, usianya "membuatnya sangat masuk akal bahwa ia tidak melakukannya." "Aku tahu segalanya." Eugene tidak langsung keluar dan mengumumkan umur dan kewarganegaraannya; tetapi dia akan mengungkapkannya jika diminta - dan hasil akhirnya mungkin sejumlah keringanan hukuman dari para hakim, terutama mengenai tata bahasa Inggris dan penggunaan kata. (Saya berasumsi sebagian besar hakim pada hari Sabtu adalah penutur asli bahasa Inggris, meskipun saya tidak tahu pasti ini.) Tabel kemungkinan akan berubah jika Eugene pernah bertemu dengan penutur asli Ukraina sebagai hakim.

Perjuangan untuk membangun mesin bicara menyoroti betapa rumitnya bahasa. Ini bukan hanya masalah berbicara - Anda harus berbicara tentang sesuatu, dan apa yang Anda katakan harus masuk akal - dan itu harus masuk akal dalam konteks apa yang baru saja dikatakan orang lain . Bagi kami, itu mudah; untuk komputer, tidak banyak. Maka, chatbots bergantung pada bermacam-macam trik: Menghafal megabita tanggapan kalengan, atau menjelajahi Internet untuk dialog yang mungkin mendekati percakapan mereka saat ini di tengah-tengah. Dengan kata lain, apa yang tidak dimiliki oleh mesin dalam kecerdasannya adalah kemampuannya untuk menebus kekuatan komputasi mentah. Inilah sebabnya mengapa Google atau Siri (asisten pribadi iPhone) tampak sangat cerdas bagi kami: Siri mungkin tidak memiliki "pikiran", tetapi ia memiliki akses ke basis data informasi yang sangat luas, ia dapat bertindak seolah-olah memang demikian. Itu adalah pendekatan brute-force yang sama yang memungkinkan "Watson" IBM menang di Jeopardy! di 2011.

Semua ini menimbulkan pertanyaan penting: Apa tepatnya, yang diukur oleh tes Turing? Beberapa kritikus berpendapat bahwa itu adalah tipu daya penghargaan daripada kecerdasan. Psikolog NYU Gary Marcus, yang menulis di NewYorker.com, mengatakan Eugene berhasil "dengan mengeksekusi serangkaian 'ploys' yang dirancang untuk menutupi keterbatasan program." Steven Harnad, seorang psikolog dan ilmuwan komputer di University of Quebec di Montreal, bahkan lebih skeptis, mengatakan kepada The Guardian bahwa itu "omong kosong" untuk mengklaim bahwa Eugene telah lulus tes Turing. (Untuk kreditnya, Turing sangat menyadari masalah ini; ia menyebut idenya "permainan imitasi, " dan berbicara tentang kecerdasan hanya dengan hemat.) Bahkan lebih canggung, komputer, tidak seperti manusia, terpaksa menipu. “Tes Turing benar-benar tes untuk menjadi pembohong yang sukses, ” Pat Hayes, seorang ilmuwan komputer di Institute for Human and Machine Cognition di Pensacola, Florida, mengatakan kepada saya setelah mengikuti tes maraton Turing 2012. "Jika Anda memiliki sesuatu yang benar-benar dapat melewati permainan imitasi Turing, itu akan menjadi 'tiruan manusia' yang sangat sukses."

Dan "manusia" adalah poin kunci lainnya: Apakah tidak mungkin ada jenis kecerdasan lain di dunia, di luar jenis yang ditunjukkan oleh spesies kita? Mesin yang benar-benar cerdas akan memiliki aplikasi praktis yang tak terhitung jumlahnya, tetapi mengapa fokus pada menciptakan lebih banyak "orang"? Lagipula, kita sudah memiliki banyak orang. Seperti yang ditunjukkan oleh ahli bahasa Noam Chomsky, ketika kita berusaha untuk membangun sebuah mesin yang bergerak di bawah air, kita tidak mengharuskannya untuk "berenang" - dan kapal selam tidak kurang dari sebuah pencapaian karena ketidakmampuannya untuk melakukan gaya punggung.

Ya, Eugene mengesankan, setidaknya dalam semburan kecil. Namun, bahkan obrolan terbaik pun tersandung pada pertanyaan yang bisa ditangani oleh anak separuh usia Eugene yang berusia setengah tahun. Mungkin tidak mengherankan, sebagian besar peneliti AI menghabiskan sedikit waktu terobsesi dengan tes Turing. Mesin intelijen, pada kenyataannya, bergerak maju, dan agak cepat. Perangkat lunak terjemahan suara-ke-teks, yang cukup menyedihkan beberapa tahun yang lalu, mengalami peningkatan pesat, begitu pula program-program terjemahan bahasa. Amazon sering memiliki ide bagus tentang apa yang ingin Anda beli bahkan sebelum melakukannya. Dan mobil self-driving Google akan menjadi fantasi belaka satu dekade yang lalu. Tetapi percakapan, seperti yang terus kami temukan kembali, sangat sulit, dan tidak mungkin menjadi batas di mana AI bersinar paling terang. Untuk saat ini, jika Anda sedang mencari seseorang untuk diajak ngobrol, saya sarankan manusia yang nyata.

Dan Falk adalah seorang jurnalis sains yang berbasis di Toronto.

Tes Turing Mengukur Sesuatu, Tapi Itu Bukan “Kecerdasan”