https://frosthead.com

AI Mengajar Dirinya Sendiri untuk Bermain Go Tanpa Bantuan Manusia

Tahun lalu, sebuah program kecerdasan buatan yang disebut AlphaGo yang dibuat oleh tim DeepMind Google mengalahkan seorang juara manusia di Go, sebuah permainan strategi Tiongkok kuno yang dalam banyak hal lebih kompleks daripada catur. Seperti yang dilaporkan Emily Matchar untuk Smithsonian.com pada saat itu, itu adalah pencapaian yang menakjubkan, karena pada akhir 1997 beberapa orang memperkirakan akan dibutuhkan 100 tahun bagi komputer untuk mengalahkan manusia di Go.

Sementara hal itu mengesankan, AlphaGo belajar memainkan game dengan menganalisis game sebelumnya yang dimainkan oleh manusia. Tetapi seperti yang dilaporkan Merrit Kennedy di NPR, versi baru dari kecerdasan buatan yang disebut AlphaGo Zero telah menemukan cara untuk menguasai permainan sendiri, tanpa input atau manipulasi manusia - suatu kemajuan yang memiliki implikasi besar bagi pengembangan AI di masa depan.

Menurut siaran pers dari DeepMind, versi sebelumnya dari AlphaGo belajar bermain game dengan mempelajari pertandingan antara pemain amatir yang profesional dan kuat, menyerap aturan permainan dan strategi permainan yang sukses. AlphaGo Zero, bagaimanapun, tidak melihat permainan yang dimainkan oleh manusia. Sebaliknya, itu diberikan aturan permainan dan kemudian bermain melawan dirinya sendiri, menggunakan pembelajaran penguatan untuk mengajar dirinya sendiri gerakan yang benar dan salah dan strategi jangka panjang. Ketika AI memainkan permainan, itu memperbarui jaringan saraf canggih untuk lebih memprediksi pergerakan lawannya.

Para peneliti menyaksikan AI menguasai permainan secara real time. Setelah tiga hari mampu mengalahkan versi sebelumnya yang disebut AlphaGo Lee, yang mengalahkan master Go Korea Lee Sedol dalam 4 dari 5 game pada 2016. Setelah 21 hari itu mengalahkan AlphaGo Master, versi yang mengalahkan 60 pemain Go online dan pemain terbaik dunia Ke Jie awal tahun ini. Versi terbaru mengungguli game AlphaGo Master 100 menjadi 0. Setelah 40 hari, itu mencapai tingkat permainan yang belum pernah dilihat siapa pun sebelumnya. Penelitian ini muncul dalam jurnal Nature.

"Dalam waktu singkat, AlphaGo Zero telah memahami semua pengetahuan Go yang telah diakumulasikan oleh manusia selama ribuan tahun bermain, " kata pemimpin peneliti David Silver dari Google DeepMind dalam sebuah video Youtube. "Kadang-kadang itu sebenarnya dipilih untuk melampaui itu dan menemukan sesuatu yang manusia bahkan belum menemukan pada periode waktu ini dan menemukan potongan-potongan pengetahuan baru yang kreatif dan novel dalam banyak hal."

Seperti yang dilaporkan Agence France-Presse, AlphaGo Zero mencapai tingkat penguasaan ini jauh lebih efisien daripada pendahulunya. Sementara iterasi sebelumnya memiliki 48 unit pemrosesan data dan memainkan 30 juta game pelatihan selama beberapa bulan, Zero hanya memiliki 4 unit pemrosesan dan memainkan 4, 9 juta game pelatihan selama tiga hari. "Orang-orang cenderung berasumsi bahwa pembelajaran mesin adalah tentang data besar dan jumlah komputasi besar tetapi sebenarnya apa yang kami lihat dengan AlphaGo Zero adalah bahwa algoritma lebih penting, " kata Silver kepada AFP.

Tetapi penelitian ini lebih dari sekedar menguasai permainan papan. Seperti yang Ian Sample di The Guardian laporkan, pembelajaran jenis tabula rasa, atau batu tulis kosong, dapat mengarah pada generasi baru kecerdasan buatan tujuan umum yang dapat membantu menyelesaikan masalah di bidang yang dapat disimulasikan dengan baik di komputer, seperti komposisi obat, pelipatan protein atau fisika partikel. Dengan membangun pengetahuannya dari bawah ke atas tanpa bias atau keterbatasan manusia, algoritme bisa mengarah ke arah yang belum dipikirkan manusia.

Sementara banyak orang dalam komunitas AI melihat AlphaGo Zero sebagai pencapaian besar, Gary Marcus, profesor psikologi di New York University yang berspesialisasi dalam kecerdasan buatan, mengatakan kepada NPR Kennedy bahwa ia tidak berpikir algoritma itu benar-benar tabula rasa karena pengetahuan manusia sebelumnya ke dalam pembangunan algoritma. Dia juga tidak menganggap tabula rasa AI sama pentingnya dengan kelihatannya. "Dalam biologi, otak manusia yang sebenarnya bukanlah tabula rasa ... Saya tidak melihat alasan teoritis utama mengapa Anda harus melakukan itu, mengapa Anda harus meninggalkan banyak pengetahuan yang kita miliki tentang dunia, " katanya.

Meski begitu, penguasaan game Alpha Go yang luar biasa mengesankan — dan sedikit menakutkan.

AI Mengajar Dirinya Sendiri untuk Bermain Go Tanpa Bantuan Manusia