https://frosthead.com

AI Adalah Belajar Kerja Tim dengan Mendominasi dalam Permainan Video Multi Pemain

Komputer telah mendominasi manusia dalam satu-satu permainan seperti catur selama beberapa dekade, tetapi mendapatkan kecerdasan buatan (AI) untuk bekerja sama dengan rekan satu tim sedikit lebih rumit. Sekarang, para peneliti di proyek DeepMind Google telah mengajarkan para pemain AI untuk bekerja bersama dalam tim dengan manusia dan komputer lain untuk bersaing dalam permainan video 1999, Quake III Arena .

Edd Gent di Science melaporkan bahwa ketika AI hanya memiliki satu lawan, biasanya cukup baik karena itu hanya mengantisipasi kemungkinan pergerakan satu pikiran. Tetapi kerja tim adalah masalah yang sangat berbeda karena ini mencakup tindakan yang tidak biasa dimiliki komputer, seperti memprediksi bagaimana sekelompok rekan kerja akan berperilaku. Agar AI benar-benar bermanfaat, ia harus belajar cara bekerja sama dengan kecerdasan lain.

Tim DeepMind Google menjelaskan dalam sebuah posting blog:

“Miliaran orang menghuni planet ini, masing-masing dengan tujuan dan tindakan masing-masing, tetapi masih mampu berkumpul bersama melalui tim, organisasi, dan masyarakat dalam tampilan kecerdasan kolektif yang mengesankan. Ini adalah pengaturan yang kami sebut pembelajaran multi-agen: banyak agen individu harus bertindak secara independen, namun belajar untuk berinteraksi dan bekerja sama dengan agen lain. Ini adalah masalah yang sangat sulit - karena dengan agen adaptasi bersama dunia terus berubah. ”

Multiplayer, permainan video orang pertama, di mana tim pemain berkeliaran di dunia virtual, biasanya menembakkan senjata atau peluncur granat satu sama lain, adalah tempat yang sempurna bagi AI untuk mempelajari seluk-beluk kerja tim. Setiap pemain harus bertindak secara individu dan membuat pilihan yang menguntungkan tim secara keseluruhan.

Untuk penelitian, tim melatih AI untuk bermain menangkap bendera pada platform Quake III Arena . Aturannya cukup sederhana: Dua tim berhadapan di medan perang seperti labirin. Tujuannya adalah untuk menangkap sebanyak mungkin bendera virtual tim lainnya sambil melindungi bendera mereka sendiri, dan tim mana pun yang menangkap bendera terbanyak dalam kemenangan lima menit. Namun dalam praktiknya, berbagai hal bisa menjadi sangat rumit dengan cepat.

Tim DeepMind menciptakan 30 algoritma jaringan saraf dan meminta mereka saling bertarung dalam serangkaian peta permainan yang dibuat secara acak. Bot mencetak poin dengan menangkap bendera dan menepuk-nepuk pemain lain, mengirim mereka kembali ke area respawn di mana karakter mereka di-reboot. Pada awalnya, aksi bot tampak acak. Namun, semakin banyak mereka bermain, semakin baik mereka menjadi. Setiap jaringan saraf yang hilang secara konsisten dihilangkan dan digantikan oleh versi modifikasi dari memenangkan AI. Pada akhir 450.000 pertandingan, tim memahkotai satu jaringan saraf — dijuluki For the Win (FTW) - sebagai juara.

Kelompok DeepMind memainkan algoritma FTW terhadap apa yang disebut mirror bots, yang tidak memiliki keterampilan belajar AI, dan kemudian melawan tim manusia juga. FTW menghancurkan semua penantang.

Kelompok ini kemudian mengadakan turnamen di mana 40 pemain manusia dicocokkan secara acak sebagai rekan satu tim dan lawan bot. Menurut posting blog, pemain manusia menemukan bot lebih kolaboratif daripada rekan setimnya di kehidupan nyata. Pemain manusia yang dipasangkan dengan agen FTW mampu mengalahkan prajurit cyber di sekitar 5 persen pertandingan.

Ketika mereka belajar, bot menemukan beberapa strategi yang sudah lama dianut oleh pemain manusia, seperti nongkrong di dekat titik respawn bendera untuk meraihnya ketika itu muncul kembali. Tim FTW juga menemukan bug yang bisa mereka eksploitasi: jika mereka menembak rekan satu tim mereka sendiri di belakang, itu memberi mereka dorongan kecepatan, sesuatu yang mereka gunakan untuk keuntungan mereka.

"Apa yang luar biasa selama pengembangan proyek ini adalah melihat munculnya beberapa perilaku tingkat tinggi ini, " kata peneliti DeepMind dan penulis utama Max Jaderberg kepada Gent. "Ini adalah hal-hal yang bisa kita hubungkan sebagai pemain manusia."

Salah satu alasan utama bot lebih baik daripada pemain manusia adalah karena mereka penembak jitu yang cepat dan akurat, membuat mereka lebih cepat dalam undian daripada lawan manusia mereka. Tapi itu bukan satu-satunya faktor dalam kesuksesan mereka. Menurut blog itu, ketika para peneliti membuat waktu reaksi seperempat detik tertunda menjadi penembak-robo, manusia terbaik masih bisa mengalahkan mereka sekitar 21 persen dari waktu.

Sejak studi awal ini, FTW dan keturunannya telah dilepaskan di medan perang Quake III Arena penuh, dan telah menunjukkan bahwa mereka dapat menguasai dunia yang lebih kompleks dengan lebih banyak pilihan dan nuansa. Mereka juga telah menciptakan bot yang unggul di game ruang strategi ultra-kompleks Starcraft II.

Tetapi penelitian ini bukan hanya tentang membuat algoritma video game yang lebih baik. Belajar tentang kerja tim pada akhirnya dapat membantu AI bekerja dalam armada mobil yang dapat dikendarai sendiri atau mungkin suatu hari nanti menjadi asisten robot yang membantu mengantisipasi kebutuhan ahli bedah, lapor Gent Science .

Namun, tidak semua orang menganggap bot bintang-arcade mewakili kerja tim yang sebenarnya. Peneliti AI Mark Riedl dari Georgia Tech mengatakan kepada The New York Times bahwa bot sangat bagus dalam permainan karena masing-masing memahami strategi secara mendalam. Tapi itu belum tentu kerjasama karena tim AI kekurangan satu elemen penting dari kerja tim manusia: komunikasi dan kerja sama yang disengaja.

Dan, tentu saja, mereka juga tidak memiliki ciri khas lain dari pengalaman bermain video game: berbicara omong kosong dengan tim lain.

AI Adalah Belajar Kerja Tim dengan Mendominasi dalam Permainan Video Multi Pemain