https://frosthead.com

'Mona Lisa' Menjadi Hidup dalam 'Potret Hidup' yang Dihasilkan oleh Komputer

Seri Harry Potter membuat dunia terbiasa dengan gagasan potret hidup dengan lukisan-lukisannya yang berbicara dan foto-foto yang bergerak. Tapi minggu lalu, ketika “potret hidup” yang dihasilkan AI dari Mona Lisa karya Leonardo da Vinci mulai membuat putaran di web, banyak orang terkejut ketika potret terkenal itu menggerakkan bibirnya dan melihat sekeliling.

Potret animasi Lisa Gherardini adalah salah satu dari beberapa "model kepala bicara" baru - yang lebih dikenal sebagai "deepfake" - dibuat oleh para peneliti dari Pusat AI Samsung di Moskow dan Institut Sains dan Teknologi Skolkovo. Dengan hanya menggunakan beberapa kerangka referensi atau bahkan satu gambar tunggal, para peneliti juga membuat banyak selebriti seperti Oprah, menghidupkan snapshot tunggal Marilyn Monroe dan Albert Einstein, dan menciptakan ekspresi baru untuk gambar terkenal seperti Vermeer's Girl dengan Pearl Earring .

Para peneliti memposting metode mereka, yang mereka sebut "beberapa pembelajaran, " di YouTube dan dalam sebuah makalah yang belum ditinjau oleh rekan di repositori arXiv.org preprint. Sementara perinciannya cukup teknis, Mindy Weisberger di LiveScience melaporkan bahwa untuk menghasilkan potret hidup, sejenis kecerdasan buatan yang disebut jaringan saraf convolutional melatih dirinya dengan menganalisis gambar referensi. Ini kemudian menerapkan gerakan wajah dari serangkaian bingkai ke gambar statis, seperti Mona Lisa . Semakin banyak sudut dan referensi gambar yang dimilikinya, semakin baik potret yang hidup menjadi. Menurut makalah itu, AI dapat menghasilkan "realisme sempurna" (diukur dengan kemampuan manusia untuk membedakan mana dari tiga set gambar yang mendalam) menggunakan hanya 32 gambar referensi.

Mona Lisa, tentu saja, hanya satu gambar, sehingga tiga "potret hidup" karya agung Leonardo agak mengganggu. Untuk animasi singkat, jaringan saraf mengamati tiga video pelatihan yang berbeda, dan tiga versi Mona Lisa berdasarkan frame masing-masing tampaknya memiliki kepribadian yang berbeda. Jika Leonardo melukis model terkenalnya dari sudut yang berbeda, sistem tersebut dapat menghasilkan potret hidup yang lebih realistis.

Sementara animasi Mona Lisa menghibur, kebangkitan deepfake telah menimbulkan kekhawatiran bahwa kemiripan yang dihasilkan komputer dapat digunakan untuk mencemarkan nama baik orang, memicu ketegangan ras atau politik dan semakin mengikis kepercayaan di media online. “[T] mereka merusak kepercayaan kami pada semua video, termasuk yang asli, ” tulis John Villasenor di The Brookings Institution. "Kebenaran itu sendiri menjadi sulit dipahami, karena kita tidak bisa lagi memastikan apa yang nyata dan apa yang tidak."

Sementara AI sedang digunakan untuk membuat deepfake, Villasenor mengatakan bahwa, setidaknya untuk saat ini, itu juga dapat digunakan untuk mengidentifikasi deepfake dengan mencari inkonsistensi yang tidak terlihat oleh mata manusia.

Tim Hwang, direktur Etika dan Tata Kelola Inisiatif AI-Harvard-MIT, memberi tahu Gregory Barber di Wired bahwa kita belum sampai pada titik di mana aktor jahat dapat membuat deepfake canggih pada laptop pribadi mereka dulu. "Tidak ada yang menunjukkan kepada saya bahwa Anda hanya akan menggunakan turnkey untuk menghasilkan deepfakes di rumah, " katanya. "Tidak dalam jangka pendek, jangka menengah, atau bahkan jangka panjang."

Itu karena menggunakan sistem baru Samsung itu mahal dan membutuhkan keahlian. Tapi artikel Barber menunjukkan bahwa itu tidak mengambil video foto-realistis super canggih yang dibuat oleh jaringan saraf untuk membodohi orang. Baru minggu lalu, video yang dimanipulasi yang telah melambat membuat Ketua DPR AS Nancy Pelosi terdengar mabuk beredar di jejaring sosial.

Namun, pada akhirnya, teknologinya akan cukup baik sehingga pelaku yang buruk akan mampu menghasilkan deepfake yang begitu meyakinkan sehingga mereka tidak dapat dideteksi. Ketika hari itu tiba, Hwang memberi tahu Wired, orang-orang akan perlu mengandalkan pengecekan fakta dan petunjuk kontekstual untuk memilah apa yang nyata dan apa yang palsu. Misalnya, jika senyum setengah tertutup Mona Lisa menjadi seringai bergigi dan dia mencoba untuk menjual pasta gigi pemutih kepada Anda, itu pasti sulit.

'Mona Lisa' Menjadi Hidup dalam 'Potret Hidup' yang Dihasilkan oleh Komputer