https://frosthead.com

Senyum, Berkerut, Meringis dan Menyeringai - Ekspresi Wajah Anda Adalah Batas Berikutnya dalam Data Besar

Wajah manusia bertenaga, tergantung pada bagaimana Anda menghitungnya, oleh antara 23 dan 43 otot, banyak yang menempel pada kulit, tidak melayani fungsi yang jelas untuk bertahan hidup. Seorang alien yang memeriksa spesimen manusia dalam isolasi tidak akan tahu apa yang harus mereka lakukan. Menarik-narik dahi, alis, bibir dan pipi, otot-otot menyiarkan banyak informasi tentang keadaan emosi kita, tingkat minat dan kewaspadaan. Ini adalah sarana komunikasi yang sangat efisien — hampir seketika, biasanya akurat, mengatasi sebagian besar hambatan bahasa dan budaya. Namun terkadang data hilang, diabaikan atau disalahartikan. Jika seorang penebang tersenyum di hutan tanpa ada yang melihat, apakah dia benar-benar bahagia?

Dari Kisah Ini

[×] TUTUP

Begitu lama emotikon. Ilmuwan sedang mengembangkan teknologi yang dapat mendeteksi dan membaca ekspresi kami

Video: Smithsonian Ingenuity Awards 2015: Rana el Kaliouby

Bacaan terkait

Preview thumbnail for video 'Emotional Intelligence: Why It Can Matter More Than IQ

Kecerdasan Emosional: Mengapa Bisa Lebih Penting Daripada IQ

Membeli

Rana el Kaliouby benci melihat informasi itu sia-sia. Bertemu el Kaliouby di kantor kecilnya di Waltham, Massachusetts, saya melihat dia mengontrak otot utamanya zygomaticus, menaikkan sudut mulutnya, dan orbicularis oculi-nya, mengerutkan sudut luar matanya. Dia tersenyum, dan saya menyimpulkan bahwa dia menyambut saya, bahkan sebelum dia mengeluarkan kata "halo." Tetapi banyak pertukaran sosial hari ini terjadi tanpa interaksi tatap muka real-time. Di situlah el Kaliouby, dan perusahaannya, masuk.

El Kaliouby, 37 tahun, sering tersenyum. Dia memiliki wajah bulat, menyenangkan, ekspresif, dan sikap peduli, memercayai posisinya sebagai co-founder dari perusahaan pemula yang tumbuh dengan cepat — anti-Bezos, un-Zuckerberg. Perusahaannya, Affectiva, yang ia dirikan pada 2009 bersama rekannya di MIT Media Lab, Rosalind Picard, menempati posisi terdepan dalam teknologi untuk menggunakan komputer untuk mendeteksi dan menafsirkan ekspresi wajah manusia. Bidang ini, yang dikenal sebagai "komputasi afektif, " berupaya untuk menutup kesenjangan komunikasi antara manusia dan mesin dengan menambahkan mode interaksi baru, termasuk bahasa nonverbal dari senyum, senyum, dan alis yang terangkat. "Premis dari apa yang kita lakukan adalah bahwa emosi itu penting, " kata el Kaliouby. “Emosi tidak mengganggu pemikiran rasional kita tetapi membimbing dan menginformasikannya. Tetapi mereka hilang dari pengalaman digital kami. Ponsel cerdas Anda tahu siapa Anda dan di mana Anda berada, tetapi ia tidak tahu bagaimana perasaan Anda. Kami bertujuan untuk memperbaikinya. "

Mengapa ponsel cerdas Anda perlu tahu bagaimana perasaan Anda? El Kaliouby memiliki sejumlah jawaban, semuanya didasarkan pada integrasi komputer yang tampaknya tak terbatas ke dalam rutinitas kehidupan kita sehari-hari. Dia membayangkan "teknologi untuk mengontrol pencahayaan, suhu, dan musik di rumah kita sebagai respons terhadap suasana hati kita, " atau aplikasi yang dapat mengadaptasi konten film berdasarkan reaksi bawah sadar Anda terhadapnya saat Anda menonton. Dia membayangkan program yang dapat memantau ekspresi Anda saat Anda mengemudi dan memperingatkan kurangnya perhatian, kantuk atau kemarahan. Dia tersenyum ketika menyebutkan ide favoritnya— "kulkas yang bisa merasakan ketika kamu stres dan mengunci es krim."

Secara khusus, dia berpikir Affectiva, dan teknologi yang membantu mengantar ke arus utama, akan menjadi keuntungan bagi perawatan kesehatan. Seorang peneliti yang menguji obat baru, atau terapis yang merawat pasien, mendapat umpan balik hanya pada interval waktu tertentu, tunduk pada semua masalah pelaporan diri — keinginan tak sadar untuk menyenangkan dokter, misalnya, atau ingatan selektif yang mendukung ingatan terbaru. . El Kaliouby membayangkan sebuah program yang berjalan di latar belakang laptop atau telepon subjek yang dapat menyusun catatan momen-demi-saat dari suasana hatinya selama periode waktu tertentu (satu hari, satu bulan) dan menghubungkannya dengan waktu atau apa pun yang dapat diukur atau dilacak oleh perangkat Anda. "Itu bahkan tidak harus menjadi bagian dari program perawatan, " renungnya. "Kau bisa memilikinya di ponselmu dan itu memberitahumu, setiap kali 'X' memanggilmu memiliki ekspresi negatif, dan itu memberitahumu sesuatu yang mungkin tidak kamu ketahui."

Preview thumbnail for video 'Subscribe to Smithsonian magazine now for just $12

Berlangganan majalah Smithsonian sekarang hanya dengan $ 12

Kisah ini adalah pilihan dari majalah Smithsonian edisi Desember.

Membeli

El Kaliouby mempromosikan komputasi afektif sebagai langkah logis selanjutnya dalam perkembangan dari keyboard ke mouse ke layar sentuh ke pengenalan suara. Pada musim semi, Affectiva merilis kit pengembangan perangkat lunak komersial pertama, yang pengembang, yang tertarik dengan keadaan emosi real-time pengguna, dapat dimasukkan ke dalam program mereka sendiri — pemutar musik atau game atau aplikasi kencan, misalnya. Dan pada musim gugur ini, Affectiva meluncurkan Emotion As a Service, program berbasis cloud tempat pelanggan dapat mengunggah video untuk dianalisis. Siapa yang mungkin menggunakan ini? Seorang kandidat akan diwawancarai untuk suatu pekerjaan, yang khawatir akan terlihat cemas atau bosan atau bahkan tersenyum terlalu banyak. Atau sebuah maskapai penerbangan yang mempekerjakan pramugari, dengan ratusan aplikasi video untuk disaring untuk mencari mereka yang dapat mengelola senyum yang meyakinkan ketika mereka mengucapkan selamat tinggal kepada penumpang. (Senyum yang tulus, yang melibatkan kontraksi otot-otot di sudut-sudut mata, disebut senyuman “Duchenne”, dinamai sebagai ahli anatomi abad ke-19; sebaliknya, senyum yang dipaksakan yang hanya menggunakan mulut, sebenarnya kadang-kadang disebut senyuman “Pan Am”.)

Dan, tentu saja, perangkat yang menjalankan perangkat lunak ini semuanya terhubung ke Internet, sehingga informasi yang mereka kumpulkan secara instan dikumpulkan, diayak, dan disambungkan dengan cara aplikasi media sosial mengidentifikasi topik atau kepribadian populer. Dikompilasi, mungkin, menjadi sesuatu seperti Affectiva Mood Index, bacaan numerik tentang kebahagiaan nasional bruto, atau dipecah menjadi daerah di mana senyum atau kerutan saat ini menjadi tren.

DEC2015_H05_TechnologyRanaElKaliouby-WEB-RESIZE.jpg Program dasar Affectiva menganalisis wajah 20 kali per detik untuk 46 ekspresi kebahagiaan, kesedihan, keterkejutan, ketakutan, kemarahan, jijik dan penghinaan yang terlokalisasi, plus minat dan kebingungan. (Naomi Shavin / Smithsonian)

Sampai sekarang, pelanggan utama Affectiva adalah perusahaan periklanan, pemasaran, dan media. Perangkat lunaknya mengotomatiskan proses menjalankan kelompok fokus, ritual rumit untuk mengumpulkan selusin orang di sebuah ruangan untuk memberikan pendapat mereka tentang produk baru, serial TV, atau kampanye iklan; itu mencatat reaksi secara langsung, tanpa peserta harus memutar-mutar dial atau menjawab kuesioner dalam menanggapi presentasi. Selain itu, perangkat lunak memperluas grup fokus potensial ke seluruh dunia, atau setidaknya sebagian besar dari itu yang memiliki komputer atau perangkat seluler yang mendukung webcam.

Umpan balik dari Affectiva yang tanpa henti, mata yang melihat semua membantu membentuk sitkom TV jaringan, menyerahkan dua karakter untuk dilupakan karena dosa tidak membuat pemirsa tersenyum. (El Kaliouby tidak akan mengidentifikasi pertunjukan atau karakternya.) Perangkat lunaknya digunakan untuk membangun "sampler senyum, " sebuah mesin yang memberikan permen kepada pembeli yang tersenyum ke kamera. Dengan penelitian lebih lanjut, ini mungkin berguna untuk pengawasan kerumunan di bandara, atau untuk mengidentifikasi pengutil potensial, atau sebagai pendeteksi kebohongan.

Tetapi el Kaliouby telah menolak aplikasi diam-diam ini, betapapun menguntungkannya itu. Dia berpikir komputasi yang efektif akan mengubah dunia, termasuk, tetapi tidak terbatas pada, menjual permen. "Etos perusahaan kami, " katanya, "adalah menggunakan teknologi ini untuk meningkatkan kehidupan masyarakat dan membantu mereka berkomunikasi lebih baik, tidak hanya untuk membantu pengiklan menjual lebih banyak produk."

**********

Tidak seperti banyak pengusaha teknologi, menjadi kaya bukanlah agenda asli el Kaliouby. Dilahirkan di Kairo dari orang tua Mesir yang sama-sama bekerja di bidang teknologi, ia belajar ilmu komputer di American University di Kairo, tempat ia lulus pada tahun 1998, sekitar waktu komputer menjadi cukup kuat bagi para peneliti untuk berpikir tentang memberi mereka apa yang dalam istilah manusia disebut kecerdasan emosional.

Dia terus belajar ilmu komputer di Universitas Cambridge, tiba tepat setelah serangan di Amerika pada 11 September 2001. Orang tuanya berpikir dia berisiko ditangkap, dilecehkan atau lebih buruk karena warisannya. Tetapi meskipun ia mengenakan penutup kepala Muslim sampai beberapa tahun yang lalu, baik di Cambridge, Inggris, maupun di Cambridge, Massachusetts, tempat ia pindah pada tahun 2006, untuk bergabung dengan MIT Media Lab, apakah ia pernah peduli dengan agama atau penampilannya? . "Aku pikir itu karena aku banyak tersenyum, " katanya, tersenyum.

DEC2015_H07_TechnologyRanaElKaliouby.jpg Ahli anatomi Prancis, Duchenne, mempublikasikan studi-studi penting tentang ekspresi wajah manusia. (Gambar Bridgeman)

Sementara di Cambridge, ia menjadi tertarik pada masalah autisme, khususnya kesulitan yang dimiliki anak autis dalam membaca ekspresi wajah. Dia mengusulkan membangun "alat bantu dengar emosional" yang bisa dipakai untuk membaca wajah dan memberi petunjuk perilaku yang pantas bagi pemakainya. Mula-mula menolak untuk mendapatkan hibah dari National Science Foundation dengan alasan bahwa proyek itu terlalu sulit, ia dan rekan-rekannya membangun prototipe, yang terdiri dari sepasang kacamata yang dilengkapi dengan kamera kecil, lampu yang berkedip dan headphone, tidak seperti versi awal Google Glass. Aplikasi hibah kedua berhasil, dan, setelah dia pindah ke MIT, dia dan timnya bekerja selama tiga tahun ke depan untuk menyempurnakan dan mengujinya di sebuah sekolah di Rhode Island. El Kaliouby menggambarkannya sebagai "proyek penelitian, dan yang berhasil" - anak-anak autis yang menggunakannya memiliki pengalaman yang sangat positif - tetapi pada tahun 2008, ketika hibah berakhir, ia menghadapi saat-saat perhitungan. Minat komersial dalam komputasi afektif tumbuh, dan dia ingin melihatnya berkembang dan berkembang; menempatkan usahanya dalam mengembangkan kacamata akan membatasi hanya pada sepotong kecil potensi penggunaannya. Jadi bersama Picard, ia memutar Affectiva, sambil mengulurkan harapan bahwa perusahaan lain akan mengambil alat bantu dengar emosional dan membawanya ke pasar.

Ketika Affectiva dibentuk, beberapa "anggota tim" yang membentuk perusahaan masing-masing memilih nilai yang ingin mereka wujudkan, seperti "belajar" atau "tanggung jawab sosial" atau "bersenang-senang." Miliknya, sebagai kepala strategi dan petugas sains, adalah “hasrat.” Perusahaan yang beranggotakan 20 orang ini dijalankan sebagai semi demokrasi, dengan pertemuan setengah tahunan di mana karyawan memberikan suara untuk prioritas yang harus ditempuh selama enam bulan ke depan. Kantornya memiliki papan tulis tertutup dengan gambar oleh putri muda salah satu rekannya; dia memiliki seorang putra berusia 6 tahun, Adam, dan seorang putri berusia 12 tahun, Jana, yang tinggal bersamanya di pinggiran kota Boston (ayah mereka tinggal di Mesir). Sikapnya lembut dan penuh perhatian; satu jam ke pertemuan pagi dia menawarkan untuk memesan sandwich untuk pengunjung, meskipun dia sendiri melewatkan makan siang. "Ini Ramadhan untukku, " katanya, tersenyum, "tapi ini bukan Ramadhan untukmu."

Dia mendudukkan pengunjung di meja, menghadap monitor dan webcam; perangkat lunak menempatkan wajah pengunjung dan menggambar kotak di sekitarnya di layar. Ini mengidentifikasi satu set titik untuk dilacak: sudut mata dan mulut, ujung hidung, dan sebagainya. Dua puluh kali setiap detik, perangkat lunak mencari "unit aksi", permainan otot yang sering kali berlalu-lalang di wajah. Ada 46 di antaranya, menurut sistem klasifikasi standar, Facial Action Coding System (FACS). Mereka termasuk pengangkat alis dalam dan luar, dimpler, berkedip, mengedipkan mata dan mengerutkan bibir, corong, pressors dan sucks. Program standar Affectiva mengambil sampel sekitar 15 di antaranya kapan saja, dan menganalisisnya untuk ekspresi tujuh emosi dasar: kebahagiaan, kesedihan, kejutan, ketakutan, kemarahan, jijik dan jijik, ditambah minat dan kebingungan. Tersenyumlah, dan Anda bisa melihat tingkat kebahagiaan meningkat; Keriting bibir Anda dengan mencibir dan program mencatat rasa jijik Anda.

Atau, lebih tepatnya, ekspresi jijik Anda. Seluruh premis dari komputasi afektif bertumpu pada apa yang berarti lompatan iman, bahwa senyum menyampaikan perasaan bahagia, atau kesenangan, atau hiburan. Tentu saja, manusia berada dalam posisi yang sama: Kita dapat dibodohi oleh senyum palsu atau amarah palsu, jadi kita tidak bisa benar-benar berharap lebih dari program komputer, setidaknya belum.

Seiring waktu, Affectiva telah membuat arsip lebih dari tiga juta video wajah, yang diunggah oleh pengguna internet yang direkrut dari sekitar 75 negara di seluruh dunia. Ratusan ribu di antaranya telah dianalisis oleh pengamat terlatih dan diberi kode untuk unit aksi FACS — usaha yang monumental, karena video rata-rata sekitar 45 detik dan masing-masing membutuhkan waktu sekitar lima kali lebih lama untuk diproses. Hasil dari human coders, pada gilirannya, digunakan untuk "melatih" algoritma perusahaan, yang memproses sisanya secara real time. Seluruh database sekarang terdiri dari sekitar 40 miliar "poin data emosi, " sebuah sumber daya, membanggakan oleh Kaliouby, yang membedakan Affectiva dari perusahaan lain di bidang yang sama, seperti Emotient yang berbasis di California, mungkin pesaing terdekatnya.

smile.chart.jpg (Bagan: 5W Infografis; Sumber: Daniel McDuff, MIT Media Lab, Affectiva)

Daniel McDuff, yang bergabung dengan Affectiva dari MIT Media Lab dan melayani sebagai direktur penelitian, terus mempelajari koleksi ini untuk wawasan tambahan tentang ekspresi emosi. Bagaimana mereka berbeda berdasarkan usia, jenis kelamin dan budaya? (Mungkin mengejutkan, McDuff telah menemukan bahwa orang yang lebih tua lebih ekspresif, terutama dari emosi positif, daripada yang lebih muda.) Bisakah kita mengukur dengan jijik, malu, bosan, bosan? Kapan alis mengernyitkan sinyal, dan kapan itu menunjukkan konsentrasi? Bagaimana kita bisa membedakan antara ekspresi ketakutan dan ekspresi yang menandakan kejutan? (Petunjuk: Unit tindakan 1, "pengangkat alis bagian dalam, " adalah penanda untuk rasa takut; unit tindakan 2, "pengangkat alis luar, " menunjukkan kejutan.) Ada, katanya, setiap alasan untuk meyakini bahwa program akan berlanjut untuk menjadi lebih baik dalam mendeteksi ekspresi (walaupun mungkin tidak pernah sepenuhnya mengatasi hambatan terbesar: Botox).

Atas permintaan saya, McDuff memberikan program ini salah satu masalah klasik besar pendeteksian emosi, Mona Lisa, yang senyum kuasi-nya yang penuh teka-teki telah membangkitkan minat pemirsa selama 500 tahun. Dengan peringatan bahwa perangkat lunak bekerja paling baik pada pengalihan ekspresi, bukan gambar statis, ia melaporkan bahwa ia tidak menemukan bukti senyum asli oleh La Gioconda, melainkan kombinasi beberapa unit aksi 28 (lip roll) dan 24 (bibir ditekan bersamaan), mungkin menunjukkan beberapa tingkat ketidaknyamanan.

**********

“Saya berbicara dengan Anda sekarang, ” kata el Kaliouby, “dan memperhatikan Anda untuk mengukur minat Anda pada apa yang saya katakan. Haruskah saya memperlambat dan menjelaskan lebih banyak? Haruskah saya pergi ke topik lain? Sekarang, bayangkan saya memberikan webinar ke grup besar yang tidak bisa saya lihat atau dengar. Saya tidak mendapat umpan balik, tidak ada cara untuk mengetahui apakah lelucon itu berhasil atau gagal, apakah orang-orang terlibat atau bosan. Bukankah lebih bagus mendapatkan umpan balik itu secara real time, dikumpulkan, dari waktu ke waktu ketika saya melanjutkan? ”

Dia memainkan iklan untuk Jibo, "robot sosial" yang tersedia untuk preorder di situs web crowd-indiegogo dan dikembangkan oleh mantan rekan MIT, Cynthia Breazeal. Terlihat seperti lampu lava berteknologi tinggi, Jibo duduk di atas meja dan memindai sekelilingnya, mengidentifikasi individu dengan wajah dan berinteraksi dengan mereka — menyampaikan pesan, mengeluarkan pengingat, melakukan panggilan telepon rutin, bahkan mengobrol. Ini adalah aplikasi potensial lain untuk perangkat lunak Affectiva — perusahaan sedang dalam pembicaraan — dan ini “prospek yang sangat menarik, ” kata el Kaliouby.

Menyenangkan bagi sebagian orang, tetapi prospek robot pemroses emosi mengkhawatirkan yang lain. Sherry Turkle, yang telah lama mempelajari bagaimana manusia berhubungan dengan komputer, memperingatkan dalam bukunya yang baru, Reclaiming Conversation: The Power of Talk di Era Digital, tentang "momen robot", ketika mesin mulai menggantikan persahabatan manusia. Turkle percaya bahwa para ilmuwan seperti el Kaliouby dan timnya dapat melakukan apa yang mereka katakan. "Ini semua adalah orang-orang yang brilian dan berbakat melakukan pekerjaan yang brilian, " katanya. Dan dia setuju bahwa dalam konteks tertentu — lingkungan berbahaya, seperti luar angkasa atau di sekitar alat berat, tempat Anda ingin mendaftar setiap mode komunikasi yang memungkinkan — komputasi afektif memiliki peran yang harus dimainkan. “Tetapi langkah selanjutnya, ” katanya, “tidak mengikuti sama sekali. Langkah selanjutnya adalah, Mari berteman robot. Saya telah mewawancarai orang tua yang senang anak-anak mereka berbicara dengan Siri, dan saya pikir itu tidak membawa kita ke jalan yang kita inginkan. Kami mendefinisikan diri kita sebagai manusia dengan siapa kita bergaul, dan tidak masuk akal bagi saya untuk membentuk rasa harga diri Anda dalam kaitannya dengan mesin. Mengapa Anda ingin komputer tahu jika Anda sedih? "

Bahkan el Kaliouby cenderung setuju bahwa "kita menghabiskan lebih banyak waktu daripada yang seharusnya dengan perangkat kita, " mengingat, tentu saja, putrinya yang masih remaja, yang tatapannya mengunci layar smartphone-nya.

Tetapi dia menganggap tren ke arah konektivitas yang semakin besar tidak dapat dibalikkan, dan dia berpikir bahwa, sementara pengguna harus selalu memilih, kita mungkin memanfaatkan yang terbaik. Dia memperkirakan bahwa perangkat kita akan memiliki "sebuah chip emosi dan serangkaian aplikasi yang menggunakannya dengan cara yang menambah nilai yang cukup bagi kehidupan kita yang melebihi kekhawatiran orang-orang dalam berbagi data ini." Dia menggambar analogi dengan perangkat GPS: komputasi yang efektif dapat bantu kami menavigasi ruang emosional dengan cara yang sama seperti aplikasi telepon membantu kami berkeliling dalam ruang fisik. "Semua orang khawatir tentang perangkat penginderaan lokasi ketika pertama kali keluar, mereka: Mereka menyerang privasi kami, mereka melacak kami sepanjang waktu, " katanya. “Hanya sekarang, kita semua akan hilang tanpa Google Maps di ponsel kita. Saya pikir ini akan sama. "

**********

Senyum, Berkerut, Meringis dan Menyeringai - Ekspresi Wajah Anda Adalah Batas Berikutnya dalam Data Besar