PERANGKAT LUNAK MEMBUAT SATU GAMBAR YANG MENGATAKAN SEMUANYA | INOVASI | SMITHSONIAN - ARTIKEL, SENI & BUDAYA, SENI & SENIMAN, INOVASI, TEKNOLOGI

Setiap hari, pengguna mengunggah lebih dari 350 juta foto ke Facebook. Masuknya gambar ini telah menyebabkan analis memperkirakan bahwa 10 persen dari 3, 5 triliun foto di dunia telah diambil pada tahun lalu. Semua data yang membanjiri Web berarti bahwa jika Anda mencari gambar atau objek tertentu — seperti apa kucing kucing oranye, misalnya — Anda dibanjiri hasil pencarian secara positif.

Bulan lalu, para peneliti di University of California, Berkeley meluncurkan perangkat lunak baru, AverageExplorer, yang akan memungkinkan pengguna untuk melihat gambar "rata-rata" yang mewakili apa yang mereka cari. Daripada gambar yang bernilai ribuan kata, itu adalah gambar yang bernilai ribuan — atau lebih banyak — gambar.

"Ketika Anda memasukkan pencarian gambar Google, Anda akan menyaring halaman dan halaman gambar, " jelas Jun-Yan Zhu, mahasiswa pascasarjana UC Berkeley dan penulis utama makalah, disajikan pada Konferensi Internasional dan Pameran Komputer Grafik tahun ini dan Teknik Interaktif di Vancouver. “Sangat besar dan sulit untuk diringkas; Anda tidak bisa memahami apa yang terjadi. "

Untuk penawaran awalnya, Zhu dan timnya mengumpulkan foto melalui pencarian gambar Flickr, Google dan Bing. Perangkat lunak ini cukup berdaya rendah untuk berjalan pada desktop rata-rata dan dapat menghasilkan 10.000 gambar secara bersamaan.

Pengguna mempersempit pencarian mereka dengan beberapa cara berbeda. Mereka dapat membuat sketsa dan mewarnai bentuk, mirip dengan menggambar di Adobe Photoshop atau Illustrator, untuk mempertajam hasil gambar rata-rata mereka. Misalnya, mewarnai latar belakang gambar rata-rata Menara Eiffel akan memilih sendiri gambar rata-rata untuk menarik hanya bidikan yang diambil pada malam hari. Atau, Anda bisa menggambar garis miring untuk mengontrol orientasi kupu-kupu di komposit.

Dengan memperhalus warna dalam gambar AverageExplorer dari Bridge of Sighs, Anda dapat mengubah adegan dari siang hingga petang hingga malam. (Courtesy UC Berkeley)

Setelah gambar rata-rata dibuat, proses yang dapat memakan waktu hingga satu menit, pengguna dapat lebih mempersempit hasilnya menggunakan apa yang tim sebut Mode Explorer. Dalam mode ini, mengklik pada bagian tertentu dari gambar — katakanlah, hidung kucing — akan mengungkapkan opsi atau penyempurnaan umum lainnya untuk tempat itu — mungkin hidung biru atau hitam, atau yang bulat bukannya sudut. Dalam video demo, misalnya, tim memperbaiki gambar anak-anak di pangkuan Santa dengan memilih hanya gambar di mana Santa memiliki satu anak di setiap lengan.

Di mana sistem akan menjadi sangat kuat, kata Zhu, adalah sebagai alat untuk melatih algoritma visi komputer, seperti yang digunakan oleh Google Goggles atau aplikasi Amazon Firefly, yang dapat mengidentifikasi apa yang ditunjukkan oleh kamera. "Di bidang visi komputer, orang menghabiskan banyak uang untuk membubuhi keterangan objek, " jelasnya. “Sekarang Anda dapat menerapkan anotasi ke gambar rata-rata. Idenya adalah Anda hanya perlu bekerja pada satu gambar untuk menyebarkan semua gambar dalam kumpulan data. "

Dengan menyempurnakan mode hasil pencarian, para peneliti dapat menemukan ras kucing tertentu, termasuk (dari kiri ke kanan) Ragdoll, Siamese, Maine Coon dan Sphinx. (Courtesy UC Berkeley)

Membuat karya seni adalah buah yang mudah digantung untuk AverageExplorer. Tim ini menarik inspirasi dari seniman media baru seperti Jason Salavon, yang dengan susah payah membuat foto rata-rata dengan tangan. Itu juga dapat digunakan untuk membuat plug-in Facebook yang memungkinkan pengguna bermain-main dengan gambar rata-rata dari diri mereka sendiri.

Aspirasi para peneliti bahkan lebih luas dan berdampak. Sosiolog dapat menggunakan sistem untuk menemukan dan meneliti tren sosial; misalnya, gambar rata-rata dapat membuktikan bahwa pengantin wanita paling sering berdiri di sebelah kanan pengantin pria dalam potret pernikahan. AverageExplorer juga bisa menjadi alat yang berguna bagi analis media yang mencoba membedah liputan televisi — apakah postur Stephen Colbert berubah ketika dia berbicara tentang George W. Bush versus Barack Obama?

Dengan memungkinkan pengguna untuk berinteraksi secara intuitif dengan data visual alih-alih berjuang untuk memasukkan string kata kunci yang benar, pengguna akan dapat menjembatani apa yang penasihat Zhu dan co-pencipta AverageExplorer, Alexei Efros, sebut sebagai "kemacetan bahasa."

Tim membayangkan seperangkat alat khusus yang dirancang untuk tugas-tugas khusus yang sulit diartikulasikan. Aplikasi belanja, misalnya, akan memungkinkan pengguna untuk menjelajah web dengan sepasang sepatu hak dengan warna, bentuk tumit, dan tinggi yang persis seperti yang ia kejar. Zhu membayangkan alat yang terintegrasi dengan alur kerja seniman sketsa polisi, yang memungkinkan saksi mencari basis data wajah untuk fitur yang cocok dengan pelaku dan membuat potret komposit.

Versi dasar AverageExplorer akan dirilis musim gugur ini.