
Tweet dari seluruh dunia, diplot berdasarkan lokasi sebagai bagian dari studi baru. Klik untuk memperbesar. Gambar melalui Senin Pertama / Leetaru et. Al.
Sulit untuk menghargai seberapa cepat dan menyeluruh Twitter telah mengambil alih dunia. Hanya tujuh tahun yang lalu, pada tahun 2006, itu adalah ide yang dibuat di atas kertas. Sekarang, layanan ini digunakan oleh sekitar 554 juta pengguna — jumlah yang berjumlah hampir 8 persen dari semua manusia di planet ini — dan diperkirakan 170 miliar tweet telah dikirim, dengan jumlah itu naik sekitar 58 juta setiap hari. .
Semua tweet ini menyediakan sumber berita, hiburan, percakapan, dan koneksi yang sangat berharga antara orang-orang. Tetapi bagi para ilmuwan, mereka juga berharga sebagai sesuatu yang agak berbeda: data mentah.
Karena Twitter menampilkan API terbuka (yang memungkinkan tweet diunduh sebagai data mentah yang dapat dianalisis) dan banyak tweet yang diberi tag geo, para peneliti dapat menggunakan miliaran tweet ini dan menganalisisnya berdasarkan lokasi untuk mempelajari lebih lanjut tentang geografi manusia di seluruh planet ini. Musim gugur yang lalu, sebagai bagian dari Global Twitter Heartbeat, tim University of Illinois menganalisis bahasa dan lokasi lebih dari satu miliar tweet dari seluruh AS untuk membuat peta canggih dari hal-hal seperti emosi positif dan negatif yang diungkapkan selama Badai Sandy, atau dukungan untuk Barack Obama atau Mitt Romney selama pemilihan Presiden.
Seperti yang dicatat Joshua Keating di blog War of Ideas Kebijakan Luar Negeri, anggota kelompok yang sama, yang dipimpin oleh Kalev Leetaru, baru-baru ini melangkah lebih jauh. Seperti yang diterbitkan dalam sebuah studi baru awal pekan ini dalam jurnal online Senin Pertama, mereka menganalisis lokasi dan bahasa dari 46.672.798 tweet yang diposting antara 23 Oktober dan 30 November tahun lalu untuk membuat potret menakjubkan aktivitas manusia di seluruh planet ini, yang ditunjukkan di atas pos. Mereka memanfaatkan decahose Twitter, aliran data yang menangkap 10 persen acak dari semua tweet di seluruh dunia pada waktu tertentu (yang berjumlah 1.535.929.521 untuk periode waktu), dan hanya berfokus pada tweet dengan data geografis terkait.
Seperti yang dicatat oleh para peneliti, kepadatan geografis tweet di banyak wilayah — terutama di dunia Barat, tempat komputer, perangkat seluler, dan Twitter semuanya digunakan pada tingkat puncak — sangat cocok dengan tingkat penggunaan listrik dan pencahayaan. Akibatnya, peta tweet (seperti tampilan detail dari benua AS, di bawah) berakhir sangat mirip dengan gambar satelit dari cahaya buatan di malam hari.

Klik untuk memperbesar. Gambar melalui Senin Pertama / Leetaru et. Al.
Sebagai tes untuk melihat seberapa baik tweets cocok dengan penggunaan cahaya buatan, mereka menciptakan peta komposit di bawah ini, di mana tweets ditampilkan sebagai titik-titik merah dan pencahayaan malam hari ditampilkan sebagai biru. Area di mana mereka berkorespondensi dalam frekuensi (dan secara efektif membatalkan satu sama lain) ditampilkan sebagai putih, dan area di mana satu melebihi yang lain tetap merah atau biru. Banyak daerah pada akhirnya tampak sangat putih, dengan beberapa pengecualian utama: Iran dan Cina, di mana Twitter dilarang, tampak biru, sementara banyak negara dengan tingkat elektrifikasi yang relatif rendah (tetapi di mana Twitter masih populer) tampak merah.

Klik untuk memperbesar. Gambar melalui Senin Pertama / Leetaru et. Al.
Proyek menjadi lebih menarik ketika para peneliti menggunakan sistem otomatis untuk memecah tweets berdasarkan bahasa. Bahasa yang paling umum di Twitter adalah bahasa Inggris, yang diwakili dalam 38, 25 persen dari semua Tweet. Setelah itu datang Jepang (11, 84 persen), Spanyol (11, 37 persen), Indonesia (8, 84 persen), Norwegia (7, 74 persen) dan Portugis (5, 58 persen).
Tim membangun peta semua tweet yang ditulis dalam 26 bahasa paling populer, dengan masing-masing diwakili oleh warna yang berbeda, di bawah ini:

Klik untuk memperbesar. Gambar melalui Senin Pertama / Leetaru et. Al.
Sementara sebagian besar tweet negara didominasi oleh bahasa resmi mereka, banyak yang mengungkapkan untuk memasukkan tweet dalam berbagai bahasa lainnya. Lihat cukup dekat, dan Anda akan melihat pelangi warna secara halus muncul dari titik abu-abu (tweet bahasa Inggris) yang menyelimuti AS:

Klik untuk memperbesar. Gambar melalui Senin Pertama / Leetaru et. Al.
Di antara analisis lain, tim peneliti bahkan melihat geografi retweeting dan referensi - jarak rata-rata antara pengguna dan seseorang yang dia retweet, serta jarak rata-rata antara pengguna dan seseorang yang dia referensikan dalam tweet. Rata-rata, jarak retweet adalah 1.115 mil dan 1.118 untuk referensi. Tetapi, berlawanan dengan intuisi, ada hubungan positif antara jumlah pengguna yang me-retweet atau mereferensikan pengguna lain dan jarak mereka: Pasangan pengguna yang hanya memiliki sedikit interaksi, secara keseluruhan, lebih cenderung lebih dekat bersama-sama (500- Terpisah 600 mil) dibandingkan dengan puluhan retweet dan referensi di antara mereka.
Ini menunjukkan bahwa pengguna yang tinggal berjauhan lebih cenderung menggunakan Twitter untuk berinteraksi secara teratur. Satu penjelasan mungkin adalah bahwa entitas dengan pengikut paling banyak — dan dengan demikian referensi dan retweet terbanyak — sering kali adalah selebritis, organisasi, atau perusahaan, pengguna yang orang kenal tetapi tidak benar-benar memiliki hubungan pribadi dengan. Peta global retweet antar pengguna di bawah:

Klik untuk memperbesar. Gambar melalui Senin Pertama / Leetaru et. Al.
Makalah ini masuk ke lebih detail pada data lain yang terkait dengan tweet: rasio antara liputan berita utama dan jumlah tweet di suatu negara (Eropa dan AS mendapatkan liputan media yang tidak proporsional, sementara Amerika Latin dan Indonesia diabaikan), tempat-tempat yang dimiliki Twitter menambahkan sebagian besar pengguna baru-baru ini (Timur Tengah dan Spanyol) dan tempat-tempat di mana pengguna memiliki rata-rata pengikut terbanyak (Amerika Selatan dan Pantai Barat).
Ada beberapa peringatan untuk semua data ini. Untuk satu, meskipun tweet dianalisis jumlahnya dalam puluhan juta, mereka masih hanya 0, 3 persen dari semua tweet yang dikirim, jadi mereka mungkin tidak cukup mewakili semua pola Twitter, terutama jika pengguna yang memungkinkan geotagging berperilaku berbeda dari yang lain. Selain itu, di dunia Twitter yang berubah cepat, beberapa tren mungkin telah berubah secara signifikan sejak musim gugur yang lalu. Tetapi ketika Twitter terus tumbuh dan semakin banyak data tersedia, masuk akal bahwa analisis semacam ini hanya akan menjadi lebih populer bagi para ahli demografi, ilmuwan komputer, dan peneliti lain.