https://frosthead.com

Tweet Anda Dapat Memprediksi Saat Anda Mendapat Flu

Pada tahun 1854, sebagai tanggapan atas epidemi kolera yang menghancurkan yang melanda London, dokter Inggris John Snow memperkenalkan sebuah ide yang akan merevolusi bidang kesehatan masyarakat: peta epidemiologis. Dengan merekam contoh kolera di berbagai lingkungan kota dan memplotnya pada peta berdasarkan tempat tinggal pasien, ia menemukan bahwa satu pompa air yang terkontaminasi bertanggung jawab atas banyak infeksi.

Peta itu meyakinkannya — dan, pada akhirnya, otoritas publik — bahwa teori penyakit racun (yang menyatakan bahwa penyakit menyebar melalui gas berbahaya) adalah salah, dan bahwa teori kuman (yang dengan tepat menyatakan bahwa mikroorganisme yang harus disalahkan) adalah benar. Mereka memasang kunci pada gagang pompa yang bertanggung jawab atas wabah, menandakan perubahan paradigma yang secara permanen mengubah cara kita menangani penyakit menular dan dengan demikian sanitasi.

Teknologi pemetaan sangat berbeda, seperti penyakitnya, tetapi ada kesamaan tertentu antara peta Snow dan proyek baru yang dilakukan oleh sekelompok peneliti yang dipimpin oleh Henry Kautz dari University of Rochester. Dengan membuat algoritma yang dapat mengenali tren flu dan membuat prediksi berdasarkan kata kunci di tweet geotag yang tersedia untuk umum, mereka mengambil pendekatan baru untuk mempelajari penularan penyakit — pendekatan yang dapat mengubah cara kita mempelajari dan melacak pergerakan penyakit di masyarakat .

“Kita dapat menganggap orang sebagai sensor yang melihat dunia di sekitar mereka dan kemudian melaporkan apa yang mereka lihat dan alami di media sosial, ” Kautz menjelaskan. "Ini memungkinkan kami untuk melakukan pengukuran terperinci pada skala populasi, dan tidak memerlukan partisipasi pengguna aktif."

Dengan kata lain, ketika kita tweet bahwa kita baru saja direndahkan oleh batuk dan demam yang menyakitkan, tanpa disadari kita menyediakan data yang kaya untuk eksperimen kesehatan masyarakat yang sangat besar, informasi yang dapat digunakan para peneliti untuk melacak pergerakan penyakit seperti flu dalam resolusi tinggi dan waktu nyata.

Proyek Kautz, yang disebut SocialHealth, telah menggunakan tweet dan jenis media sosial lainnya untuk melacak berbagai masalah kesehatan masyarakat — baru-baru ini, mereka mulai menggunakan tweet untuk memantau contoh keracunan makanan di restoran New York City dengan mencatat semua orang yang telah memposting tweet dari geotag dari sebuah restoran, kemudian mengikuti tweet mereka selama 72 jam berikutnya, memeriksa menyebutkan muntah, diare, sakit perut, demam atau kedinginan. Dengan melakukan itu, mereka mendeteksi 480 kemungkinan keracunan makanan.

Tetapi karena musim berubah, tugas mereka melacak virus influenza yang paling membuka mata. Google Pantau Flu Dunia juga berupaya menggunakan pencari Google untuk melacak pergerakan flu, tetapi model ini sangat melebih-lebihkan wabah tahun lalu, mungkin karena liputan media tentang flu mendorong orang untuk mulai membuat pertanyaan terkait flu. Analisis Twitter mewakili set data baru dengan beberapa kualitas — resolusi geografis yang lebih tinggi dan kemampuan untuk menangkap pergerakan pengguna dari waktu ke waktu — yang dapat menghasilkan prediksi yang lebih baik.

Untuk memulai proyek pelacakan flu mereka, para peneliti SocialHealth melihat secara khusus di New York, mengumpulkan sekitar 16 juta tweet publik yang diberi tag geo per bulan dari 600.000 pengguna selama tiga bulan. Di bawah ini adalah selang waktu satu hari Twitter New York, dengan warna berbeda mewakili frekuensi tweet yang berbeda di lokasi itu (biru dan hijau berarti lebih sedikit tweet, oranye dan merah berarti lebih banyak):

Untuk memanfaatkan semua data ini, timnya mengembangkan algoritma yang menentukan apakah setiap tweet mewakili laporan gejala mirip flu. Sebelumnya, peneliti lain hanya melakukan ini dengan mencari kata kunci dalam tweets ("sakit, " misalnya), tetapi timnya menemukan bahwa pendekatan tersebut mengarah ke false positive: Banyak lebih banyak pengguna menge-tweet bahwa mereka muak dengan pekerjaan rumah daripada mereka. merasa sakit.

Untuk menjelaskan hal ini, algoritme timnya mencari tiga kata berturut-turut (bukan satu), dan mempertimbangkan seberapa sering urutan tertentu menunjukkan suatu penyakit, berdasarkan serangkaian tweet yang mereka beri label secara manual. Ungkapan "sakit flu, " misalnya, sangat berkorelasi dengan penyakit, sedangkan "sakit dan lelah" kurang begitu. Beberapa kata tertentu — sakit kepala, demam, batuk — sangat terkait dengan penyakit, apa pun urutannya.

Setelah jutaan tweet ini diberi kode, para peneliti dapat melakukan beberapa hal menarik dengan mereka. Sebagai permulaan, mereka melihat perubahan dalam tweet terkait flu dari waktu ke waktu, dan membandingkannya dengan tingkat flu seperti yang dilaporkan oleh CDC, membenarkan bahwa tweet secara akurat menangkap tren keseluruhan dalam tingkat flu. Namun, tidak seperti data CDC, ini tersedia hampir secara waktu nyata, bukan satu atau dua minggu setelah fakta.

Tetapi mereka juga masuk lebih dalam, melihat interaksi antara pengguna yang berbeda - seperti yang diwakili oleh dua pengguna yang tweet dari lokasi yang sama (resolusi GPS sekitar setengah blok kota) dalam jam yang sama - untuk memodelkan seberapa besar kemungkinan orang sehat itu. akan menjadi sakit setelah melakukan kontak dengan seseorang dengan flu. Jelas, dua orang tweeting dari blok yang sama terpisah 40 menit tidak harus bertemu langsung, tetapi kemungkinan mereka bertemu sedikit lebih tinggi dari dua pengguna acak.

Akibatnya, ketika Anda melihat set data interaksi yang cukup besar, gambar transmisi muncul. Mereka menemukan bahwa jika pengguna yang sehat bertemu dengan 40 pengguna lain yang melaporkan diri mereka sakit dengan gejala flu, kemungkinannya terkena gejala flu pada hari berikutnya meningkat dari kurang dari satu persen menjadi 20 persen. Dengan 60 interaksi, jumlah itu meningkat hingga 50 persen.

Tim juga melihat interaksi di Twitter itu sendiri, mengisolasi pasangan pengguna yang saling mengikuti dan menyebut mereka "persahabatan." Meskipun banyak hubungan Twitter hanya ada di Web, beberapa terkait dengan interaksi kehidupan nyata, dan mereka menemukan bahwa pengguna yang memiliki sepuluh teman yang melaporkan dirinya sakit, 28 persen lebih mungkin menjadi sakit pada hari berikutnya. Secara total, dengan menggunakan kedua jenis interaksi ini, algoritma mereka dapat memprediksi apakah orang yang sehat akan sakit (dan men-tweet tentang hal itu) dengan akurasi 90 persen.

Kami masih dalam tahap awal penelitian ini, dan ada banyak batasan: Kebanyakan orang masih tidak menggunakan Twitter (ya, sungguh) dan bahkan jika mereka melakukannya, mereka mungkin tidak tweet tentang sakit.

Tetapi jika sistem semacam ini dapat dikembangkan lebih lanjut, mudah untuk membayangkan semua jenis aplikasi. Ponsel cerdas Anda dapat secara otomatis memperingatkan Anda, misalnya, jika Anda telah menghabiskan terlalu banyak waktu di tempat-tempat yang ditempati oleh orang-orang dengan flu, mendorong Anda untuk pulang untuk berhenti menempatkan diri Anda di jalur infeksi. Seluruh penduduk kota bahkan dapat diperingatkan jika berada di ambang wabah.

Meskipun 150 tahun kami dikeluarkan dari terobosan pemetaan penyakit John Snow, jelas bahwa masih ada aspek-aspek informasi penyakit yang belum sepenuhnya kami pahami. Sekarang, saat itu, pemetaan data dapat membantu menghasilkan jawaban.

Tweet Anda Dapat Memprediksi Saat Anda Mendapat Flu