https://frosthead.com

Ini Mungkin Pohon Keluarga Terbesar di Dunia

Munculnya tes DNA melalui layanan seperti 23andme menunjukkan bahwa ada pasar besar di luar sana untuk sejarah keluarga.

Sekarang, para ilmuwan telah membangun berdasarkan data itu dengan menerbitkan apa yang mereka yakini sebagai basis data silsilah terbesar di dunia, dengan silsilah keluarga yang menghubungkan 13 juta orang dan membentang lebih dari lima abad.

Seperti yang dilaporkan Jocelyn Kaiser untuk majalah Science, Yaniv Erlich, ahli genetika komputasi di Universitas Columbia, memikirkan proyek itu tujuh tahun lalu setelah menerima email dari sepupu relatif jauh melalui Geni.com, salah satu dari banyak situs tempat mencari ikatan keluarga.

Dengan dukungan dari kepala teknologi Gemi.com, Erlich mengunduh profil publik situs - puluhan juta di antaranya. Meskipun tidak menawarkan data DNA, informasi tersebut termasuk nama seseorang, jenis kelamin, tanggal dan tempat lahir, tanggal kematian dan kerabat dekat.

Nature menulis tentang proyek Erlich pada tahap awalnya pada tahun 2013, dan tahun lalu, Sarah Zhang dari Atlantik melaporkan bahwa para peneliti telah merilis cetakan pohon besar itu. Sekarang, Kaiser menulis, tim Erlich telah menerbitkan studi tentang pekerjaan mereka di jurnal Science. Dengan menggunakan data, mereka berakhir dengan 5, 3 juta pohon, yang terbesar di antaranya menghubungkan sekitar 13 juta kerabat, sebagian besar keturunan Eropa.

Sejak memulai proyek ini, Erlich telah menjadi kepala petugas sains MyHeritage, sebuah perusahaan pengujian silsilah dan DNA yang memiliki Geni.com. Dia melakukan Reddit Tanya Me Anything Jumat lalu pada temuannya, memperbaiki kesalahpahaman dan menjelaskan metodologi di balik proyek. Dia juga mencatat bahwa bagian paling menarik dari pengalamannya adalah mencari tahu bagaimana menerjemahkan semua data yang tersedia menjadi sesuatu yang bersifat pribadi.

Dalam sebuah wawancara dengan Nicole Wetsman dari National Geographic, Erlich mengatakan bahwa mencari cara untuk bekerja dengan data itu juga merupakan bagian yang paling menantang dari proyek tersebut. “Kumpulan data Genomic memiliki alat khusus, struktur data, metode, tetapi kami tidak memiliki semua itu untuk ini. Kami menemukan roda saat kami pergi, "katanya.

Pada akhirnya, para peneliti menggunakan teori grafik matematika untuk mengatur dan memverifikasi informasi, lapor Laura Geggel untuk Live Science . Mereka juga membandingkan profil dengan sekitar 80.000 sertifikat kematian yang tersedia untuk umum dari Vermont selama periode 25 tahun untuk memastikan itu bukan hanya profil kaya yang diunggah ke Geni.com.

Tim kemudian memutuskan informasi apa yang ingin mereka cari untuk menguji database, tulis Wetsman.

Mereka mulai melihat pola dan menemukan fluktuasi dalam rentang hidup, sesuatu yang telah mereka antisipasi. Sebagai contoh, mereka melihat setetes pria muda selama Perang Sipil dan Perang Dunia I dan II, dan peningkatan kelangsungan hidup anak-anak di tahun 1900-an. Mereka juga dapat melacak migrasi, seperti kedatangan Mayflower pada 1620 di tempat yang sekarang Massachusetts, diikuti oleh peningkatan kelahiran di daerah itu.

Para peneliti juga menemukan bahwa umur panjang lebih berkaitan dengan lingkungan dan perilaku daripada genetika; pada kenyataannya, data yang terungkap gen hanya 16 persen bertanggung jawab untuk rentang hidup. Paola Sebastiani, profesor biostatistik di Fakultas Kesehatan Masyarakat Universitas Boston, bagaimanapun, memperingatkan untuk menarik kesimpulan di sekitar data ini dalam sebuah wawancara dengan Wetsman. "Ada banyak kebingungan tentang definisi umur panjang, " katanya.

Ahli genetika Peter Visscher dari University of Queensland di Brisbane, Australia, mengatakan kepada Kaiser bahwa data yang dipatuhi tim Erlich memang memiliki potensi untuk memberikan wawasan tentang peran genetika pada penyakit jika data tersebut dikaitkan dengan informasi kesehatan.

Tim peneliti telah mulai menggabungkan pohon dengan informasi dari DNA. Tanah, yang mengumpulkan data DNA, yang dapat berarti bahwa pohon yang lebih besar mungkin akan segera hadir. Para peneliti memperkirakan bahwa jika database dapat kembali ke 65 generasi, mereka akan dapat menyelesaikan pohon.

Ini Mungkin Pohon Keluarga Terbesar di Dunia