https://frosthead.com

Bagaimana Margaret Dayhoff Membawa Komputasi Modern ke Biologi

Pada tahun 1984, National Biomedical Research Foundation meluncurkan database online gratis yang berisi lebih dari 283.000 sekuens protein. Saat ini, Sumber Daya Informasi Protein memungkinkan para ilmuwan di seluruh dunia untuk mengambil protein yang tidak diketahui, membandingkannya dengan ribuan protein yang diketahui dalam basis data, dan menentukan cara yang sama dan berbeda. Dari data itu mereka dapat dengan cepat dan akurat menyimpulkan sejarah evolusi protein dan hubungannya dengan berbagai bentuk kehidupan.

Asal usul sederhana dari basis data daring besar ini dimulai jauh sebelum internet. Semuanya dimulai dengan Atlas Urutan dan Struktur Protein, sebuah buku cetak tahun 1965 yang berisi 65 urutan protein yang diketahui, disusun oleh seorang wanita bernama Margaret Dayhoff. Untuk membuat Atlas- nya, Dayhoff menerapkan teknologi komputer mutakhir untuk menemukan solusi bagi pertanyaan biologis, membantu mengantar lahirnya bidang baru yang sekarang kita sebut bioinformatika. Awalnya seorang ahli kimia, Dayhoff memanfaatkan teknologi baru dan berkembang dari era komputasi pasca-Perang Dunia II untuk alat perintis yang dapat digunakan oleh ahli kimia, ahli biologi dan astronom dalam studi lintas disiplin ilmu tentang asal usul kehidupan di Bumi.

Dayhoff (saat itu Margaret Oakley) lahir di Philadelphia pada 11 Maret 1925 dari Ruth Clark, seorang guru matematika SMA, dan Kenneth Oakley, seorang pemilik usaha kecil. Pada usia sepuluh tahun, keluarganya pindah ke Kota New York. Di sana, ia bersekolah di sekolah umum, akhirnya menjadi pembaca pidato perpisahan Bayside High pada tahun 1942. Ia bersekolah di Universitas Washington Square di Universitas New York dengan beasiswa, lulus magna cum laude dalam matematika hanya tiga tahun kemudian pada tahun 1945.

Pada tahun yang sama, Dayhoff memasuki Universitas Columbia untuk mendapatkan gelar PhD dalam bidang kimia kuantum di bawah bimbingan ahli kimia terkemuka dan peneliti operasi Perang Dunia II George Kimball. Penerimaannya jarang terjadi pada saat itu. Setelah Perang Dunia II, lebih banyak laki-laki memasuki sains, dan kimia menjadi lebih didominasi laki-laki daripada pada dekade sebelumnya, dengan hanya lima persen gelar PhD kimia untuk perempuan, turun dari delapan persen.

Selama masa Dayhoff di universitas, Columbia adalah sarang untuk teknologi komputasi. Itu membual beberapa laboratorium komputasi pertama di AS, dan pada 1945 menjadi rumah bagi IBM Watson Scientific Laboratory yang dipimpin oleh astronom WJ Eckert. Laboratorium Watson pertama kali berfungsi sebagai pusat komputasi untuk Sekutu pada bulan-bulan terakhir Perang Dunia II. Setelah perang, itu menjadi situs untuk mengembangkan beberapa komputer super pertama, termasuk Selective Sequence Electronic Calculator (SSEC), yang kemudian digunakan Eckert untuk menghitung orbit bulan untuk misi Apollo.

Dengan teknologi ini di ujung jarinya, Dayhoff menggabungkan minatnya dalam kimia dengan komputasi melalui mesin kartu berlubang — pada dasarnya komputer digital awal. Mesin memungkinkan Dayhoff untuk mengotomatiskan perhitungannya, menyimpan algoritma pada satu set kartu dan data pada yang lain. Dengan menggunakan mesin, ia dapat memproses perhitungan jauh lebih cepat dan akurat daripada dengan tangan.

Subjek tertentu yang diminati Dayhoff adalah senyawa organik polycyclic, yang merupakan molekul yang terdiri dari tiga atom atau lebih yang bergabung dalam cincin dekat. Dia menggunakan mesin kartu berlubang untuk melakukan sejumlah besar perhitungan pada energi resonansi molekul (perbedaan antara energi potensial molekul dari keadaan tertentu dan keadaan rata-rata) untuk menentukan kemungkinan ikatan molekul dan jarak ikatan.

Dayhoff lulus dengan gelar doktor dalam bidang kimia kuantum hanya dalam tiga tahun. Penelitian yang dia lakukan sebagai mahasiswa pascasarjana diterbitkan, dengan Kimball sebagai penulis pendamping, pada tahun 1949 dalam Journal of Physics Chemical di bawah judul sederhana Kartu Punched Card of Resonance Energies.

Juga pada tahun 1948, Dayhoff menikah dengan Edward Dayhoff, seorang siswa dalam fisika eksperimental yang dia temui di Columbia. Pada tahun 1952, pasangan itu pindah ke Washington, DC di mana Edward mengambil jabatan di Biro Standar Nasional dan Dayhoff melahirkan anak pertamanya dari dua putri, Ruth. Dayhoff segera keluar dari penelitian untuk menjadi ibu yang tinggal di rumah untuk Ruth dan putrinya yang lebih muda Judith, kecuali untuk posisi post-doktoral selama dua tahun di Universitas Maryland.

Ketika dia kembali ke penelitian dan mulai mengajukan hibah untuk mendanai pekerjaannya pada tahun 1962, dia mendapat kejutan. National Institutes of Health menolak aplikasi hibah yang mencantumkan Dayhoff sebagai peneliti utama, dengan penjelasan bahwa "[Dayhoff] telah keluar dari sentuhan yang sangat intim untuk beberapa waktu ... dengan daerah yang rumit dan maju pesat ini, " seperti yang ditulis sejarawan Bruno Strasser di bukunya yang akan datang Mengumpulkan Eksperimen: Making Big Data Biology . Pendakian yang menanjak seperti ini bagi wanita yang telah mengambil waktu libur untuk membesarkan anak-anak hanyalah salah satu cara yang menghambat lembaga-lembaga ilmiah - dan terus menghambat - kemajuan wanita.

Meskipun kurangnya dukungan NIH, Dayhoff akan memasuki dekade paling penting dalam karirnya. Pada tahun 1960, ia menerima undangan penting dari Robert Ledley, seorang ahli biofisika perintis yang ia temui melalui suaminya, untuk bergabung dengannya di National Research Research Center Biomedis di Silver Spring, Maryland. Ledley tahu keterampilan komputer Dayhoff akan sangat penting bagi tujuan yayasan untuk menggabungkan bidang komputasi, biologi dan kedokteran. Dia akan melayani sebagai associate director selama 21 tahun.

Setelah di Maryland, Dayhoff memiliki kebebasan untuk menggunakan mainframe IBM 7090 terbaru dari Georgetown University. Sistem IBM dirancang untuk menangani aplikasi yang kompleks, dengan kecepatan komputasi enam kali lebih cepat dari model sebelumnya. Kecepatan ini telah dicapai dengan mengganti teknologi yang lebih lambat, tabung vakum bulkier dengan lebih cepat, transistor lebih efisien (komponen yang menghasilkan komputer 1s dan 0s). Menggunakan mainframe, Dayhoff dan Ledley mulai mencari dan membandingkan urutan peptida dengan program FORTRAN yang telah mereka tulis sendiri dalam upaya untuk merangkai urutan parsial menjadi protein lengkap.

IBM 7090 Konsol operator IBM 7090 di Pusat Penelitian Ames NASA pada tahun 1961, dengan dua bank drive pita magnetik IBM 729. (NASA)

Komitmen Dayhoff dan Ledley untuk menerapkan analisis komputer untuk biologi dan kimia adalah tidak biasa. "Budaya analisis statistik, apalagi komputasi digital, benar-benar asing bagi kebanyakan [ahli biokimia], " jelas Strasser dalam sebuah wawancara dengan Smithsonian.com . "Beberapa bahkan membanggakan diri karena tidak menjadi 'ahli teori, ' yang merupakan cara mereka memahami analisis data menggunakan model matematika."

Salah satu disiplin ilmu di mana pengetahuan komputer Dayhoff lebih dihargai, bagaimanapun, adalah astronomi. Ketertarikan dalam komputasi ini sebagian berkat WJ Eckhart, yang pada tahun 1940 telah menggunakan mesin kartu berlubang IBM untuk memprediksi orbit planet. Dan pada 1960-an, minat Amerika dalam eksplorasi ruang angkasa berjalan lancar, yang berarti pendanaan untuk NASA. Di University of Maryland, Dayhoff bertemu dengan spektroskopi Ellis Lippincott, yang membawanya ke kolaborasi enam tahun dengan Carl Sagan di Harvard pada tahun 1961. Mereka bertiga mengembangkan model termodinamika dari susunan bahan kimia, dan Dayhoff menyusun program komputer yang dapat menghitung konsentrasi kesetimbangan gas di atmosfer planet.

Dengan program Dayhoff, dia, Lippincott dan Sagan dapat memilih elemen untuk dianalisis, memungkinkan mereka menyelidiki banyak komposisi atmosfer yang berbeda. Pada akhirnya, mereka mengembangkan model atmosfer untuk Venus, Jupiter, Mars, dan bahkan atmosfer bumi purba.

Saat menjelajahi langit, Dayhoff juga menjawab pertanyaan yang telah dijelajahi para peneliti sejak setidaknya tahun 1950-an: apa fungsi protein? Mengurutkan protein adalah cara untuk mendapatkan jawaban, tetapi mengurutkan protein individu sangat tidak efisien. Dayhoff dan Ledley mengambil pendekatan berbeda. Alih-alih menganalisis protein secara terpisah, mereka membandingkan protein yang berasal dari spesies tumbuhan dan hewan yang berbeda. "Dengan membandingkan urutan protein yang sama dalam spesies yang berbeda, orang dapat mengamati bagian mana dari urutan yang selalu identik pada semua spesies, indikasi yang baik bahwa bagian dari urutan ini sangat penting untuk kebaikan protein, " kata Strasser.

Dayhoff menyelidiki lebih dalam, mencari sejarah bersama protein. Dia menganalisis tidak hanya pada bagian yang sama di seluruh spesies, tetapi juga variasi mereka. "Mereka mengambil perbedaan-perbedaan ini sebagai ukuran jarak evolusi antara spesies, yang memungkinkan mereka merekonstruksi pohon filogenetik, " jelas Strasser.

Dayhoff, yang selalu siap memanfaatkan kekuatan teknologi baru, mengembangkan metode terkomputerisasi untuk menentukan urutan protein. Dia menjalankan analisis komputer protein dalam berbagai spesies, dari jamur candida hingga paus. Kemudian dia menggunakan perbedaan mereka untuk menentukan hubungan leluhur mereka. Pada tahun 1966, dengan bantuan Richard Eck, Dayhoff menciptakan rekonstruksi pohon filogenetik pertama.

Dalam sebuah artikel Scientific American 1969, "Analisis Komputer tentang Evolusi Protein, " Dayhoff mempresentasikan kepada salah satu publik pohon-pohon ini bersama dengan penelitiannya menggunakan komputer untuk mengurutkan protein. "Setiap urutan protein yang ditetapkan, setiap mekanisme evolusi yang menyala, setiap inovasi utama dalam sejarah filogenetik yang terungkap akan meningkatkan pemahaman kita tentang sejarah kehidupan, " tulisnya. Dia berusaha menunjukkan kepada komunitas ilmu kehidupan tentang potensi model yang terkomputerisasi.

Tujuan berikutnya adalah untuk mengumpulkan semua protein yang diketahui di satu tempat di mana para peneliti dapat menemukan urutan dan membandingkannya dengan yang lain. Tidak seperti hari ini, ketika mudah untuk memanggil sumber pada database elektronik hanya dengan kata kunci, Dayhoff harus menjelajahi jurnal fisik untuk menemukan protein yang ia cari. Dalam banyak kasus, itu berarti memeriksa kesalahan rekan peneliti. Bahkan dengan bantuan komputer, pekerjaan mengumpulkan dan membuat katalog urutan membutuhkan banyak waktu dan mata ilmiah yang tajam.

Tidak semua orang melihat nilai dari apa yang dia lakukan. Bagi peneliti lain, karya Dayhoff lebih mirip dengan koleksi dan katalogisasi sejarah alam abad ke-19 daripada karya eksperimental ilmuwan abad ke-20. "Mengumpulkan, membandingkan, dan mengklasifikasikan benda-benda alam tampak kuno bagi banyak ahli biologi eksperimental di paruh kedua abad ke-20, " kata Stasser. Dia menyebut Dayhoff sebagai "orang luar." "Dia berkontribusi pada bidang yang tidak ada dan dengan demikian tidak memiliki pengakuan profesional, " katanya.

Pada tahun 1965, Dayhoff pertama kali menerbitkan koleksinya dari 65 protein yang diketahui dalam Atlas Urutan dan Struktur Protein, versi cetak dari database-nya. Akhirnya data tersebut dipindahkan ke pita magnetik, dan sekarang ia hidup online di mana para peneliti terus menggunakan datanya untuk menemukan ribuan protein lebih banyak. Basis data biomedis lain telah bergabung, termasuk Protein Data Bank, kumpulan kolaboratif protein dan asam nukleat yang diluncurkan pada tahun 1971, dan GenBank, basis data urutan genetik yang diluncurkan pada tahun 1982. Dayhoff memulai revolusi ilmiah.

"Hari ini, setiap publikasi tunggal dalam biologi eksperimental berisi kombinasi data eksperimental baru dan kesimpulan yang diambil dari perbandingan dengan data lain yang tersedia dalam database publik, suatu pendekatan yang dimulai Dayhoff setengah abad yang lalu, " kata Strasser.

Ketika bioinformatika tumbuh, tugas mengumpulkan dan perhitungan sebagian besar jatuh ke tangan wanita. Kolaborator Dayhoff di Atlas semuanya wanita kecuali Ledley. Seperti "komputer" wanita NASA di tahun 1960-an dan pemecah kode perempuan pada Perang Dunia II, para wanita ini segera terdorong ke batas praktik ilmiah. Mengacu pada "gadis-gadis ENIAC" yang memprogram digital, komputer tujuan umum pertama, sejarawan komputasi Jennifer Light menulis bahwa "berada dalam batas-batas klasifikasi pekerjaan berstatus rendah yang tepat sehingga perempuan terlibat dalam pekerjaan yang belum pernah terjadi sebelumnya."

Dalam sketsa biografinya tentang Dayhoff, Lois T. Hunt, yang bekerja pada Atlas dengannya, menulis bahwa Dayhoff percaya bahwa penyelidikannya terhadap atmosfer purba Bumi mungkin memberinya "senyawa yang diperlukan untuk pembentukan kehidupan." Ini, mungkin bahkan lebih dari sekadar komputasi, adalah apa yang mengikat bagian-bagian berbeda dari penelitian ilmiah Dayhoff bersama-sama. Dari protein kecil ke atmosfer yang luas, Dayhoff mencari rahasia kemunculan kehidupan di planet ini. Meskipun dia tidak membuka semuanya, dia memberi ilmu pengetahuan modern alat dan metode untuk melanjutkan pencarian.

Bagaimana Margaret Dayhoff Membawa Komputasi Modern ke Biologi