Karen Jacobsen, penyanyi dan aktris pengisi suara Australia, mendapat pertunjukan pada tahun 2000, segera setelah tiba di New York. Produser — tipe korporat — mengirimnya ke studio rekaman selama tiga minggu, di mana ia menghabiskan empat jam sehari untuk mengatakan hal-hal seperti "di persimpangan berikutnya, belok kiri" dan "hitung ulang." Pada akhirnya, itu bukan suaranya. itu tegang. "Saya mengatakan 'kira-kira' sekitar 186 kali, " kenang Jacobsen. "Hal semacam itu bisa membuatmu jadi gila."
Konten terkait
- Dari Ptolemy ke GPS, Sejarah Singkat Peta
Dua tahun kemudian, dia mendapat telepon dari seorang teman. "Karen, " sembur temannya. “Saya membelikan suami saya salah satu barang GPS baru itu, dan kami menaruhnya di suara Australia. Itu kamu! ”Begitulah Jacobsen mengetahui suaranya memberi arahan kepada 400 juta orang di seluruh dunia.
Karyanya menyoroti hibrida darah dan teknologi yang masuk ke suara-suara yang kini ada di mana-mana memberi tahu kita ke mana harus berpaling: Lebih dari satu miliar orang bergantung pada Google Maps setiap bulan, dan 80 persen mengaktifkan opsi suara.
Pada hari-hari awal sintesis suara — pikirkan suara robot dari Speak & Spell akhir 1970-an — suatu algoritma mengubah teks menjadi aliran monoton. Kemudian, seiring bertambahnya basis data, Anda dapat merekam aktor suara seperti Jacobsen mengucapkan kumpulan suku kata dan kata-kata, yang akan digabungkan dengan algoritme dan perubahan sesuai dengan aturan dasar. Baru-baru ini, pembuat kode perangkat lunak di perusahaan-perusahaan seperti Nuance, yang merancang antarmuka navigasi untuk mobil, telah mengembangkan pendekatan ketiga — menerapkan pembelajaran mendalam untuk sintesis ucapan. Ini mencampur kata-kata yang direkam dan cuplikan yang disintesis, mengandalkan kecerdasan buatan untuk membuat pelafalan menjadi lebih manusiawi. "Mereka terdengar sangat alami, " kata chief technology officer Nuance, Vlad Sejnoha.
Tentu saja, keanehan bahasa tetap menjadi tantangan bagi sistem suara. “Pikirkan 'dahan' versus 'dibeli, ' atau 'baca' versus 'baca, '” kata juru bicara Google. “Tapi semoga pengguna selalu bisa menebak apa yang kami maksudkan.” Sekarang AI mengajarkan sistem navigasi mobil untuk berbicara lebih cerdas, selanjutnya ia akan mencari di dunia online dan mencari tahu ke mana Anda ingin pergi bahkan sebelum Anda melakukannya.

Berlangganan majalah Smithsonian sekarang hanya dengan $ 12
Artikel ini adalah pilihan dari majalah Smithsonian edisi Juli / Agustus
Membeli