https://frosthead.com

The Million Word March

Dulu, sumber ahli tentang apa itu kata atau bukan adalah kata pokok sekolah: kamus. American Heritage, Webster's Third, Bahasa Inggris Oxford: ada beberapa pemain tepercaya dalam permainan.

Tetapi bagaimana jika para pemain kehilangan keunggulan?

Ambil kata "staycation." Staycation, yang berarti menghabiskan liburan di rumah, baru-baru ini muncul di New York Times, USA Today dan MSNBC . Tetapi sepertinya tidak akan segera muncul dalam kamus. Hal yang sama berlaku untuk "bracketology, " (ilmu taruhan NCAA March Madness) Facebook dan Wikipedia .

"Kami mencoba membahas" kata-kata yang paling menonjol, "kata Joe Pickett, editor eksekutif American Heritage Dictionary." Apa yang perlu diketahui oleh orang awam yang berpendidikan? "

Orang yang membuat kamus dikenal sebagai ahli kamus ("penulis atau editor kamus." Terima kasih, Merriam-Webster). Dan mereka memiliki metode yang telah teruji untuk memilih kata baru mana yang akan disertifikasi dan mana yang harus dilempar sebelum edisi berikutnya atau pembaruan situs Web kamus.

Sekelompok editor di kamus menonton area subjek tertentu, mendata klik yang didapat kata baru. "Hit" adalah sebutan di buku, koran, atau situs Web. Kemudian mereka memasukkan hit ke dalam database dan membandingkan istilah baru dengan kata-kata yang sudah mereka miliki. Jadi meskipun Facebook, sebagai nama merek, tidak memenuhi syarat, setiap kata dalam drama Shakespeare tidak - termasuk cap-a-pie ("dari kepala ke kaki") dan fardel ("beban"). Menjadi kakek dari linguistik kreatif, Shakespeare menemukan lebih dari 1.700 kata. Semuanya muncul dalam kamus yang tidak dirangkum.

Kamus menolak kata-kata karena terlalu teknis (bahkan penggemar "Grey's Anatomy" yang paling sulit tidak akan pernah perlu tahu apa itu mammosomatotroph) atau karena terlalu muda (staycation).

Mereka tidak menghitung nama merek (Coke, Facebook, Wikipedia) atau sebagian besar kata dan frasa asing.

"Kami tidak berusaha menjadi Wikipedia, " kata Pickett.

Jadi siapa itu? Siapa yang mencatat, menghitung, dan menyortir kata-kata yang digunakan penutur bahasa Inggris setiap hari?

Austin, Tex., Telah melacak kata-kata selama lima tahun terakhir. Dengan menggunakan tim pakar dan algoritmanya sendiri, mereka mengatakan bahasa Inggris menambah kata baru setiap 98 menit. Ini berarti ada lebih dari 900.000 kata bahasa Inggris di dunia, dan sepersejuta akan muncul sekitar bulan April 2009.

Sebaliknya, kebanyakan kamus standar memiliki sekitar 200.000 kata, kamus tidak lengkap sekitar 600.000.

Tetapi Monitor begitu yakin dengan angka-angkanya sehingga ia memulai Million Word March, hitungan mundur untuk kata sepersejuta.

"Kami kembali ke Bahasa Inggris Tengah dan melihat bahwa definisi kata adalah 'pikiran yang diucapkan, '" kata Paul JJ Payack, presiden dan analis kata utama di Monitor, "yang berarti jika saya mengucapkan sepatah kata, dan Anda mengerti saya, itu kata yang nyata. "

Payack menghitung staycation, Facebook dan Wikipedia sebagai kata-kata. Tapi dia juga mengikuti beberapa aturan lama. Misalnya, kata-kata yang merupakan kata benda dan kata kerja, seperti "air" hanya dihitung satu kali. Dia tidak menghitung semua nama yang ada untuk bahan kimia, karena ada ratusan ribu.

Setelah Monitor mengidentifikasi kata, ia melacaknya dari waktu ke waktu, menonton untuk melihat di mana kata itu muncul. Berdasarkan pengukuran itu, mereka memutuskan apakah kata itu memiliki "momentum, " pada dasarnya, apakah itu menjadi lebih populer atau jika itu keajaiban dunia linguistik.

Sepintas, ini mirip sekali dengan sistem kamus.

"Itu sama dengan [metode] lama, hanya mengakui kenyataan baru, " kata Payack. Metode Monitor memberikan bobot lebih untuk kutipan online.

Tetapi apakah "realitas baru" Payack baik, nyata? Dia mengklaim bahwa arus informasi yang cepat dan perkembangan bahasa Inggris global telah mengubah cara orang menggunakan kata-kata. Dan bahwa kesenjangan antara kata-kata yang digunakan orang dan kata-kata yang muncul dalam kamus mungkin meningkat.

"Ternyata begitu sesuatu memasuki Internet, itu seperti ruang gema, " kata Payack. Sejak browser web pertama kali muncul pada tahun 1991, Internet telah menambahkan banyak kata ke bahasa Inggris — dot-com, blog — dan ditambahkan dengan cepat. Web juga telah membawa kata-kata yang ada ke telinga yang baru.

"Kembali di pertengahan tahun 90-an, mendapatkan beberapa ribu klik browser untuk sebuah kata membuat kami cenderung untuk memasukkannya; sekarang ambang batas telah berubah, " kata Pickett. "Kamu bisa menemukan begitu banyak bukti untuk kata-kata dan ekspresi yang tidak jelas."

Tetapi kamus digunakan untuk mengejar ketinggalan. Lagipula, sulit untuk mendefinisikan kata sebelum diciptakan.

Payack mengatakan Internet bukanlah tantangan yang paling mendesak bagi metodologi penghitungan kata tradisional. Itu, menurutnya, adalah "bahasa Inggris global."

Bahasa Inggris memiliki hampir 400 juta penutur asli, menjadikannya nomor dua di dunia, tetapi secara keseluruhan memiliki 1, 3 miliar penutur, menjadikannya bahasa yang paling banyak dipahami di dunia, jelas Payack. Bahasa ini dituturkan oleh lebih dari 300 juta orang di India sebagai bahasa kedua, dan paling tidak oleh banyak penutur kedua di Cina.

"Siapa pun yang berbicara bahasa Inggris sekarang merasa seperti mereka memilikinya, " kata Payack. Misalnya, lihat kata sifat "brokeback." Setelah sutradara Ang Lee menyebut filmnya tentang dua koboi yang jatuh cinta "Brokeback Mountain, " kata "brokeback" masuk ke dalam bahasa Inggris sebagai sinonim untuk 'gay.' Meskipun "brokeback" mungkin telah melewati masa kejayaannya di Amerika Serikat, kata itu, dengan makna baru ini, masih populer di Cina, kata Payack. Itu muncul di blog dan situs Web, yang berarti memiliki momentum, yang berarti itu sebuah kata.

"Saat ini kami memiliki lebih banyak lalu lintas manusia yang bergerak ke segala arah di seluruh dunia, " kata Salikoko Mufwene, seorang profesor linguistik di University of Chicago, yang telah mempelajari pengembangan dialek regional. Apakah kata-kata yang diilhami Cina atau tidak akan menjadi bagian dari Bahasa Inggris Amerika, misalnya, "tergantung pada seberapa sering orang Amerika akan berinteraksi dengan orang Asia dalam bahasa Inggris, " katanya.

Dan jika mereka melakukannya, apakah orang Amerika akan menjadi rata-rata lebih bertele-tele? Rata-rata orang Amerika menggunakan sekitar 7.500 kata sehari dan tahu total 20.000 kata. Bahkan Shakespeare hanya tahu sekitar 60.000.

Jadi jumlah kata dalam bahasa Inggris akan selalu banyak, lebih banyak daripada yang diketahui atau digunakan oleh siapa pun.

Baik Mufwene dan American Heritage's Pickett mengatakan bahasa Inggris sudah bisa memiliki jutaan kata. Bagaimanapun, menghitung kata adalah ilmu yang tidak tepat.

Itu juga bukan ilmu kamus. Pekerjaan kamus selalu, kata Mufwene, "untuk mencerminkan bagaimana orang berbicara, bukan untuk mengajari mereka cara berbicara." Jika refleksi kamus semakin sempit, itu masih bisa berharga.

"Anda membutuhkan orang untuk mengedit kamus dan bertanggung jawab untuk itu, sehingga dapat diandalkan, " kata Pickett. "Dan kupikir itu tidak akan berubah."

The Million Word March