https://frosthead.com

One Writer Menggunakan Statistik untuk Mengungkap Rahasia What Makes Great Writing

Dalam sebagian besar kursus sastra tingkat perguruan tinggi, Anda menemukan siswa membedah sebagian kecil dari klasik sastra: Shakespeare soliloquies, aliran kesadaran Joyce dan kalimat-kalimat staccato Hemingway. Tidak diragukan lagi, ada begitu banyak yang dapat dipelajari tentang seorang penulis, keahliannya dan makna sebuah cerita dengan jenis bacaan yang dekat ini.

Tapi Ben Blatt membuat argumen kuat untuk pendekatan lain. Dengan memfokuskan pada kalimat dan paragraf tertentu, ia menempatkan dalam buku barunya, Nabokov's Favorite Word Mauve, pembaca mengabaikan semua kata lain, yang, dalam jumlah novel panjang rata-rata hingga puluhan ribu titik data.

Wartawan dan ahli statistik menciptakan database teks dari segelintir klasik dan buku terlaris abad ke-20 untuk secara kuantitatif menjawab sejumlah pertanyaan yang menarik. Analisisnya mengungkapkan beberapa pola unik yang mungkin tidak diperhatikan:

Secara angka, kalimat pembuka terbaik untuk novel cenderung pendek. Penulis progresif James Patterson rata-rata 160 klise per 100.000 kata (itu 115 lebih banyak dari Jane Austen yang dihormati), dan Vladimir Nabokov menggunakan kata ungu 44 kali lebih sering daripada rata-rata penulis dalam dua abad terakhir.

Smithsonian.com berbicara dengan Blatt tentang metodenya, beberapa temuan kuncinya dan mengapa big data penting untuk studi literatur.

Anda telah mengambil pendekatan statistik untuk mempelajari segala sesuatu mulai dari Where's Waldo hingga Seinfeld, sambungan makanan cepat saji hingga lagu-lagu pop. Bisakah Anda menjelaskan metode Anda, dan mengapa Anda melakukan apa yang Anda lakukan?

Saya seorang jurnalis data, dan saya melihat hal-hal dalam budaya pop dan seni. Saya sangat suka melihat hal-hal secara kuantitatif dan tidak memihak yang memiliki banyak informasi yang orang belum lalui. Jika Anda ingin mempelajari tentang seperti apa orang dari Amerika Serikat itu, itu akan berguna, tetapi Anda tidak akan hanya berbicara dengan satu orang, tahu segalanya tentang mereka dan kemudian berasumsi bahwa segala sesuatu tentang orang di Amerika Serikat adalah sama. Saya pikir satu hal dengan menulis yang hilang adalah Anda dapat fokus pada satu kalimat oleh seorang penulis, terutama di kelas menulis kreatif, atau satu bagian, dan Anda kehilangan gambaran yang lebih besar untuk melihat pola umum dan tren yang digunakan penulis berulang-ulang, ratusan dan mungkin ribuan kali dalam tulisan mereka sendiri.

Preview thumbnail for video 'Nabokov's Favorite Word Is Mauve: What the Numbers Reveal About the Classics, Bestsellers, and Our Own Writing

Kata Favorit Nabokov Adalah Mauve: Apa yang Diungkap Angka Tentang Klasik, Buku Terlaris, dan Tulisan Kita Sendiri

Membeli

Jadi apa yang membuat Anda beralih ke sastra?

Latar belakang saya dalam matematika dan ilmu komputer, tetapi saya selalu suka membaca dan menulis. Ketika saya menulis semakin banyak, saya menjadi sangat tertarik pada bagaimana penulis dan orang yang berbeda memberikan saran menulis. Ada banyak yang masuk akal tetapi tampaknya tidak didukung oleh informasi, dan banyak yang saling bertentangan. Saya hanya berpikir harus ada cara untuk mengambil topik ini secara tertulis bahwa orang sudah sangat sadar dan berbicara tentang dan mengujinya pada penulis besar dan penulis populer untuk melihat apakah saran ini nyata atau apakah itu saran preskriptif yang tidak T benar-benar berarti apa pun di buku nyata dan halaman nyata.

Apa pertanyaan pertama yang ingin Anda tanyakan tentang sastra klasik dan buku terlaris?

Bab pertama dalam buku ini berdasarkan saran apakah Anda sebaiknya menggunakan kata keterangan atau tidak. Ini juga bab pertama yang saya tulis secara kronologis. Ini sebagian besar atas saran Stephen King untuk tidak menggunakan kata keterangan di dalam bukunya On Writing, yang bagi banyak penulis adalah buku tentang menulis. Tetapi banyak penulis lain — Toni Morrison, Chuck Palahniuk — dan setiap kelas penulisan kreatif menyarankan untuk tidak menggunakan kata per kata — karena merupakan kata yang tidak perlu dan tanda bahwa Anda tidak ringkas. Alih-alih mengatakan, "Dia cepat lari, " Anda bisa mengatakan, "Dia berlari."

Jadi saya ingin tahu, apakah ini benar? Jika ini adalah nasihat yang bagus, Anda akan berharap bahwa penulis hebat benar-benar kurang menggunakannya. Anda akan berharap bahwa penulis amatir menggunakannya lebih dari penulis yang diterbitkan. Saya benar-benar ingin tahu, secara gaya, pertama apakah Stephen King mengikuti nasihatnya sendiri, dan kemudian apakah itu berlaku untuk semua penulis besar dan terhormat lainnya.

Jadi, apa yang kamu temukan?

Bahkan, ada tren bahwa penulis seperti Hemingway, Morrison dan Steinbeck, buku-buku terbaik mereka, buku-buku yang diangkat dan memiliki perhatian paling besar pada mereka sekarang, adalah buku-buku dengan jumlah kata keterangan yang paling sedikit. Juga, jika Anda membandingkan penulisan fiksi amatir dan penulisan online yang belum diedit dengan buku terlaris dan pemenang Hadiah Pulitzer baru-baru ini, ada perbedaan, di mana kata keterangan yang lebih sedikit digunakan oleh penulis yang diterbitkan. Saya tidak begitu sepihak sehingga saya pikir Anda bisa menghilangkan kata keterangan dari buku yang bagus dan itu menjadi buku yang bagus. Jelas itu bukan cara kerjanya. Tetapi ada sesuatu pada kenyataan bahwa penulis yang menulis dengan cara yang sangat langsung menghasilkan buku yang secara keseluruhan hidup paling lama.

p13 - Adverbs.JPG

Bagaimana Anda membuat database karya sastra?

Untuk banyak pertanyaan, saya menggunakan 50 penulis yang sama yang saya pilih agak sewenang-wenang. Pada dasarnya itu didasarkan pada penulis yang berada di bagian atas daftar buku terlaris, penulis yang berada di atas penulis terbesar dari semua daftar waktu dan penulis yang hanya mewakili berbagai genre dan waktu dan pembaca yang berbeda. Dengan begitu, sepanjang buku ini, Anda dapat membandingkan para penulis ini dan mengenal mereka.

Sangat penting bagi saya bahwa jika saya mengatakan sesuatu seperti, "Toni Morrison menggunakan kata ini pada tingkat ini, " saya berbicara tentang setiap novel yang pernah ditulisnya dan bukan hanya tiga yang kebetulan sudah saya miliki. Dalam buku saya, ada 50 hingga 100 penulis yang dirujuk seluruhnya. Saya menemukan bibliografi mereka dan kemudian menemukan semua novel mereka yang telah mereka tulis hingga saat itu sebagai catatan lengkap mereka. Dalam beberapa hal, ini seperti memelihara statistik olahraga, di mana setiap buku seperti musim dan kemudian semua musim atau buku ini disatukan sebagai karier. Anda dapat melihat bagaimana penulis berubah dari waktu ke waktu dan bagaimana mereka melakukan semuanya secara keseluruhan. Setelah Anda memiliki semua buku di file, kemudian menjawab pertanyaan-pertanyaan ini yang dalam beberapa hal sangat menakutkan sangat mudah.

Dan bagaimana Anda memproses semua teks itu?

Ada bahasa pemrograman yang disebut Python, dan di dalamnya, ada satu set alat yang disebut Natural Language Toolkit, yang sering disingkat NLTK. Alat-alat yang terlibat di dalamnya tersedia secara bebas untuk siapa saja. Anda dapat mengunduh paket secara online dan menggunakannya dalam Python atau bahasa lain. Anda tidak dapat memperoleh banyak pertanyaan penulisan secara khusus, tetapi Anda dapat mengatakan, berapa kali kata ini muncul dalam teks? Itu bisa melalui dan mengidentifikasi di mana kalimat berakhir dan di mana kalimat dimulai, dan bagian dari pidato-kata sifat vs kata kerja vs kata kerja. Jadi, sekali Anda memiliki alat itu, Anda bisa mendapatkan datanya.

Statistik apa yang Anda kompilasi secara manual? Apa yang paling membosankan?

Ada satu bagian di mana saya melihat kalimat pembuka. Elmore Leonard, yang adalah seorang novelis yang sangat sukses, mengatakan, "Jangan pernah membuka buku dengan cuaca." Ini juga saran yang ditemukan dalam banyak panduan menulis. Jadi saya memeriksa ratusan penulis untuk melihat seberapa sering mereka membuka buku mereka tentang cuaca. Sebagai contoh, Danielle Steel, saya percaya 45 persen kalimat pertamanya di buku adalah tentang cuaca. Sering kali itu hanya "Itu adalah hari yang luar biasa, " atau "Itu cerah dan cerah, " hal-hal seperti itu. Untuk itu, tidak ada cara untuk melakukan itu secara otomatis tanpa kesalahan, jadi saya akan memeriksa semua file buku dan menandai apakah ada cuaca yang terlibat. Anda bisa mengatakan itu membosankan, karena banyak data yang dikumpulkan, tapi itu menyenangkan untuk membaca dan membaca ratusan kalimat pembuka sekaligus. Ada pola lain yang jelas muncul dari penulis seiring waktu.

p207 --- Weather.jpg

Seperti yang Anda katakan, membosankan bagi sebagian orang, menyenangkan bagi orang lain. Beberapa orang mungkin berpikir pendekatan analitik ini membosankan, tetapi Anda berpendapat bahwa itu bisa “menghibur” dan “sering kali benar-benar lucu.” Apa temuan paling lucu Anda?

Judul buku itu, Nabokov's Favorite Word Is Mauve, adalah tentang bagaimana, dengan angka-angka, kata yang ia gunakan pada tingkat tertinggi dibandingkan dengan bahasa Inggris adalah lembayung muda. Itu akhirnya masuk akal jika Anda melihat latar belakangnya, karena dia memiliki sinestesia. Dia berbicara, dalam otobiografinya, tentang bagaimana ketika dia mendengar berbagai huruf dan suara, otaknya secara otomatis akan memunculkan warna.

Saya mengulangi percobaan itu pada 100 penulis lain untuk melihat apa kata favorit mereka. Akibatnya, Anda mendapatkan tiga kata yang mewakili tulisan mereka dengan kata-kata yang paling mereka gunakan. Kesopanan, kemewahan dan ketidaksopanan. Itu Jane Austen. Saya pikir jika Anda melihat kata-kata itu, Jane Austen mungkin menjadi salah satu tebakan pertama Anda. Dan kemudian Anda memiliki penulis seperti John Updike, yang sedikit lebih berpasir dan nyata dan dari waktu yang berbeda. Kata-kata favoritnya berbingkai, tusukan dan kacau. Saya pikir melihat kepribadian datang berdasarkan pertanyaan matematika sederhana ini sangat menarik. Jika Anda memiliki penulis favorit, melewatinya memang mengungkapkan sesuatu tentang kepribadian mereka yang mungkin tidak Anda perhatikan sebelumnya.

Ray Bradbury telah menulis bahwa kata favoritnya adalah kayu manis. Dengan angka, dia banyak menggunakannya. Penjelasannya mengapa dia menyukai kayu manis adalah karena mengingatkannya pada dapur neneknya. Jadi saya pergi dan menemukan kata-kata rempah-rempah lain dan mencium kata-kata yang dapat dikaitkan dengan dapur nenek, dan Ray Bradbury memang menggunakan sebagian besar kata-kata itu pada tingkat yang sangat tinggi. Dalam beberapa hal, Anda bisa mendapatkan pandangan aneh dan Freudian tentang sesuatu tentang masa kecil penulis. Jika Ray Bradbury tidak mengatakan itu, mungkin Anda masih bisa mengetahuinya.

Anda membandingkan penulis Amerika dan Inggris, membenarkan stereotip bahwa orang Amerika keras. Bisakah Anda menjelaskan yang ini?

Yang ini sebenarnya didasarkan pada studi yang dilakukan oleh seorang mahasiswa pascasarjana di Stanford. Dia telah mengidentifikasi kata-kata yang digunakan untuk menggambarkan dialog dalam buku, dan menggambarkannya sebagai keras, netral atau tenang. "Berbisik" dan "bergumam" akan diam. Netral akan menjadi "dia berkata" atau "dia berkata, " dan keras akan "dia berseru" atau "berteriak." Saya memeriksa 50 penulis yang saya lihat, serta sampel besar fiksi penggemar, dan menemukan, tidak dengan selisih yang gila tetapi selisih yang berarti, bahwa orang Amerika memang memiliki rasio yang lebih tinggi dari kata-kata keras dengan kata-kata tenang. Ada beberapa penjelasan. Bisa jadi begitulah cara orang Amerika berbicara sepanjang hidup mereka, jadi begitulah cara penulis menggambarkan mereka sering berbicara. Anda juga bisa melihatnya sebagai penulis Amerika yang lebih suka cerita berbasis aksi, thriller, dan tempo tinggi dibandingkan dengan yang lebih halus. Orang Amerika memang lebih keras dengan angka.

Blatt_author photo_Credit Sierra Katow.JPG Ben Blatt, penulis Kata Favorit Nabokov Is Mauve (Sierra Katow)

Menurut Anda mengapa menerapkan matematika untuk menulis adalah cara yang baik untuk mempelajari sastra?

Saya jelas tidak menganjurkan bahwa ini harus menjadi cara pertama Anda mempelajari literatur jika Anda mencoba meningkatkan tulisan Anda. Tetapi bahkan sebuah novel dengan panjang sedang mungkin 50.000 kata, dan itu 50.000 poin data. Anda tidak akan bisa merendam semuanya sekaligus, dan akan ada beberapa pertanyaan yang Anda tidak bisa jawab membaca sendiri. Bagus melihat gambar yang lebih besar. Jika Anda duduk dan mempelajari satu paragraf, Anda berada di kelas menulis kreatif Anda berbicara dengan profesor Anda, jika ada cara yang pasti untuk melihat itu, Anda hanya akan melihat itu di seluruh segalanya. Tetapi dengan datanya, hal semacam itu membebaskan Anda darinya, dan Anda dapat menjawab beberapa pertanyaan tanpa bias ini dan benar-benar mendapatkan beberapa informasi baru.

Anda menyebutkan bahwa Anda terus berpikir kembali ke “The Great Grammatizator” karya Roald Dahl.

Ada kisah Roald Dahl yang hebat di mana pada dasarnya seorang insinyur merancang cara untuk menulis cerita. Dalam skenario hari kiamat ini, seseorang bisa saja memberikan plot pada mesin dan akan mengeluarkan novel terakhir. Sindiran di sana adalah bahwa mereka memproduksi novel yang sangat formula dan dasar. Sang protagonis dalam cerita itu memilih untuk tidak bergabung dengan pengoperasian mesin dan melawannya dengan menciptakan karya tulis dan karya seninya sendiri.

Saya pasti berpikir bahwa buku ini, jika Anda menulis, akan menjawab banyak pertanyaan untuk Anda dan pasti mengubah cara Anda berpikir tentang beberapa hal, tetapi pada akhirnya tidak ada pengganti untuk ide-ide yang membuat orang berpikir dan adegan yang membuat orang takut atau terhubung dengan karakter. Buku ini melihat kerajinan menulis dan belum tentu cara membuat cerita yang berkesan. Buku ini tidak mencoba merekayasa sebuah novel yang sempurna, dan saya kira kita tidak sedekat itu seperti yang mungkin ditakuti sebagian orang.

One Writer Menggunakan Statistik untuk Mengungkap Rahasia What Makes Great Writing