這本大數據分析的書有點酷!從1500部作品中,發現的黃金寫作準則
……他被一個強大而簡單的小真相所打動:英語語法受規則支配,幾乎和數學一樣嚴格!給定單詞,並給定要表達的意思,那麼這些詞便只有唯一正確的排列順序。
工程師阿道夫?耐普,發明了一台機器,它能代替作家寫出暢銷的故事。耐普用這台「偉大的自動語法器「開始製造簡單的短篇小說,然後是複雜的長篇小說,最後,他幾乎壟斷了英語小說市場,其他作家已經窮困潦倒,沒有活路了……
這部寫於60年前的的短篇小說——《偉大的自動語法器》,恐怕說出了所有作家的夢魘,它的作者是羅爾德?達爾,你也許沒聽說過他,但你八成知道他的另一部作品:《查理和巧克力工廠》。
AI能否代替人類進行藝術創作?放在今天來看,仍然是我們在探索的問題。在擔憂這個問題之前,我們來看看使用大數據分析,能否找到寫作的黃金定律?
《納博科夫最喜歡的詞》,書名簡單而文藝,但是別被迷惑住了,其實,這是一本把統計學用於文學分析的書,是用數字寫成的文學評論。作者本?布拉特,是一名雜誌撰稿作家,他曾把本書中的大數據分析用於音樂、影視劇、綜藝節目等,顯然,布拉特對於大數據和文藝的結合十分熱愛。
在《納博科夫最喜歡的詞》中,本?布拉特用輕鬆幽默的語言,講述了數據分析的過程,對我們熟悉的「簡潔地用詞」、「少用感嘆號」等基本寫作準則,以及作家們提倡的寫作建議進行了驗證,結果顯示,有些準則得到了驗證,而有些則出人意料。
一 副詞不是你的朋友
通往地獄之路鋪滿了副詞。——斯蒂芬?金
斯蒂芬?金在《論寫作》中,將妨礙簡潔的副詞描述為「通常以ly結尾的詞」。布拉特按照這個標準,對公認的15位偉大作家,共167部作品進行了統計,發現海明威的副詞使用量很少,平均一萬字中,只用到80個以ly結尾的副詞,這與我們對海明威行文簡潔的印象是一致的。
為了進一步探索作品質量與副詞使用率的關係,布拉特又按照副詞使用率,對每個作家的作品進行了排序,發現同一位作家,Ta最受歡迎的作品,副詞使用率相應是最低的,也就是說,作品質量與副詞使用率基本是成反比的關係。
少用ly結尾的副詞,對於寫作的確是有好處。副詞使用率高,要麼是作者偷懶了,要麼是作者缺乏烘托氛圍、塑造人物的能力,只能藉助於副詞來進行描寫。從這個角度來看,副詞使用率也可以作為作家寫作能力的一個指標。當然,這並不包括勞倫斯和納博科夫在內的能夠自由運用語言的偉大作家們。
二 塑造你的寫作指紋
你的風格是你本人的化身。——凱瑟琳?安?波特
被稱為美國憲法的聖經—《聯邦黨人文集》中,有12篇文章的作者不明,歷史學家們爭論了150年,也沒有確定的答案。直到1963年,兩位統計學家莫斯特勒和華萊士教授,通過詞頻和概率研究,才最終確定:這12篇文章的作者是總統麥迪遜,而不是漢密爾頓。
布拉特用小說驗證了這兩位教授的假設,他把奧威爾的《動物農場》作為未知作品,與其他49位作者的作品進行比較,結果顯示:《動物農場》的作者是奧威爾。
布拉特又把50位作家,600部作品中的每一個作品,都與其他的作品進行比較,結果顯示,能夠準確找到作者的成功率是99.4%。這個結果證明了:每一個作家的寫作風格就像指紋一樣,是獨一無二的辨認特徵。
J.K.羅琳曾用筆名羅伯特?加爾布雷思,來寫偵探小說,這與《哈利波特》系列的寫作類型完全不同,布拉特通過比較多個詞語的使用頻率,發現詞頻並不取決於作品的類型,而是取決於作家的個人風格。即使寫作不同類型的作品,作家們也會保持一致的風格。
通過詞頻分析,我們還能發現,納博科夫最喜歡的詞是mauve(淡紫色);《華氏451》的作者雷?布拉德伯里最喜歡的詞是「ramshackkle(搖搖欲墜)和cinnamon(肉桂)。
優秀作家都有自己的寫作風格,我們每一個有志於寫作的人,也應該去塑造自己的風格,這是你區別於他人的特點,也是你成為一個好作家的起點。
三 有所保留的聽取寫作建議
在聽從任何人的建議前,應該先思考兩個簡單的問題:
1 提建議的人有沒有遵從自己的建議?
2 有誰靠聽從這些建議獲得成功了嗎?
你可能看過電影《決戰猶馬鎮》(3:10 to Yuma)和《危險關係》(Jackie Brown),這兩部電影都是根據作家埃爾默?倫納德的作品改編。倫納德在《埃爾默?倫納德的寫作十規》中,聲稱:「作品中,每10萬字中的感嘆號不能超過3個。"他還主張,不要用"突然"(suddenly)這個詞。
作家是否遵循了自己的主張?這些主張是否是寫作的普適原則呢?
布拉特通過驗證發現,倫納德本人使用的感嘆號的數量,是他自己聲稱的16倍!!!然而,考慮到,這是他2001年提出來的原則,在此之後,倫納德在作品中確實遵循了他自己的原則。
通過將職業作家和業餘作家進行對比,發現業餘作家使用了更多的感嘆號,也就是說,優秀作家們的確少用感嘆號,大概因為優秀作家們能夠用文字烘托出感嘆號的氣氛,感嘆號反而會削弱文字本身的力量。
關於「突然」的使用,倫納德也遵循了自己的建議。在580部作品中,只有26部作品沒有使用「突然」這個詞,其中15部都是倫納德的作品。
將職業作家和業餘作家進行對比後,發現對"突然"的使用,二者並沒有很大的區別,所以,倫納德自己遵守了不使用「突然」這個詞的建議,然而,這並不能作為寫作的普適原則。
有些寫作建議,與作品質量是密切相關的,而有些建議,只是作家的個人偏好,即使不採納,也能寫出好的作品。不管是什麼樣的寫作建議,最值得我們學習的,是作家「注意細節的寫作態度」。正如布拉特所說:
成功的作家會注意每個詞和每個標點符號的作用,打磨自己的作品。不管是經典作品還是暢銷書,最終能讓留在每一頁上的詞句產生打動人心的力量的因素,可能還是作者的寫作態度。
四 重複會有損作品的質量嗎?
專業術語「首句重複」,指的是連續句子的開頭都是同一個單詞或短語。
很多寫作指導都建議,不要採用首句重複,因為這會造成文字單調,句子結構重複,閱讀體驗差。記者本?亞戈達也認為,"用詞重複暴露了心不在焉的笨拙寫作"。然而,如果你是有意識地運用重複,並且具有一定的語言能力,重複反而能產生「節奏感和力量感」。
狄更斯就是這樣的大師,他的《艱難時刻》,連續使用6個「A man」作為首句重複詞,《雙城記》中的「那是最美好的時代,那是最糟糕的時代……」也以重複給讀者留下了深刻的印象。
寫作有一些基本的原則,然而偉大的作者,總會能打破這些原則,創造出偉大的作品。這就是「守破離」的境界吧,當你把原有的準則應用到得心應手之後,就可以打破它,從中建立起自己的寫作原則,反而能夠獨具一格。
五 偉大的開頭什麼樣?
《白鯨》的開頭只有三個英文單詞:「叫我以實瑪麗。」(call me Ishmael)。
星雲獎得主、《使女的故事》的作者瑪格麗特?阿特伍德認為,」這三個字飽含力量「,在一開始就設下了無數的懸念。
簡短是偉大開頭的必要條件嗎?
作為反例,塞林格的《麥田守望者》用了63個英文單詞開頭,中文如下:
你要是真想聽我講,你想要知道的第一件事可能是我在什麼地方出生,我倒霉的童年是怎樣度過,我父母在生我之前幹些什麼,以及諸如此類的大衛科波菲爾式廢話,可我老實告訴你,我無意告訴你這一切。
同樣,以天氣開頭被認為是陳詞濫調。最差開頭的第一名是:」這是一個黑暗的暴風雨之夜……「。然而,奧威爾《1984》的開頭:「四月間,天氣寒冷晴朗,鐘敲了十三下。」又被認為是有史以來最好的開頭之一。即使在86部普利策獲獎作品中,也有13部作品使用了天氣作為開頭。用天氣開頭雖然被認為是陳詞濫調,然而卻被作家用得有些普遍。
從這些優秀的開頭來看,一個好的開頭不在於是否簡短或者是否陳詞濫調,而是在於作者是否在開頭製造了故事張力,能否激起讀者的好奇心和探尋的慾望。
在《納博科夫最喜歡的詞》中,布拉特一共對1500部作品進行了分析,堪稱外國文學大匯總。大數據發現了一些寫作的基本規律,也能告訴我們作家們最喜歡的詞是什麼,然而,何時打破、如何打破、如何形成自己的寫作指紋,大數據卻無能為力。
你會發現,不管是什麼樣的寫作準則,總會有偉大的作家用反例告訴我們,不遵守也可以,只要你手段高明。而很多作品的偉大之處,也正是因為它們打破了常規,然而又創造出了新的境界。這些AI真的能做到嗎?