誰是最“複雜”的小說:文學敘事中的長程關聯與多重分形
導語

現代主義以來,小說在形式和內容上都愈加繁雜多樣、甚至晦澀難懂,這種複雜趨向是否有內在原因推動?我們能否進行有效度量?在 2016 年一個來自波蘭的物理學家團隊,通過採用統計短句和長句句長變化分佈的方法,對一百多部世界名著進行了文本複雜度分析,發現絕大多數作品都存在長程相關性和分形結構,尤其是多重分形可以作爲文學作品複雜度的度量指標,並指出這種結構的成因與生物和社會活動高度相關。

論文題目:

Quantifying origin and character of long-range correlations in narrative texts

論文地址:

https://www.sciencedirect.com/science/article/pii/S0020025515007513

**

被詆譭的塞萬提斯的遺產

**

小說是什麼?爲什麼小說在現代世界裏會越來越複雜?

對這個問題的回答,也許不僅關乎文學本身,更關乎我們當下的生活,和人類歷史與未來的道路。

在經歷過一戰創傷後,20 世紀哲學家、現象學創始人胡塞爾,在去世前談到歐洲人性危機時曾說 [1],危機的根源其實不在現代,而在前現代世界的初期,在伽利略和笛卡爾那裏。自從歐洲理性主義和科學興起,就將世界縮減成了科學探索的一個簡單對象,從而將具體的生活世界排除在外了。因此專業愈是分工,人們掌握的知識越深,就變得越盲目,既無法看清世界的整體,又無法看清自身。

在這個過程中,傳統價值也逐漸趨於崩潰,人們不再有確定不移的信仰,世界被祛魅,基於簡單規律的機械世界和工具理性,在人們眼中,漸漸取代了複雜而豐富的生活與人性本身。

誰是最“複雜”的小說:文學敘事中的長程關聯與多重分形圖 1:絕對時空觀下的鐘表宇宙

無可否認的是,世界的複雜是無法掩蓋的。二十世紀兩朵烏雲 [2] 催生的相對論與量子力學,羅素悖論引發的第三次數學危機,以及非線性科學與混沌革命下誕生的複雜系統科學,讓即使在科學內部也已經窺見到了確定性的喪失。這些源與於笛卡爾的理性遺產,一種簡單、還原、確定價值的世界觀,與複雜世界的矛盾開始在近代開始爆發,它包括人性加劇異化、國家與民族主義興起,兩次世界大戰、現代性與後現代主義思潮。

在胡塞爾看來,這就是人的異化與現代性危機的由來 [3]。

然而,人們真的遺忘了存在的本真、遺忘了生活世界的複雜與豐富嗎?

捷克小說家米蘭·昆德拉認爲,實際並非如此。只是哲學家忽視了,在笛卡爾之外,還有另外一位現代的奠基人,他就是西班牙文學巨人塞萬提斯。在火藥勝過騎士精神的年代,《唐吉坷德》這部終結騎士傳奇的最後一部騎士傳奇,穿梭於虛構和現實之間,開創了真正意義上的現代小說:一種立足於整個人類延續性,探索世界複雜性和生活何以可能的敘事藝術:

從現代的初期開始,小說就一直忠誠地陪伴着人類。它也受到“認知激情”(被胡塞爾看作是歐洲精神之精髓)的驅使,去探索人的具體生活,保護這一具體生活逃過“對存在的遺忘”;讓小說永恆地照亮“生活世界” ——《小說的藝術》

   ![誰是最“複雜”的小說:文學敘事中的長程關聯與多重分形](https://img.chainnews.com/material/images/b7892b15b5155e63c7b3359df2e982f4.jpg)

圖 2:捷克著名小說家米蘭·昆德拉

小說告訴我們,世界是不能被簡化的,不是實驗室這臺冰箱裏的大象,是一個活生生的、充滿各種可能性、複雜而豐富的整體。

——作爲哲學家的胡塞爾,和作爲小說家的昆德拉說得有道理嗎?

這些我們心中的疑惑與不確信性,也許簡單的科學已不足以做出結論。

小說的敘事複雜度

作爲一種基於文本書寫敘事的藝術,小說在故事情節和內容不僅可以超出現實邏輯,長度也不受限制。之前我們曾經介紹過,對結構複雜度的衡量 [4] 是預測人們圖像偏好的良好指標。美和複雜度之間具有一種相似關係。

那麼對於文學藝術呢?在敘事文本中是否可以找到類似的複雜性的度量指標,可以用來評判一部敘事文本的優劣程度?

一個很自然的想法就是文本所蘊含的信息量。然而,文學的藝術不是記事——它要求敘事內容之間有高度的關聯,僅僅是對各種信息的羅列並不構成小說,否則一部辭典的信息量會超過任何一部經典名著了。

在 2016 年的《Information Sciences》雜誌上,一個波蘭物理學家團隊研究了這個問題,並發表了一篇名爲《量化敘事文本中長期關聯的來源和特徵》的論文,他們選取了世界範圍內的一百多部文學作品進行了文本複雜度分析。

通過研究這些名著中句子長短和結構的變化,他們發現,絕大多數作品中都有一個十分有趣、同時又具備美學價值的最佳結構。這種結構不僅包含了一定程度上的自相似性,即作品每一個小部分在延展開之後和整體的結構協調一致,不同句子間的長度變化還呈現出一種級聯性的長程動力學 (the dynamics of a cascade)關聯。顯然,前者是分形結構的典型特徵,而後者則是複雜網絡系統的一種屬性 [5]。

在此基礎上,研究者們提取了兩個指標作爲評判一部作品敘事複雜度標準:長程相關性(long-range correlations)多重分形複雜度(Multifractal)

什麼是多重分形?

多重分形系統是分形系統的推廣,對後者單個指數的分形維數已不足以描述整個系統的動態。在直觀上可將多重分形形象地看作是由大量維數不同的單一分形交錯疊加而成的。多重分形系統在自然很常見,包括海岸線的長度、完全展開的湍流、太陽磁場的時間序列變化、心跳的動力過程、人類的步態和活動、人類的大腦活動等等。

對於多重分形,可以通過定義廣義維度,或者採用一個連續的指數譜即奇異譜(Singularity spectrum,也被稱爲多重分形譜)函數進行描述 [6]。

   ![誰是最“複雜”的小說:文學敘事中的長程關聯與多重分形](https://img.chainnews.com/material/images/e6672803108961218f7b59b2d9b5d0d2.jpg)

圖 3:自然形成的多重分形地貌

長程相關性與多重分形

在人類原本的自然語言中,使用短句一直是有效的交流方式。但是,僅僅由此類句子組成的文本看起來很機械,讀起來很無趣。相對的,由長句組成的文本則需要大量的理解力,這是以書寫爲主要載體的小說的特徵。在文字媒介上,人們可以反覆閱讀一段文字以進行深入理解。因此,可以着眼於文本的句長變化開始對小說進行研究。

研究者們首先定義了句長變異性(sentence length variability,SLV)的統計變量,然後選取了選擇了 113 種英語,法語,德語,意大利語,波蘭語,俄語和西班牙語文學文本的語料庫。

設一個連續的句子 j 包含一系列的單詞,長度以所包含單詞數 l(j) 表示。可以看到,句子是純粹由語法定義的,是一個以大寫字母開頭並以句號結尾的單詞序列。由此,可以由傅里葉變換的模平方(Fourier Transform modulus squared)得到代表短句和長句長度分佈的譜密度(power spectra)分佈函數 S(f) :

   ![誰是最“複雜”的小說:文學敘事中的長程關聯與多重分形](https://img.chainnews.com/material/images/0b3ef3aecb974a5baff6ca2029d03621.jpg)

通過對這些文學名著文本中的句長變異性 SLV 研究發現,在短句和長句二者之間存在一種具有周期規律性的分佈,其中涉及到各種長度句子的自相似分佈、級聯式交替。如圖 4 所示:

   ![誰是最“複雜”的小說:文學敘事中的長程關聯與多重分形](https://img.chainnews.com/material/images/cada1ffa2d4b2343d37e90041e2b23e1.jpg)

圖 4:所統計作品的譜密度分佈,橫座標是頻率,縱座標爲句長

從圖中可以看到,表徵 SLV 的譜密度分佈函數 S(f) 普遍展現出了明顯的“ 1 /(f^β)”縮放比例,即存在 β 使得 S(f) = 1/(f^β),且經計算平均標度 β ≈ 1/2。

S(f) 的標度 β意味着文本中存在長程相關性(long-range correlations),絕大多數被研究文本都具有這樣的分形屬性。非常有趣的是,β的值接近之前研究者在音樂作品或腦電波中測量的的水平,它體現了文字作品和生命活動的高度相關。這點在後面還會說到。

對於時間序列事件上有相關性事件的度量,一個重要的指標是赫斯特指數(Hurst exponent)。它起初被用來分析水庫與河流之間的進出流量,後來被廣泛用於各行各業的分形分析。利用赫斯特指數可以表徵網絡流量的自相似性,數值越大,說明流量的自相似程度就越高,即整個系統是一長串相互聯繫事件的結果。

這項研究計算了所有作品的赫斯特指數 H 以度量文本之間的長程相關性。

絕大多數被研究文本都單純服從以上的分形屬性。但令人矚目的是,具有超文本形式的“意識流”小說,表現出了一種相互交織、不可還原的分形集結構特徵,即被稱爲多重分形的非線性結構特徵。爲了提取多重分形指標,論文使用針對 SLV 的小波分解(Wavelet Decomposition)進行可視化呈現,以及數值上更穩定和準確的多重分形趨勢波動分析(MFDFA)[7] 的方法。

最終計算結果表明,多重分形的度量與赫斯特指數決定的霍爾德指數(Hölder exponent)α 以及其函數 f(α) 有關。如圖 5 所示,f(α) 是具有特定α點集的分形維數,即多重分形譜。對於一個模型的多重分形序列,f(α) 通常被假設爲類似於倒拋物線。其中拋物線寬度 ∆α =αmax-αmin 代表多重分形程度,即被視爲文本複雜度的的一種度量。

   ![誰是最“複雜”的小說:文學敘事中的長程關聯與多重分形](https://img.chainnews.com/material/images/dd5cd4715d4888a054ec225bfc954710.jpg)

圖 5:意識流小說家喬伊斯名著《芬尼根的守夜靈》的多重分形特徵

誰是最複雜的小說?

在對一百多部名著進行分析後,研究者們發現,意識流小說具有最高的多重分形複雜度。

結果如下圖 6 所示:

橫座標 H (degree of persistency),即赫斯特指數,H 越大說明文本單詞之間的長程相關性越大。

縱座標∆α (degree of complexity) 是霍爾德指數的極值差,數值越大則越說明文本的多重分形複雜度越高。

  ![誰是最“複雜”的小說:文學敘事中的長程關聯與多重分形](https://img.chainnews.com/material/images/f55d1b5a8579e42824cf08bdeb8c039f.jpg)

圖 6:一百多部名著的長程相關性與複雜度統計

從圖中我們可以看到,幾乎所有作品的赫斯特指數都大於 0.6。而當 0.5

這項對文本複雜性統計指標的計算結果很有趣,也非常符合人們對名著們的直觀感受。

例如,不僅意識流作品往往具備更高的多重分形複雜度,其中最高還是著名意識流作家喬伊斯的《芬尼根的守夜靈》(Finnegans Wake), ∆α=0.74,H= 0.77。

誰是最“複雜”的小說:文學敘事中的長程關聯與多重分形

圖 7:粉絲用各種顏色對《芬尼根的守夜靈》中語言相關的一頁手繪

這部作品本身就是一個正在進行時的傳奇,它被稱爲比意識流神作《尤利西斯》還晦澀難懂的一部真正的天書。喬伊斯在寫完這本書之後,就曾經說,這本書的謎題至少可以讓評論家們忙上三百年。而粉絲們爲了早日破解甚至成立了加速進程的網站,但至今尚未完全破解。也正因爲如此,它的翻譯異常艱鉅,日本曾經有過三個人先後翻譯《芬尼根的守靈夜》,第一個失蹤了,第二個神經出了毛病,第三個才翻譯完 [8]。

這部作品還有很多趣事,比如物理學中“夸克”( Quark)這個代表基本物質單元的的詞就來自這部小說。

如今看來,偉大的作家果然就是自信,這部所有統計文本複雜度最高的作品,至少說明他當年沒有吹牛,深知自己文學水平和創造能力。

除此之外,同樣是喬伊斯的尤利西斯,拉美作家胡利奧· 科塔薩爾的《跳房子》(Rayuela),羅貝託·波拉尼奧的《2666》,伍爾夫的海浪《The Waves》,都具有相當高的多重分形複雜度。在圖中可以看到,希伯來聖經和莎士比亞的作品,作爲前現代文本,也具有可圈可點的表現。經典作品總是讀之不盡、常讀常新,必然具有一定的複雜的豐饒,這種直觀經驗無疑符合本文研究的統計結果。

還有一些書,例如《A Heartbreaking Work of Staggering Genius》(中譯:怪才的荒誕與憂傷)這本書,在出版後評價一般,然而卻具備很高的多重分形複雜度。回想歷史,有很多作品剛出現後長期埋沒,後來才被文學評論家或作者們挖掘成名著。因此,通過這項研究的結果或許可以進行預測,具備高複雜度、高長程關聯的作品,結合評論者的主觀感受預測,會不會很可能就是未來被熱捧的經典?

小說的複雜與複雜的世界

從前面的分析我們已經看到,長程相關性與多重分形複雜度,是代表小說敘事複雜程度的兩個良好指標,與我們對小說直觀經驗和文藝評論相吻合。

那麼,小說是否真的如昆德拉所說,是人類複雜性的反映呢?

除了以上兩個指標之外,讓我們關注下最開始的指標 β,它是文本中詞頻縮放的頻率冪值,在圖 6 中可以看到在 β= 2H-1 附近分佈,取值幾乎都在 1/4 到 3/4 之間,平均爲 1/2。在這些文本的β的取值同樣非常有趣,它不僅符合人類音樂和聲音 [11] 的頻率, 還包括心率 [12]、認知 [13],甚至自發性大腦活動 [14] 以及其他“天籟之聲” [9,10] 的頻率。同時,與審美偏好的研究類似,它也代表了某種隨機性和有序性的平衡。

從頻率分佈作爲一種活動韻律角度來看,人類寫作似乎真的與生命和自然高度相關。《詩經·毛詩序》言,“詩者,志之所之也,在心爲志,發言爲詩”。唐宋八大家之一的韓愈,曾說“氣盛,則言之短長與聲之高下者皆宜”。也就是說,文章風格甚至能反映出一個人的精神氣質與人格境界,見字如面了。

正因爲如此,人類世界和人主觀精神的複雜性就會在作品中體現出來。

在本文引用的後續研究中,一箇中國團隊用類似的方法研究了中國兩千多年主要文本單詞長程相關性的演變 [15]。他們發現,對於篇幅較大的文本,其赫斯特指數有明顯增長。並認爲導致漢語中字長和句長的增加的原因,是由於社會文化發展和語言結構的自適應特性(詞距與詞長)。

這涉及到了語言進化的問題。一項生物語言學的研究曾經表明 [16],增加更多的信號並不能提高語言的準確性,相反,語言進化是通過僅使用少量信號來描述更多有價值的概念來實現的。而通過將信號 (音素) 組合成單詞,使用構詞法組合成單詞來擴展,就可以克服語言固有誤差導致的通信閾值。這樣單詞長度雖然變長了,但通信最大值也因之呈現出指數級增長。

因此,不僅人類個體生命活動,隨着人類社會發展、世界新的知識增加,新的語言詞彙也會以新的構詞的方式涌現,將世界的複雜度反映到語言中去,尤其是文藝作品中。在《TRENDS in Cognitive Sciences》期刊上有一篇語言研究綜述指出,語言的演變受到與個體、生物因素循環作用的文化三方面綜合影響 [17]。

誰是最“複雜”的小說:文學敘事中的長程關聯與多重分形

圖 8:個體學習、生物演化、文化傳播與語言關係

同時,更爲重要的是,語言和社會,文藝和文化之間的影響不是單方面的。語言和文藝不是單純反映世界,相反,符號和文字系統的發明是人類最早創造複雜系統的嘗試。語言學家已經證明,語言的能力就是從一組有限的元素中產生無限範圍表達的能力 [18,19]。

在有限元素經過無限遞歸後,“多即不同” [20],一個複雜的精神世界,便能由物質世界自行誕生,這種“虛構”的能力 [21],通過人類心智的循環效應(The Looping Effect of Human Kinds)再反過來推進人類現實世界的發展。但這種影響主要通過人類持續對世界的範疇化和歸類活動,而非簡單所謂薩皮爾-沃爾夫假設(Sapir–Whorf hypothesis)的語言相對論。一項研究指出 [22],語言主要從四個方面對文化和社會產生影響:

1. Efficiency in Transmitting Category Information:(比行動)更準確穩定地傳達信息

2. Conceptual Innovation and Change:概念創新,新的歸類、隱喻、時空觀

3. Scope of Application:超過生存範圍規範的探究,如個體美的體驗、宗教體驗等

4. From Models to Moral:超越模型和順從,進行反思和道德評價

相關閱讀:

Philip Anderson,公衆號:集智俱樂部 多者異也:破缺的對稱性與科學層級結構的本質 | 經典回顧

科普大師卡爾·薩根在《伊甸園之龍》中曾說,文字這種體外信息的能力出現,讓人擺脫了對預先編碼遺傳信息的依賴。非虛構的書寫用來記錄和探索自然與社會,形成歷史、哲學或科學。而虛構書寫——即文學,無論是脫胎於神話的史詩,模擬人世悲歡的戲劇,抒發個人情志的抒情詩,抑或是探索人可以有怎樣生活的小說,都付諸於人類生存意義的激發和生命可能性的創造。如果說代表物理世界的 Nature 是來自造物主造化,那麼在第六天後,人所能真正從事的創造活動,便是基於文字在精神世界的創造了。

別林斯基曾說評價莎士比亞,“他的每一個劇本都是一個世界的縮影,包含着整個現在、過去及未來”。而最近去世的文學評論家哈羅德·布魯姆則說“正是莎士比亞創造了我們”,法國小說家大仲馬亦言“創造得至多的是莎士比亞,他僅次於上帝”。

   ![誰是最“複雜”的小說:文學敘事中的長程關聯與多重分形](https://img.chainnews.com/material/images/475938a3f1a8e6fb8d69cb380e43c67f.jpg)

圖 9:今年去世的文學評論家哈羅德·布魯姆,他能背誦全部莎翁作品

這些偉大的作家,通過在語言上的創造,不僅帶給我們一雙觀看世界新的眼睛、創造出了新的文化世界,還能直接影響社會現實,成爲改變世界的力量。管理學大師詹姆斯· 馬奇在教學生涯都不講授管理了,就講詩,講《哈姆雷特》和《唐吉坷德》。魯迅在《摩羅詩力說》亦曾快言:“意太利分崩矣,然實一統也,彼生但丁,彼有意語”。一個民族,一個國家,就此因一部史詩而成。

最終,我們得以看清,在科學之外,最好的文學作品,一直創造着世界,並塑造着我們,讓我們得以應對愈加不確定性的世界,與我們在複雜的世界中共同起舞。

人類將去往何方?這是一部波瀾壯闊的宇宙史詩。

參考文獻及註解:

[1] 胡塞爾《歐洲科學的危機與超越論的現象學》

[2] 即邁克耳孫-莫雷實驗測量的零結果和黑體輻射的問題

[3] 美國當代哲學家 Michael Mien Gillespie 認爲現代性危機的有更深刻更早的根源:“在現代性的進程中,實際發生的並不是神的簡單清除或消失,而是將他的屬性、本質力量、和能力轉移到其他東西或存在中。因此,所謂的袪魅過程也是一個反魅過程,在這個過程之中並通過它,人和自然都被賦予了以前被歸於神的若干屬性或能力。……面對持續很久的神之死,只有把人或自然或兩者在某種意義上變成神,科學才能爲整體提供一種融貫的解釋”——《現代性的神學起源》。即源自中世紀的唯名論,這是一種對上帝更早的簡化論態度,和之後的笛卡爾主義和科學主義一貫相承。這種原屬於上帝的神性可以賦予國家、民族、甚至自由、愛情等任何簡化的概念形成現代神話(myth),因而成爲逃避複雜世界下價值衝突的根源。

[4] 《美可以度量嗎?一種用複雜度指標刻畫藝術品美感的嘗試》

[5] Hackett, Adam W. 《Cascade Dynamics on Complex Networks》

[6] 可參加集智百科對多重分形的介紹,http://wiki.swarma.net/index.php/%E5%A4%9A%E9%87%8D%E5%88%86%E5%BD%A2

[7] J.W. Kantelhardt, S.A. Zschiegner, A. Bunde, S. Havlin, E. Koscielny- Bunde, H.E. Stanley, Multifractal detrended fluctuation analysis of non- stationary time series, Physica A 316 (2002) 87-114

[8] 戴從容,我看《芬尼根的守靈夜》的翻譯

[9] P. Bak, How Nature works: the science of selforganized criticality, Springer- Verlag, New York, 1996

[10] A.L. Barabási, The origin of bursts and heavy tails in human dynamics, Nature 435 (2005) 207-211

[11] A. Bargiela, W. Homenda, Information structuring in natural language communication: Syntactical approach, Journal of Intelligent & Fuzzy Sys- tems 17 (2006) 575-581

[12] M. Kobayashi, T. Musha, 1/f fluctuation of heartbeat period, IEEE Trans.

Biomed. Eng. 29 (1982) 456-457.

[13] D.L. Gilden, T. Thornton, M.W. Mallon, 1/f noise in human cognition, Science 267 (1995) 1837-1839

[14] J. Cong, H. Liu, Approaching human language with complex networks, Phys. Life Rev. 11 (2014) 598618

[15] Heng Chen & Haitao Liu,Quantifying Evolution of Short and Long-Range Correlations in Chinese Narrative Texts across 2000 Years

[16] M A Nowak, D C Krakauer, and A Dress,An error limit for the evolution of language.

[17] M.H. Christiansen, S. Kirby, Language evolution: consensus and controversies Trends Cogn. Sci. 7 (2003) 300-307.

[18] M.D. Hauser, N. Chomsky, W.T. Fitch, The faculty of language: What is it, who has it, and how did it evolve? Science 398 (2002) 1569-1579

[19] R. Ferrer-i-Cancho, O. Riordan, B. Bolloba, The consequences of Zipfs law for syntax and symbolic reference, Proc. R. Soc. B. 272 (2005) 561565

[20] P.W. Anderson, More is different, Science 177 (1972) 393-396.

[21] 尤瓦爾·赫拉利 , 人類簡史

[22] SA Gelman,How language shapes the cultural inheritance of categories (2017)

1

列表可上下滑動

**
**

**
**

作者:十三維 編輯:張希妍

**

推薦閱讀

**

如何科學地拓展社交網絡?專才與通才的策略不同

幾何爲萬物賦能——建築、醫療、動漫、遊戲……

圖學習:探索網絡結構如何影響人類認知的新興領域

Science 經典回顧: 貧窮妨礙認知功能 | 諾貝爾獎掀起“貧窮”問題討論

加入集智,一起復雜!


誰是最“複雜”的小說:文學敘事中的長程關聯與多重分形

集智俱樂部 QQ 羣|877391004

商務合作及投稿轉載|swarma@swarma.org

◆ ◆ ◆

搜索公衆號:集智俱樂部

加入“沒有圍牆的研究所”

誰是最“複雜”的小說:文學敘事中的長程關聯與多重分形

讓蘋果砸得更猛烈些吧!

來源鏈接:mp.weixin.qq.com