看板 CFantasy 關於我們 聯絡資訊
一個作家可能有好幾個不同的筆名,要判斷哪些筆名是否為同一個作家所有, 實務上最客觀的方法就是看(同一時期)作品的句子的平均字數(句長)。根據 統計,同一個作者的作品平均句長不會有太大的變化。因此,若有兩筆名的作品 平均句長相近,我們無法拒絕這樣的假設:「這兩個筆名其實源自同一作者」, 意即,同一本尊的不同化身的證據就多了些(仍無法認定是同一本尊);類似的, 若平均句長相差甚大(比如一個字以上),應可推論兩個筆名出自不同作者。用 這個方法,可以明確推斷紅樓夢前八十回與後四十回確為不同的兩個作者,以及 美國早期憲法的篇章(只知道是哪幾個人寫的,未署名)各出自誰的手。 前話少說,本篇為求簡明,省略95%信心水準、虛無假設等統計用語,直接 敘述我的調查動機、方法及結果。 友人日前在批踢踢告知我說:「據說狐言和默默猴是同一人。」然而,這話 與我數年前看文印象、聊天紀錄頗有差別,我印象中,這兩位應該是親戚,假如 是同一人,我先前被誤導了。 於是我用微軟的word做了如下簡單的小調查。我用取代功能取代逗號、句號、 頓號、問號、驚嘆號、冒號和分號,統計這個數量,令其為a; 刪去破折號、引號、 雙引號、刪節號,剩下的全行字元數令為b, 因為通常一個句子的結尾多為計數a 的那七種標點符號之一,(這裡定義頓號與頓號間自成一句,不這樣定義結果沒 差太多),因此我以b/a 來估計作品的平均句長。   我挑了《水龍吟》全書首章<蘆花春曉>來估計狐言的平均句長,得a=2530, b=20541, 因此 b/a 約為 8.1;   我挑了《照日天劫》全書首章<七禽六獸,十三衣冠>來估計默默猴的平均 句長,得a=1491, b=11995, 因此 b/a 約為 8.0; 作為對照,羅森顯然是完全不同的人,(不然這個世界就太可怕了),我以 風姿第二部《我意天下》首章<登基大典>來估計羅森的平均句長,得 a=1445, b=13295, b/a 約為 9.2...   就是這樣。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.109.160.13
Harunobu:結論是"狐言和默默猴是同一人的可能性"頗高? 01/11 17:58
raiderho:8.0接近8.1, 我不想做什麼結論.. 吃尾牙去,或許回來再聊 01/11 18:03
※ 編輯: raiderho 來自: 140.109.160.13 (01/11 18:10)
pillsib2:說好不提水龍吟QQ 未庚跟袁畫影啊!! 01/11 18:11
tony332976:句長......... 01/11 18:15
kusowan:好奇古龍會是多少XD 01/11 19:01
crisis7287:提到水龍吟就傷心 QQ (望向書架 01/11 21:04
raiderho:你去向默大問囉XD 01/11 23:31
joua101:滿有意思的XD 01/12 12:11