作者raiderho (冷顏冷雨)
看板CFantasy
標題[閒聊] 幾個作者的句長
時間Wed Jan 11 17:55:32 2012
一個作家可能有好幾個不同的筆名,要判斷哪些筆名是否為同一個作家所有,
實務上最客觀的方法就是看(同一時期)作品的句子的平均字數(句長)。根據
統計,同一個作者的作品平均句長不會有太大的變化。因此,若有兩筆名的作品
平均句長相近,我們無法拒絕這樣的假設:「這兩個筆名其實源自同一作者」,
意即,同一本尊的不同化身的證據就多了些(仍無法認定是同一本尊);類似的,
若平均句長相差甚大(比如一個字以上),應可推論兩個筆名出自不同作者。用
這個方法,可以明確推斷紅樓夢前八十回與後四十回確為不同的兩個作者,以及
美國早期憲法的篇章(只知道是哪幾個人寫的,未署名)各出自誰的手。
前話少說,本篇為求簡明,省略95%信心水準、虛無假設等統計用語,直接
敘述我的調查動機、方法及結果。
友人日前在批踢踢告知我說:「據說狐言和默默猴是同一人。」然而,這話
與我數年前看文印象、聊天紀錄頗有差別,我印象中,這兩位應該是親戚,假如
是同一人,我先前被誤導了。
於是我用微軟的word做了如下簡單的小調查。我用取代功能取代逗號、句號、
頓號、問號、驚嘆號、冒號和分號,統計這個數量,令其為a; 刪去破折號、引號、
雙引號、刪節號,剩下的全行字元數令為b, 因為通常一個句子的結尾多為計數a
的那七種標點符號之一,(這裡定義頓號與頓號間自成一句,不這樣定義結果沒
差太多),因此我以b/a 來估計作品的平均句長。
我挑了《水龍吟》全書首章<蘆花春曉>來估計狐言的平均句長,得a=2530,
b=20541, 因此 b/a 約為 8.1;
我挑了《照日天劫》全書首章<七禽六獸,十三衣冠>來估計默默猴的平均
句長,得a=1491, b=11995, 因此 b/a 約為 8.0;
作為對照,羅森顯然是完全不同的人,(不然這個世界就太可怕了),我以
風姿第二部《我意天下》首章<登基大典>來估計羅森的平均句長,得 a=1445,
b=13295, b/a 約為 9.2...
就是這樣。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.109.160.13
推 Harunobu:結論是"狐言和默默猴是同一人的可能性"頗高? 01/11 17:58
→ raiderho:8.0接近8.1, 我不想做什麼結論.. 吃尾牙去,或許回來再聊 01/11 18:03
※ 編輯: raiderho 來自: 140.109.160.13 (01/11 18:10)
推 pillsib2:說好不提水龍吟QQ 未庚跟袁畫影啊!! 01/11 18:11
→ tony332976:句長......... 01/11 18:15
推 kusowan:好奇古龍會是多少XD 01/11 19:01
推 crisis7287:提到水龍吟就傷心 QQ (望向書架 01/11 21:04
→ raiderho:你去向默大問囉XD 01/11 23:31
推 joua101:滿有意思的XD 01/12 12:11