看板 book 關於我們 聯絡資訊
※ 引述《mited (太郎)》之銘言: : 知乎:用機器學習判定紅樓夢後40回是否曹雪芹所寫 : https://zhuanlan.zhihu.com/p/21421723 : 所以,我們就更有信心說曹老先生沒有寫後40回了。 : 更多的機器學習有趣的玩法,我會在學習的過程中慢慢嘗試的。以上。
episold: 很有趣 但是以詞彙頻率來推斷作者 這feature太粗略了07/06 23:36
episold: 再想想怎樣把「寫作風格」變成特徵吧07/06 23:41
在中文系,很早以前就用這種方法在探討真偽的問題, 對於理盲濫情光嘴炮,只會喊母豬的十萬酸民眾來說... 啊,不是,不好意思,這裡不是我的主戰場. 我的意思是,對於大多數湊熱鬧的人來說,只看聲光特效爆炸規模還有女主角有沒有露, 但是對於有些堅持看門道的人來說,他們很在乎真假問題,比如說:                   偽 經 在遠古時代,沒有引擎更沒有網路的時候,佛經傳佈非常局部, 你在北京看到最新最熱的佛經,有可能在閩、粵從來沒聽過. 有很多會是只聽說有這部經,但根本不知裡面寫什麼的情況.於是 所謂的托名偽作就會出現. 基本上這東西是這樣,不信都沒事,信了就麻煩,為什麼,因為不能亂信.信錯會出大事. 每個人都說他有一本夢遺大師譯的經,結果拿出來一對,靠夭,怎麼每本內容都很不一樣... 這下你要怎麼辦?觀落陰?擲爻?還是扶鸞? 跼限於時代性、地域性及個人背景,每個人會有每個人的一些翻譯特性. 比如說,鳩摩羅什譯的金剛經,完全沒有用到 空 這個字.      玄奘    一堆經,名詞譯法都跟前人不太一樣,如,他不用 阿修羅 這譯名. 因此,有人會用語言學的一些方法,來檢視一些有爭議的所謂 oo 人的譯/著, 當然,這有些基本條件要滿足,就是要有其它可信的作品可以參考,不然, 如果傳聞某作者的著作就只有那麼 101 本要辨真偽,可能還是佛、菩薩自己來比較快... -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 60.250.90.238 ※ 文章網址: https://www.ptt.cc/bbs/book/M.1467825473.A.2F0.html
rpg1234pk: 為什麼書版要提母豬什麼的,實在想噓你... 07/07 01:37
hereiam1022: 推 07/07 06:55
hereiam1022: to 1F,客觀引用無須介懷。 07/07 06:56
rainveil: 推 07/07 09:30
descent: 推 07/07 18:28
tak1130: 推 07/08 06:03