精華區beta Gossiping 關於我們 聯絡資訊
最近有些網路安全廠商在推一種人工智能的「寫作風格分析」。 買帳號不難,要雇用少數人去操作幾千上萬的帳號,甚至是二十四小 時輪班駐點玩輿論轟炸都不難。 但是有一個東西是幾乎無法被複製的,那就是寫作風格。 我記得這幾天有些耐人尋味的新聞。一個是參議員馬侃過世時,紐約 時報上發表了一篇紀念馬侃、批評川普的匿名投書。結果有研究者把 這篇投書丟去做寫作風格分析,發現這篇文章的寫作風格竟然跟副總 統彭斯(或是他的文膽,whatever)非常相似。一時引發喧然大波。 另一個比較沒那麼新的新聞是,中國有人把《紅樓夢》一百二十回丟 下去做一個簡單的詞語頻率分析。結果得出了前八十回和後四十回確 實是不同人的寫作風格,從旁佐證了「前八十回出自曹雪芹、後四十 回是高鶚所續」的假說。 我不是機器學習專家,但上述的分析技巧並不難,而且日益精進。如 果我們用爬文機器人,把批踢、臉書和水管上面數以萬計的推文丟進 去分析,說不定會有一些有趣的發現呢? 把新聞轉貼或「1124滅東廠」這種已經成為複製貼上的口號先剃 除掉不管,專挑長度夠長的推文來看,我們會不會發現,同一個帳號 底下出現好幾個不同的寫作風格(意味著這個帳號有好幾個人在輪班 使用),或是成千上萬個帳號連結到同一個寫作風格(意味著一個寫 手操作好多個帳號),甚至是公關公司的暗稿呢? 如果版上有擅長機器學習且願意投入時間的朋友,說不定可以往這個 方向去探索看看。 ※ 引述《Forthelife (我認為暱稱一定要全填滿)》之銘言: : ※ 引述《AKIRATOYA (OOOO)》之銘言: : : FB卦點說明:(繁體中文 20 個字) : : 創世神開示了 : : 可能最近五毛入侵狀況太嚴重 : : 連創世神都看不下去了 : : 分享五毛大數據分析 : : FB連結: : : https://www.facebook.com/PTT.TU : : FB內容: : : 鄉民自製五毛大數據分析 : : https://www.ptt.cc/bbs/Gossiping/M.1539511358.A.6F0.html : 這挺厲害 : 結果我的圖長這樣 : http://i.imgur.com/y4WEE1B.jpg : 所以我是異於常人? : 我用手機操作很方便啊 : 點進去屁個幾句再退出程式輕輕鬆鬆 : 我覺得是網軍的重點有兩個 : 1.作息異常規律 : 上班到下班清清楚楚 : 像有一張就是7點到12點吃飯 : 1開工到9點 : 而且每一天都這樣 : 誰上PTT會這麼有規律? : 強迫症嗎? : 2.以前發文或關注的板或推文異於「現在」 : 像是有個綠黨工出來爆料,結果用的前任使用者是藍營持者什麼的,挺好笑 : 重點是熱衷八卦版不好嗎? : 一定要「這個人上線好少,而且只回應貓貓圖,沒有碰觸髒髒的政治,真是個乖寶寶」 : 這種才有資格在這裡? : 我並未否定這程式的偉大或鄉民的熱心及能力 : 更不可能質疑「創世神」的意見 : 但我不免擔心在不斷剷除「異類」時,八卦版也漸漸的和對岸的論壇一樣了 : 那種,嗯,你好我好大家好,大家都是乖寶寶 : 的思想和言論 : 在一定的時間發固定的文章,文章內容「適宜詼諧有趣而不過激引人反感」才是八卦板的模範之類的 : 我擔心真要認真搞「秩序」及「條規」那一套,勢必就會像對岸國家一樣 : 要不以後發言先調查IP再檢測推文時間次數 : 下次再搞點言論審查?嗯,挺完美 : 我誠摯希望八卦版充滿混亂,因為流動的水最難添上顏色,就算一時紅起來也註定退去 : 但如果有人把水龍頭關了,努力的想「淨化」這攤死水,那除了拖延污染的時間外沒有半點用處 : 我懇切的希望八卦版充滿黑暗自私及醜惡,即使是最可笑荒謬毫無用處及邏輯的言論我也希望它存在,因為那告訴我這裡是多麼真實 : 我不會用手機發錢,但我仍然希望這份讓八卦板變「好」的心情能傳播給每一位 : ———————————————— : http://i.imgur.com/sdlnmsj.jpg : http://i.imgur.com/BJKSnJR.jpg : http://i.imgur.com/NTRw09D.jpg : ----- : Sent from JPTT on my Samsung SM-G955F. -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 76.103.130.219 ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1539536803.A.A44.html
RuruX5566: 有喔有喔 有人就是喜歡推文回一拖拉庫218.173.116.159 10/15 01:08
RuruX5566: 不是自開篇新的218.173.116.159 10/15 01:08
lesnaree2: 那不就是廠工體嗎 175.181.179.40 10/15 01:09
lesnaree2: 你不知道的xxx ,xxx不讓你知道的xxx, 175.181.179.40 10/15 01:09
lesnaree2: xxx沒告訴你的事 175.181.179.40 10/15 01:09
lesnaree2: 脈絡都差不多 然後用不同帳號發 175.181.179.40 10/15 01:09
lpllpllpl: 古龍體 XD 114.40.11.127 10/15 01:09
cst02: 直接機器人發文推文風格就可以做到一致了 220.135.116.91 10/15 01:11
jeff0811: AI帶風向革命 218.164.22.108 10/15 01:11
ssaw5166: Ptt紅了之後就被搞爛了 各方網軍都進來 111.82.203.48 10/15 01:11
ssaw5166: 帶風向 還不只八卦板 111.82.203.48 10/15 01:12
zanns: AI風向革命!! 122.254.41.209 10/15 01:12
peterwww: 厲害了 你的綠 101.13.160.224 10/15 01:12
zanns: 慘惹 以後沒500可以領惹 122.254.41.209 10/15 01:13
show282: 哈哈,會不會以後雙方都用AI筆戰啊123.110.212.231 10/15 01:13
BoXeX: 有的人都一個版一個人格惹 有差逆 114.32.45.233 10/15 01:13
jacklyl: 同學會22人體啊 不管22個人誰發都長一樣 39.12.158.48 10/15 01:13
BoXeX: 而且還有一些文風是有人在模仿的 114.32.45.233 10/15 01:15
KEYSOLIDER: 還有反串仔體 9.2科粉的強項 111.82.143.241 10/15 01:16
vick6339: 再不抓多重分身 PTT遲早會被搞爛 114.38.143.202 10/15 01:16
zanns: 反串 反反串 反反反串 QQ 122.254.41.209 10/15 01:17
mithralin: 不同ID但文章風格一樣比較好抓 1.160.129.49 10/15 01:20
wulaw5566: 彭斯那根本抹黑,他一向是比川皇更硬 36.227.18.186 10/15 01:21
wulaw5566: 的新教基督徒,是最挺川的人了 36.227.18.186 10/15 01:21
HotAirFlow: 反甲連很明顯,少人控制一大群id 111.83.81.243 10/15 01:22
ninggo: 講廢話膩 顯卡先贊助一張辣114.136.222.124 10/15 01:23
The5F: 1124滅東廠 1.200.204.43 10/15 01:24
Shauter: 那個CxxxC就很明顯是多人持有 36.234.203.137 10/15 01:25
Standattoe: 推 36.228.226.207 10/15 01:26
colinfeng: 可以 27.247.229.233 10/15 01:27
Shauter: 那個正黑板友做的好處 就是把不同時候 36.234.203.137 10/15 01:27
Shauter: 持有同IP這種傳統上不算分身的東西看見了 36.234.203.137 10/15 01:27
Shauter: 所以一抓包反而是藍色狂勝綠色 36.234.203.137 10/15 01:28
aa85ss20: 很好奇這種「文章風格」的判斷依據跟準 101.9.196.203 10/15 01:28
Shauter: 這反而證明綠營沒錢(或是說光頭根本沒想 36.234.203.137 10/15 01:29
Shauter: 過要贏) 36.234.203.137 10/15 01:29
freshmints: 包含用語習慣 分段 上色這些吧 223.137.11.209 10/15 01:30
abab6111: 中文不太可能做到風格分析 很多反諷句不 27.247.76.218 10/15 01:34
abab6111: 好判斷是真讚美還是反諷 27.247.76.218 10/15 01:34
none049: 樓上你覺得紅樓夢是不是中文? 124.12.55.119 10/15 01:39
Shauter: 誰說的? 你以為只有中文有這種語意跟文 36.234.203.137 10/15 01:39
Shauter: 體? 是不是又在自嗨中文很艱深? 36.234.203.137 10/15 01:39
VXcc: 這也要吵 詞語頻率分析 是不是很難懂? 36.230.233.194 10/15 01:40
none049: 真正不能分析的是用翻譯過的文章然後找 124.12.55.119 10/15 01:40
Tchachavsky: 中文應該做不到ai分析 140.117.221.5 10/15 01:40
none049: 原文的寫作風格吧? 124.12.55.119 10/15 01:40
Tchachavsky: 數據又沒法讀中文 要另外寫 140.117.221.5 10/15 01:41
Tchachavsky: 太龐大了 有些還沒電子化會亂碼 140.117.221.5 10/15 01:41
Tchachavsky: 現在就純粹停留在找單詞 140.117.221.5 10/15 01:43
wigping: 用ai筆戰的時代來臨了 175.97.25.93 10/15 01:48
bndan: 這個難度比做這個工具高太多了 XD 211.75.130.241 10/15 01:56
newtonyd: 馬政府時代 不是出過龍應台體讀者投書 175.182.182.1 10/15 02:04
ho2002: 趕快把那堆DPP黨工帳號抓出來退註203.121.240.166 10/15 03:23
skyhal: == 不要阿 這樣無腦仇同的就無法生存了 == 60.251.244.94 10/15 04:09
kerry0496x: 這篇好 223.136.86.235 10/15 11:48
kerry0496x: 這類意見是每個陣營都會受到檢視, 223.136.86.235 10/15 11:49
kerry0496x: 而不是一直有無腦黨工一直在抹柯粉 223.136.86.235 10/15 11:49
kerry0496x: 通通親中共。 223.136.86.235 10/15 11:49
vvrr: 中文做不到AI分析= =? 一堆人在做啊 60.250.31.103 10/15 12:11