作者myoutuki (M.T)
看板Gossiping
標題Re: [爆卦] 混淆網軍監測的方法 (最安全又不影響閱讀的方式)
時間Fri May 2 21:40:45 2014
強者我朋友看到這篇文章想回應一下,可惜他沒有權限,所以小妹我代PO。
以下是他的想回應的(他網誌有寫一篇,為了讓更多人知道,所以轉貼上來)。
標題:最安全又不影響閱讀的方式
-----------------------------
聽說最近網路監測很紅,剛剛看到幾種反監測的機制。
剛好我就是在開發這種東東的,我就以「如果是我遇到這種字詞,我該怎麼寫判斷式來剖
析」來思考,結果發現這些機制都沒什麼太大的用處,頂多就是程式微調而已。
那...到底該怎麼反監測呢?
以下是我看到的一些反監測的手法:
─────────────────────
※在字詞中間加入空白
如:你 好 , 今 天 天 氣 真 好
評語:說真的,這只是在拖累主機運算速度
真正程式寫得好一樣有辦法算出來
─────────────────────
※加入贅字
如:你耶好耶,今耶天耶天耶氣耶真耶好
評語:式就很難以程式自動偵測
的確反監測的能力更大幅上升
但是增加閱讀困難,非常的不易閱讀
─────────────────────
※故意錯字
如:擬郝,金添天企斟好
評語:如果每次錯字都一樣,對反監測來說是毫無反監測的意義的,真正寫得好
程式並不是以人工去計算我該監測哪些關鍵字,是以電腦自動學習偵測的
,也就是說如果每次「你好」都打成「擬郝」,電腦依然可以判別這兩個
字是一樣的意思(你看看Google在我們打錯字的時候也會顯示:您是不是
要找XXXX就知道了。)
而且也增加了閱讀的困難度,不建議
─────────────────────
※台灣之光─火星文
如:尼豪,金tian tian氣真豪
評語:和上面故意錯字其實用意差不多
─────────────────────
回到正題:那...到底該怎麼反監測呢?
正所謂:擒賊先擒王,打蛇打七寸
既然知道技術是「把文字抓下來以後分析」
王牌是的文字抓取程式,既然知道這點就好辦了。
我們來看看以下這張圖片吧:
http://i.gyazo.com/bdd7b815fa9c6b53b6b7d4d4c6629519.png
有沒有覺得似曾相識?
沒錯,文字只要以圖片的方式儲存,幾乎就可以直接擊潰文字抓取程式了。
對監測系統來說,要分析這種東西就變成完全不同的另一種技術(文字辨識OCR)了
等於要
整支程式打掉重寫。
尤其看到遠X的系統後我更確定國家目前並沒有掌握良好的OCR技術
(↑希望上色成功)
當然,如果只是單純黑底白字的圖片,要分析就越容易,仿間就已經有這類免費軟體提供
給人做OCR了,所以圖片當然越複雜越好
但,這樣要發一篇文章是不是就很麻煩?說簡單不簡單,說麻煩不麻煩
手動方法如下:
Step1:首先打開Word
http://i.gyazo.com/8e2fbc9f1bcaf1521d58e7cdee6fad68.png
Step2:打好你要的文章,排版
http://i.gyazo.com/47309cf5aaef20703627ff22ef8e74c9.png
Step3:插入圖案
http://i.gyazo.com/5130eb9db70b19e886008146ad89ded3.png
Step4:拉到想要的大小,選好你喜歡的顏色
http://i.gyazo.com/143acd0b3168a44b15946b5bb1a5ee79.png
Step5:圖片至於文字之後
http://i.gyazo.com/008f059439e3ca30b694090bb84dcfd4.png
Step6:加入越多圖案越好,文字也盡量不要用預設黑色,最好也改用很少見的字體
http://i.gyazo.com/8d5879787d9f97f28c13043fb3aff980.png
Step7:最後,按下畫面右上角的"Print Screen",然後打開小畫家→貼上→另存新檔
http://i.gyazo.com/7285f18663f1601291a7fa98cea4b116.png
Step8:之後利用Miu Pix上傳到網路上,OK!
上傳方式參照底連結
http://www.freegroup.org/2013/11/miu-pix/
當然,也可以有自動產生這些雜訊的方法,不過這必須要有人提供伺服器才能辦到
因為目前本人經濟狀況不允許,所以無力租用或購買伺服器
自動的方法有像是Text Images這類軟體,具體有沒有人知道有其他更好用的我就不知道
了
當然最好是希望能直接架設一個網站,在網站文字框輸入內文後直接轉換為有雜訊的圖片
,利用PHP內建的函式寫一支自動加上雜訊(也就是圖片上一堆白線一堆奇怪顏色的東西)
(如果有人願意提供伺服器,我可以免費代寫這支程式)
最後,我們就用 Microsoft 的 灣諾特 提供的文字辨識來試試看Step6解析出來的文字會
是什麼樣子
http://i.gyazo.com/fbd0f9d83d63842ef4830d97c049672f.png
今天文章到此結束~(我需不需要發一篇不自殺聲明啊?)
-----------------------------
強者我朋友表示:
因為他的那種方式圖片太簡單,我這邊剛剛試驗三秒就可以解析出來了...
看到剛好我專業的地方手癢 (X
以上,那麼代PO的我需要不自殺聲明?XD
--
Eine Lüge wiederholt tausend Mal, das ist die Wahrheit.
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.251.43.181
※ 文章網址: http://www.ptt.cc/bbs/Gossiping/M.1399038056.A.955.html
推 g96G69g:好真氣天天今,好你 05/02 21:43
→ agong:飽餓:近視加給準備好了 05/02 21:43
推 ntddt:推專業 長知識 05/02 21:44
推 ff181:抓到了 首謀 我們要預防你煽動大眾使用奇怪文字規避政府監控 05/02 21:44
推 whenisawu:你郝奇怪唷 今天這件衣服貿似不核四你耶 05/02 21:45
推 Cervelo1995:這樣推文都是圖片連結....有點麻煩 05/02 21:45
→ ff181:你被雞鴨了 05/02 21:46
推 Cold5566:亂推文 05/02 21:46
推 awpex127:開放飽二吃到飽 05/02 21:48
推 summerleaves:有幾分道理 05/02 21:49
→ cookcake:可以加個文字變形,或許可以增加辨識的難度 05/02 21:54
推 tsioge:除了FB外,這樣會降低資訊流動的速度,不是太好 05/02 22:11
推 awdrite:推 05/02 22:13
推 lalasnow: 05/02 22:15
噓 funnypeter:.......自找麻煩 05/02 22:21
推 j31712:推 05/03 08:58
推 toratarot:難怪中國微博都是圖片檔…… 05/03 11:13