精華區beta PublicAffair 關於我們 聯絡資訊
強者我朋友看到這篇文章想回應一下,可惜他沒有權限,所以小妹我代PO。 以下是他的想回應的(他網誌有寫一篇,為了讓更多人知道,所以轉貼上來)。 標題:最安全又不影響閱讀的方式 ----------------------------- 聽說最近網路監測很紅,剛剛看到幾種反監測的機制。 剛好我就是在開發這種東東的,我就以「如果是我遇到這種字詞,我該怎麼寫判斷式來剖 析」來思考,結果發現這些機制都沒什麼太大的用處,頂多就是程式微調而已。 那...到底該怎麼反監測呢? 以下是我看到的一些反監測的手法: ───────────────────── ※在字詞中間加入空白 如:你 好 , 今 天 天 氣 真 好 評語:說真的,這只是在拖累主機運算速度    真正程式寫得好一樣有辦法算出來 ───────────────────── ※加入贅字 如:你耶好耶,今耶天耶天耶氣耶真耶好 評語:式就很難以程式自動偵測    的確反監測的能力更大幅上升    但是增加閱讀困難,非常的不易閱讀 ───────────────────── ※故意錯字 如:擬郝,金添天企斟好 評語:如果每次錯字都一樣,對反監測來說是毫無反監測的意義的,真正寫得好    程式並不是以人工去計算我該監測哪些關鍵字,是以電腦自動學習偵測的    ,也就是說如果每次「你好」都打成「擬郝」,電腦依然可以判別這兩個    字是一樣的意思(你看看Google在我們打錯字的時候也會顯示:您是不是    要找XXXX就知道了。)    而且也增加了閱讀的困難度,不建議 ───────────────────── ※台灣之光─火星文 如:尼豪,金tian tian氣真豪 評語:和上面故意錯字其實用意差不多 ───────────────────── 回到正題:那...到底該怎麼反監測呢? 正所謂:擒賊先擒王,打蛇打七寸 既然知道技術是「把文字抓下來以後分析」 王牌是的文字抓取程式,既然知道這點就好辦了。 我們來看看以下這張圖片吧: http://i.gyazo.com/bdd7b815fa9c6b53b6b7d4d4c6629519.png
有沒有覺得似曾相識? 沒錯,文字只要以圖片的方式儲存,幾乎就可以直接擊潰文字抓取程式了。 對監測系統來說,要分析這種東西就變成完全不同的另一種技術(文字辨識OCR)了 等於要整支程式打掉重寫尤其看到遠X的系統後我更確定國家目前並沒有掌握良好的OCR技術 (↑希望上色成功) 當然,如果只是單純黑底白字的圖片,要分析就越容易,仿間就已經有這類免費軟體提供 給人做OCR了,所以圖片當然越複雜越好 但,這樣要發一篇文章是不是就很麻煩?說簡單不簡單,說麻煩不麻煩 手動方法如下: Step1:首先打開Word http://i.gyazo.com/8e2fbc9f1bcaf1521d58e7cdee6fad68.png
Step2:打好你要的文章,排版 http://i.gyazo.com/47309cf5aaef20703627ff22ef8e74c9.png
Step3:插入圖案 http://i.gyazo.com/5130eb9db70b19e886008146ad89ded3.png
Step4:拉到想要的大小,選好你喜歡的顏色 http://i.gyazo.com/143acd0b3168a44b15946b5bb1a5ee79.png
Step5:圖片至於文字之後 http://i.gyazo.com/008f059439e3ca30b694090bb84dcfd4.png
Step6:加入越多圖案越好,文字也盡量不要用預設黑色,最好也改用很少見的字體 http://i.gyazo.com/8d5879787d9f97f28c13043fb3aff980.png
Step7:最後,按下畫面右上角的"Print Screen",然後打開小畫家→貼上→另存新檔 http://i.gyazo.com/7285f18663f1601291a7fa98cea4b116.png
Step8:之後利用Miu Pix上傳到網路上,OK! 上傳方式參照底連結 http://www.freegroup.org/2013/11/miu-pix/ 當然,也可以有自動產生這些雜訊的方法,不過這必須要有人提供伺服器才能辦到 因為目前本人經濟狀況不允許,所以無力租用或購買伺服器 自動的方法有像是Text Images這類軟體,具體有沒有人知道有其他更好用的我就不知道 了 當然最好是希望能直接架設一個網站,在網站文字框輸入內文後直接轉換為有雜訊的圖片 ,利用PHP內建的函式寫一支自動加上雜訊(也就是圖片上一堆白線一堆奇怪顏色的東西) (如果有人願意提供伺服器,我可以免費代寫這支程式) 最後,我們就用 Microsoft 的 灣諾特 提供的文字辨識來試試看Step6解析出來的文字會 是什麼樣子 http://i.gyazo.com/fbd0f9d83d63842ef4830d97c049672f.png
今天文章到此結束~(我需不需要發一篇不自殺聲明啊?) ----------------------------- 強者我朋友表示: 因為他的那種方式圖片太簡單,我這邊剛剛試驗三秒就可以解析出來了... 看到剛好我專業的地方手癢 (X 以上,那麼代PO的我需要不自殺聲明?XD -- Eine Lüge wiederholt tausend Mal, das ist die Wahrheit. -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.251.43.181 ※ 文章網址: http://www.ptt.cc/bbs/Gossiping/M.1399038056.A.955.html
g96G69g:好真氣天天今,好你 05/02 21:43
agong:飽餓:近視加給準備好了 05/02 21:43
ntddt:推專業 長知識 05/02 21:44
ff181:抓到了 首謀 我們要預防你煽動大眾使用奇怪文字規避政府監控 05/02 21:44
whenisawu:你郝奇怪唷 今天這件衣服貿似不核四你耶 05/02 21:45
Cervelo1995:這樣推文都是圖片連結....有點麻煩 05/02 21:45
ff181:你被雞鴨了 05/02 21:46
Cold5566:亂推文 05/02 21:46
awpex127:開放飽二吃到飽 05/02 21:48
summerleaves:有幾分道理 05/02 21:49
cookcake:可以加個文字變形,或許可以增加辨識的難度 05/02 21:54
tsioge:除了FB外,這樣會降低資訊流動的速度,不是太好 05/02 22:11
awdrite:推 05/02 22:13
lalasnow: 05/02 22:15
funnypeter:.......自找麻煩 05/02 22:21
j31712:推 05/03 08:58
toratarot:難怪中國微博都是圖片檔…… 05/03 11:13