精華區beta PublicAffair 關於我們 聯絡資訊
※ 引述《butterfly21 (butterfly21)》之銘言: : 剛剛提完關鍵字的機制之後 : 馬上有大大來信提供意見<(_ _)> : == 正文開始 == : 林北臭宅軟體工程師啦 : 剛好我們公司也是在搞網路輿情 : 號稱監控數百個網站 兩千多個粉絲團 : 前面大家提到很多方法都是針對搜尋的關鍵字做處理 : 這個切入點非常好 要針對搜尋引擎的特性做應對 : 我再提供一個做法 就是在關鍵字中間加入空白 : 例如 馬英九 變成 馬 英 九 : 對搜尋引擎而言 必須使用模糊搜尋 搜尋效率與精確度大幅下降 : 不但不會增加閱讀困擾 也不用埋入多餘的關鍵字或在關鍵字間加入贅字 : 號召大家發文亂加空白 題供參考參考 不才當過幾年工程師 說實在的把空白清除再搜尋只是多一行程式碼 真的要讓資料搜尋難過建議搭配前一篇的文字錯序 再隨機插入一些特殊符號 例如 * 跟 ? 這類資料庫常用的萬用字元 如果當初寫程式的人偷工就會發生非常有趣的事 重點是把你的關鍵字加工 -- Sent from my Android -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.34.133.6 ※ 文章網址: http://www.ptt.cc/bbs/Gossiping/M.1398959314.A.6C0.html
jameshcm:*?九我要*?你 05/01 23:49
dalepp:實用 05/01 23:49
bigbite:把特殊字元濾掉也是一行程式碼= = 05/01 23:49
jack2:加個全形空白不知道會怎麼樣? 05/01 23:49
epistemie:越來越高招 開始比較難懂了 05/01 23:50
aaasssddd51:?*娘馬*??吸金**的? 05/01 23:50
dian9:所以要錯別字加 顛倒順序嗎 05/01 23:50
ilohoo:外包的你想能多好 05/01 23:50
aresa:有興趣的可以去研究一下斷詞系統,目前中文斷字應該都用他的 05/01 23:50
y90413:** ?? ****** ??**** 05/01 23:50
odsan:@_女良+九*干?你>英)馬 05/01 23:51
goodjeff:**************** 05/01 23:51
NewPoliceman:就,是!像?這""樣^子#嗎& 05/01 23:51
alan99:~!@#$%^&*()_+|{}":?></*-+ 05/01 23:51
zone0317:反服貿石虎路過號召捷運台獨核四核一核二核三風車 05/01 23:51
AquariumJ:偷偷說我們都用歐元符號 超好用 05/01 23:51
ttsieg:馬α英>九。吃>屎 05/01 23:51
odsan:突然覺得我們真可悲 好像活在對面的世界... 05/01 23:52
yommy1108:這跟大陸論壇一樣呀=.= 05/01 23:52
Y1999:所以大家都誤會唐香多龍了,他用心良苦阿 05/01 23:52
yaya:國 民 黨 馬 英 久 無 限 期 支 持 台 灣 獨 立 05/01 23:52
tn00210585:αβγδεζηθκλμνξοπρστφχ 05/01 23:52
butterfly21:你是要SQL injection嗎XD 05/01 23:52
shyshyan:橫轉直呢? 05/01 23:52
x007:馬*英(.人.)九! 05/01 23:53
Tenging:幹!娘!你E九E英Q馬 05/01 23:53
alvar:@34*%(*%【>&#<】:)‵(:)-*(:〝〞 05/01 23:53
deepdish:煞*氣a丁*貴*明*天*會*跟*你*一*起*宅*在*電*腦*前*嗎? 05/01 23:53
aresa:好吧,其實你們用什麼方式藏都沒有用,因為現在文字探勘 05/01 23:53
dian9:習$ 糸柬 中 ^ 像醬嗎 05/01 23:53
vi000246:特殊字元也能濾掉 建乂議一像乂這丿樣 05/01 23:53
aiweisen:還有單引號 ' 也是吧? 05/01 23:54
aresa:也會算一篇文章的權威度,目前是看長度和回應次數 05/01 23:54
alvar:馬(. 人 .) 05/01 23:54
aresa:即使文章可以騙過電腦,但眾多使用者告訴電腦這篇文章有問題 05/01 23:54
aresa:在零碎的文字中找尋各種組合,如果過濾出特別關鍵字 05/01 23:55
blaz:面上那個有專名詞的,我沒他要載卸庫料資好嗎 XD 05/01 23:55
nomorepipe:跪求翻譯舉落~~ 05/01 23:55
dian9:次數回應喔 這難好躲 05/01 23:55
mogason:黑箱服貿 反核 反瘋車 石虎 太 陽 花 總 統 府 行 政 院 05/01 23:55
aresa:還是會被系統示警,依舊逃不掉 05/01 23:55
otaku5566:馬( ′-`)y-~英(  ̄ 灬 ̄)九o(〒﹏〒)o露(∩_∩)奶 05/01 23:56
aresa:再講下去我可能有危險,唯一能保護使用者的,只有PTT 05/01 23:56
fish3932000:佔領英?屁九*眼?馬 05/01 23:56
aresa:顆顆,如果他們想的話 05/01 23:56
dian9:所以當樂趣只能?? 也好 XD~~~ 變形體有趣很~ 05/01 23:57
colorhand:http://share.inside.com.tw/posts/3657 有搞頭嗎? 05/01 23:57
ken90242:不知道加上一大堆特殊符號會怎樣呢顆顆 05/01 23:57
alan99:果如把BB5內文的殊特符號用色黑的........ 05/01 23:57
catalase: 馬?英%九襙#機+掰 05/01 23:57
fish3932000:幹'好?心/惡 05/01 23:57
meaning12:ota ku5566太 好 笑了XDDD 05/01 23:58
lakershank:馬*奶?九-ㄎ@d" 05/01 23:58
Tenging:反四核 馬ˍ九 屁 眼養 05/01 23:59
biaw:馬英九* ←金小刀 05/02 00:01
Plants:超@好*校%der 05/02 00:01
tideecho:為了#網#軍, 人人打#火#星#文 05/02 00:03
lanson0318:高調 05/02 00:03
legendmtg:DROP TABLE 05/02 00:04
vaio5566: 好就左到右從序順字文把 05/02 00:05
seadieman:阿喇釘 05/02 00:06
DarkerDuck:''<>******* SELECT * FROM user 05/02 00:06
alice1226:了解 05/02 00:07
ProductionIG:>馬英九< 05/02 00:08
tAmoloko:推b大!!!!!!!!!!! 05/02 00:11
ayumina11:我}%#~快}ㄐㄑ笑|ˊㄐㄔㄗ死{ㄓㄓ了 05/02 00:11
micsue:_ _ 養的 馬央八 05/02 00:11
Leoreo:Ma央⑨的算術教室 開始囉~ 05/02 00:12
cangming:DELETE * FROM nuclear 05/02 00:12
Leoreo:幹 其實我一點都笑不出來 這跟26要把64打成63+1有啥不同 05/02 00:12
elle:注音文原來很重要阿 05/02 00:13
ines1969:台灣走上中國悲劇 05/02 00:15
nojoe:$馬&久*英 吃 >便 <大 05/02 00:15
taidocky:馬英8+1食屎啦 05/02 00:15
dian9:口艾口幼~ 05/02 00:17
windangellin:其實也有沒要掉逃啊 只*要讓警*檢無法訴起就好惹^^ 05/02 00:18
ht0813tw:加個贅字或是[a-zA-Z0-9]的符號在中間也行 05/02 00:18
Zphoenix:M@ 1N 9 ↓ 台 05/02 00:19
v7q4:是'誰"吵'醒@本*將?軍\ 05/02 00:20
conanai:這幾篇超亂的,跟中國沒兩樣阿QQ 05/02 00:23
Raynor:rm -rf / 05/02 00:27
mushroomface:馬*九&^英$口乞@大/便 05/02 00:32
NAHAy:這種事情去逛逛百度就可學到一堆 26很內行的 05/02 00:39
lily80132:要開始跟對岸一樣了 05/02 00:41
nsaids:尸手尸火 廿中月大 大九 是人渣 05/02 00:52
js9150812:馬/英.久@.@ 趕快出來><吃大便拉 05/02 00:55
chiao130:政#@府真-垃)圾 05/02 01:04
lolucky531:他馬*的九比垃/*@圾不如 人人得兒豬隻 05/02 01:05
OoJudyoO: 媽的 笑不出來 05/02 01:12
SundayRose:看中國網民也這樣搞啊 敏感字都會用符號間隔 05/02 01:33
nfsnfs:<script>alert("垃圾政府!");</script> 05/02 04:50