[問題] 能否給個方向呢...關於機器學習

作者ericerix (你媽比痲瘋地精還臭)

看板Python

標題[問題] 能否給個方向呢...關於機器學習

時間Fri Sep 14 15:16:01 2018

最近某堂課老師要我們做跟機器學習有關的程式我們這組是做有關網路安全的，分析xss攻擊....等等，用機器學習去分析log檔，之後就可以準確判斷是否為網路攻擊但是我毫無方向，老師有給log檔，但我不知道怎麼去做分析，有高手能給個大方向嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 120.126.194.203 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1536909363.A.5FD.html

推 TuCH: 有多少時間？ 09/14 15:24

推 guaptpan: anomaly detection可以查看看 09/14 15:46

→ ericerix: 到明年6月左右 09/14 15:50

→ ericerix: 有需要log檔格式嗎 09/14 15:50

→ jackwang01: 先看你有沒有任何ML相關的知識吧，再來要看這些資料 09/14 19:13

→ jackwang01: 有沒有label，也就是有沒有標註哪段時間是被攻擊之類 09/14 19:13

→ ericerix: 有攻擊時間、ip、stature、等等，ML知識倒是淺淺 09/14 20:20

→ jackwang01: 有label的話就簡單多了先從基本的logistic regressio 09/14 22:33

→ jackwang01: n, svm, random forest試試吧，把資料處理成一些你覺 09/14 22:33

→ jackwang01: 得有用的feature，然後直接套現有的方法做做看，再根 09/14 22:33

→ jackwang01: 據不足慢慢改進 09/14 22:33

那，處理成feature是人工處理，還是可以用python處理？因為ML做training的data不是都要好幾萬筆，如果人工處理不會太沒效率嗎？ ※ 編輯: ericerix (118.166.122.119), 09/14/2018 23:42:37

推 TitanEric: 當然是寫程式處理呀 09/14 23:49

→ jackwang01: 我說的處理feature是指"feature engineering" 09/15 19:24

→ jackwang01: 轉換當然是程式執行，但如何轉換就是你要去思考的了 09/15 19:25

謝謝各位，正在努力學習了 ※ 編輯: ericerix (118.166.122.119), 09/16/2018 00:32:38