看板 Python 關於我們 聯絡資訊
最近某堂課老師要我們做跟機器學習有關的程式 我們這組是做有關網路安全的, 分析xss攻擊....等等,用機器學習去分析log檔,之後就可以準確判斷是否為網路攻擊 但是我毫無方向, 老師有給log檔, 但我不知道怎麼去做分析, 有高手能給個大方向嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 120.126.194.203 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1536909363.A.5FD.html
TuCH: 有多少時間? 09/14 15:24
guaptpan: anomaly detection可以查看看 09/14 15:46
ericerix: 到明年6月左右 09/14 15:50
ericerix: 有需要log檔格式嗎 09/14 15:50
jackwang01: 先看你有沒有任何ML相關的知識吧,再來要看這些資料 09/14 19:13
jackwang01: 有沒有label,也就是有沒有標註哪段時間是被攻擊之類 09/14 19:13
ericerix: 有攻擊時間、ip、stature、等等,ML知識倒是淺淺 09/14 20:20
jackwang01: 有label的話就簡單多了 先從基本的logistic regressio 09/14 22:33
jackwang01: n, svm, random forest試試吧,把資料處理成一些你覺 09/14 22:33
jackwang01: 得有用的feature,然後直接套現有的方法做做看,再根 09/14 22:33
jackwang01: 據不足慢慢改進 09/14 22:33
那,處理成feature是人工處理,還是可以用python處理? 因為ML做training的data不是都要好幾萬筆,如果人工處理不會太沒效率嗎? ※ 編輯: ericerix (118.166.122.119), 09/14/2018 23:42:37
TitanEric: 當然是寫程式處理呀 09/14 23:49
jackwang01: 我說的處理feature是指"feature engineering" 09/15 19:24
jackwang01: 轉換當然是程式執行,但如何轉換就是你要去思考的了 09/15 19:25
謝謝各位,正在努力學習了 ※ 編輯: ericerix (118.166.122.119), 09/16/2018 00:32:38