作者axalto (亞斯拓)
看板Python
標題Re: [問題] 資料探勘
時間Sun Dec 14 21:42:05 2008
※ 引述《axalto (亞斯拓)》之銘言:
: 請問,python這工具能否做資料探勘之用
: 例如計算confidence,support,關聯規則等等
: 如果可以請問有哪些函數可以用
: 謝謝
推文有人建議用weka來做,我試著使用weka
我是先使用Explorer=>Preprocess打開arff檔案
再點選Associate分頁點start開始執行
不過我發現一個問題,arff檔案內的資料型態必須是類舉的形式
不能用string,numeric等,且欄位內的資料必須都有值,不能是空的
可是我有些資料並非欄位內都由值
例有三筆資料
a,b,c,d
a,c,e,f,h,l
b,c,d,e,f
要做關聯規則就無法使用了(會出現錯誤)
另外萬一我有100多項資料,難道要一一列舉出來嗎
由於沒有weka板,只好來此問問囉
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 59.112.242.40
推 superGA:你要先弄成weka可以吃的格式 12/14 23:38
→ axalto:我有用成WEKA的格式(arff),但我問題在於關聯規則需所有欄位 12/15 16:56
→ axalto:都要有資料,不然會錯誤,另外也無法用string,必須要列舉的 12/15 16:56
→ axalto:方式 12/15 16:56