[問題] 請問SVM的問題

作者KatherineM (憶本象)

看板CSSE

標題[問題] 請問SVM的問題

時間Thu Jan 31 11:27:56 2013

大家好，我有一個關於 SVM 的小問題想請教。就是 SVM 中 feature 的值能不能混用 binary，例如: <0,1>來表示有出現跟沒出現跟連續值，例如: <0.7, 0.9> 這種經過權重後的數值。因為我是做 text mining，我想要同時有 binary 跟權重的特徵，但不曉得這樣混用會不會有影響，或是有要考量的地方，請大大們指教。 p.s. 因為我第一次找到這個版，若是有其他更適合討論 Machine Learning 相關的地方，煩請告訴我，謝謝!! -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 114.36.65.1

推 bob123:fuzzy SVM ? 02/01 04:39

→ KatherineM:所以代表SVM原本是不建議這樣設定特徵值囉? ~"~ 02/01 10:33

推 cansas:我研所作文件自動分類有使用Weighting的效果會比Binary的 02/04 19:47

→ cansas:表示方式好得多就是會分的比較準如果你要混用我覺得可以 02/04 19:48

→ cansas:試試啦不會怎樣效果不一定有時候也要看那個Feature是否 02/04 19:49

→ cansas:本身有鑑別力 02/04 19:50

推 h3615840:剛好我目前也在做類似的研究！目前感覺起來還是feature 02/15 19:05

→ h3615840:的鑑別度影響比較大，目前我也有用到混用的部分， 02/15 19:06

→ h3615840:在可以拆成多個binary的情況下，使用binary的效果感覺上 02/15 19:07

→ h3615840:比起用單一個實數表示稍微好些，不知道是不是因為採用 02/15 19:08

→ h3615840:更多維度做判斷有利提升準確性的關係 02/15 19:09