※ 引述《lsf (ckwiou)》之銘言:
: 最近研讀PR碰到了一個問題,腦子有點轉不過來,所以想請問一下,
: 如果我要做一個辨識系統, 會拿一筆Train Data來做訓練,所以當我用
: 非監督式的分群方法來將Train data重新做分群,但是用非監督式做分
: 類時,會將Train Data都給打散掉, 那這樣子我有一筆Test Data要來做辨
: 識時, 要如何才能得知我判斷出來的結果的是對的還是錯的??
: 謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 220.132.186.233
分群(clustering)可以看做是分類(classifying)的前置作業。
因為分類在 training 時是把一個個 pattern 當作輸入,
把其對應的 class 當作預期的輸出,隨著一個個 (pattern, class) pair
的 training 來調整辨識系統的參數。
當你無法知道 train data 的某個 pattern 該歸類到那個 class 時,
才會用到分群法的東西,來幫你找到這個對應;
非監督式作的一定是分群,不會是分類。
通常 train data 最少要分成兩組,一組用來 training 另一組用來驗收
training 的效果,以避免 over-fitting 或 over-training 的情形發生。