精華區beta CSSE 關於我們 聯絡資訊
分群(clustering)可以看做是分類(classifying)的前置作業。 因為分類在 training 時是把一個個 pattern 當作輸入, 把其對應的 class 當作預期的輸出,隨著一個個 (pattern, class) pair 的 training 來調整辨識系統的參數。 當你無法知道 train data 的某個 pattern 該歸類到那個 class 時, 才會用到分群法的東西,來幫你找到這個對應; 非監督式作的一定是分群,不會是分類。 通常 train data 最少要分成兩組,一組用來 training 另一組用來驗收 training 的效果,以避免 over-fitting 或 over-training 的情形發生。 ※ 引述《lsf (ckwiou)》之銘言: : 最近研讀PR碰到了一個問題,腦子有點轉不過來,所以想請問一下, : 如果我要做一個辨識系統, 會拿一筆Train Data來做訓練,所以當我用 : 非監督式的分群方法來將Train data重新做分群,但是用非監督式做分 : 類時,會將Train Data都給打散掉, 那這樣子我有一筆Test Data要來做辨 : 識時, 要如何才能得知我判斷出來的結果的是對的還是錯的?? : 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 220.132.186.233