看板 MATLAB 關於我們 聯絡資訊
※ [本文轉錄自 Master_D 看板 #1HKLizr2 ] 作者: kuan0817 () 看板: Master_D 標題: [請益] 使用PCA在分類時的問題 時間: Tue Mar 26 16:24:25 2013 大家好 最近使用了PCA來對我資料做降維 因為降維後的資料是要拿來做分類的 也就是有train跟test 我想問的問題是: 在找尋eigenvector時, 是否可以使用train+test一起去找 如果是這樣做的話, 後續的分類結果是否仍然可以算outside test呢? 看了一些網路上的資料, 好像有些是說可以納入test, 因為是unsupervised的 (清大張智星老師網站關於PCA的教學, 也是先對全部資料取pca, 然後再leave one out的 去看準確率) 但又覺得好像怪怪的 希望有人可以解惑 謝謝大家 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.116.82.127 ※ 發信站: 批踢踢實業坊(ptt.cc) ※ 轉錄者: kuan0817 (140.116.82.127), 時間: 03/26/2013 16:28:46
labbat:pca是平移轉置運算的一種 運算耗費O(n^3) 03/26 19:42
labbat:還是不是有點忘了 總之樣本數大的時候等待時間很可觀 03/26 19:43
labbat:通常希望每個測試樣本看到的是經過相同平移轉置矩陣後結果 03/26 19:45
labbat:分類之外 還有各種統計的分析才有意義 03/26 19:46
u941716:可以 因為feature和label在你的case應該是獨立的 03/27 01:13
labbat:補充樓上 個人解讀為分類索引並不是樣本數據的變數 03/27 01:36
labbat:所以採行pca時只要單純處理數據即可 與獨立的嚴謹定義不同 03/27 01:37
labbat:但是樣本的特徵分布與分類索引的相依特性還是存在著 03/27 01:40