看板 Statistics 關於我們 聯絡資訊
有些時候,要取 Log, Natual Log, 幾何平均數..時 都要求數值不能有0 這時如果想算這些值,有人建議將原始數據平移 強迫全部不為0 如果是這樣的話,那應該加上什麼樣的值作為平移的標準? a. 0 以外的「最小值」 b. 0.000000000000000000000............00000000001 請問哪一個比較好呢? 如果是第一種 a. 似乎比較客觀 如果是第二種 b. 雖然可以讓「平移的量」達到最小,但到底要幾位數就變成人為任意 再者,像「幾何平均數」是 兩者相乘再開根號 如果是 b. 會使兩者相乘的結果,位數跟著往後一直移 造成「幾何平均數」與「算數平均數」的結果差異非常非常大 所以想問大家,是不是第一種 a. 的作法比較好? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 202.103.141.2 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1435978572.A.2C4.html ※ 編輯: RungTai (202.103.141.2), 07/04/2015 10:58:01
allen1985: 一般最常見的是log(x+1) 但如果在解釋時 都轉回原本的 07/04 12:22
allen1985: scale 建議你想一下 為什麼你需要做log轉換 這問題可能 07/04 12:24
allen1985: 比 +1, +0.1, +0.001 重要點 07/04 12:24
jason486: 如果是想把偏態資料轉換成常態 ,通常是先加上某一數 07/04 14:30
jason486: 值使最小值為1,再進行轉換,可參考: http://goo.gl/iNh 07/04 14:30
jason486: KS2 07/04 14:31
jason486: http://goo.gl/iNhKS2 07/04 14:31
RungTai: 但如果原始值就是介於 0~1之間呢 07/07 11:29
allen1985: 介於0~1之間有什麼差別嗎 是所有值+1 不是只有0+1喔 07/08 09:58