作者sustainer123 (caster)
看板Marginalman
標題資料不平衡
時間Mon May 20 15:30:39 2024
有個明確定義嗎?
或者一個可以衡量的數字?
像雨量資料
沒下雨的資料>>>>>暴雨的資料
差距可能差了幾十倍
這種應該算不平衡
假如換成沒下雨跟小雨
差距可能就3.X倍
這算不平衡嗎?
還有我無法理解隨機複製樣本或刪除樣本的邏輯
假如強行把暴雨跟不下雨變1:1
這不就完全不符合現實世界
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.136.77.174 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Marginalman/M.1716190241.A.846.html
※ 編輯: sustainer123 (223.136.77.174 臺灣), 05/20/2024 15:32:56
→ yam276: 你可學學看SPSS分析 讓他把不平衡的剔掉 但我沒學過05/20 15:33
→ yam276: 幫不了你05/20 15:33
※ 編輯: sustainer123 (223.136.77.174 臺灣), 05/20/2024 15:33:29
→ sustainer123: 好 我去看一下 感謝 05/20 15:33
→ yam276: 可能要載康版的來用 正版很貴 05/20 15:34
→ yam276: 很多會計還金融網站會有教學 05/20 15:35
推 DJYOSHITAKA: 雨量是連續性的 應該還好ㄅ 05/20 16:20