看板 Statistics 關於我們 聯絡資訊
不好意思不知道發在此版適不適合 想請問一下,若在資料分析中,未做統計前就將變數刪除合理嗎? 例如UCI鮑魚數據集 裡面的性別有F,M,I(infant) 但是有些infant的年齡卻很大 不知道要如何去解釋它,想要把這變數拿掉 查了一些資料,發現過往的人也都沒有去發現這問題... 就直接開始丟統計軟體 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.162.139.21 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1497283279.A.2EC.html
ayre: 每個變數的定義都弄清楚了嗎?有時候只是蒐集資料時coding 06/13 00:58
ayre: 方式不同 06/13 00:58
love113w: 弄清楚了 有些嬰兒年紀比男性女性大... 06/13 08:53
ayre: 如果確定不是coding的時間單位不同,而且這些值刪掉不會影響 06/13 21:24
ayre: 其它變數的敍述統計量,刪掉未必不可,但是記得在report時, 06/13 21:25
ayre: 要清楚揭露處理資料的方式 06/13 21:26
love113w: 謝謝 06/13 23:05