看板 DataScience 關於我們 聯絡資訊
各位好: 最近在練習時間序列的趨勢預測, 在資料處理上遇到問題如下, 資料時間為1月到6月, 因資料未定時上傳, 假設時間以周為單位, 會出現如3月有連續幾周資料為空值, 因為空值為連續性影響, 我覺得補值會造成影響, 所以改以月為單位, 而造成資料筆數剩下6筆 請問這樣還能作為時間序列或以其他方式做預測嗎? 另外對於缺失值是否有其他處理方式? 謝謝大家 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.215.144.51 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1566902768.A.252.html
mistrust0525: 6筆資料基本上用猜的都比較準...就算是週資料也大概 08/27 19:28
mistrust0525: 只有30筆資料實務上靠經驗判斷可能都比較好 08/27 19:28
mistrust0525: 理論而言補值的方法有很多種,但就你的情形看來只有 08/27 19:42
mistrust0525: 6到30個資料點其實在實務上補值會很容易造成偏差 當 08/27 19:42
mistrust0525: 你考慮趨勢跟季節性的時候一到六月基本上只反映了半 08/27 19:42
mistrust0525: 年的狀態 但如果以月銷售量而言週期性通常是以一個 08/27 19:42
mistrust0525: 年度會有比較完整的pattern 基本上丟這個數據進模型 08/27 19:42
mistrust0525: 可能會變成搏杯啦 08/27 19:42
jack11jack11: 感謝,看來只能看看往別的方向分析了,時間序列這想 08/27 20:07
jack11jack11: 法是不太可能了 08/27 20:07