精華區beta C_Chat 關於我們 聯絡資訊
喔,這東西用"殘留"的概念來講會不太精確。正確地說應該是"和初期相比的變化量" 因為觀眾其實是會到處看而有新舊流動的。 它的定義是:當季去頭(第一集)去尾(最後一集),去頭尾的理由是避免新作第一集 的話題性,例如水星1集就用感應砲削人棍的驚喜感而引起話題去看的突兀量 如果播放到第10集,那就是(10+9) / (2+3)= 殘留率 像水星這種有兩季的半年番,那最後一集定義為24集,故12集的算法還是: (12+11) / (2+3) ,但像是以前烏龍派出所的大於3季的長壽番這方法會失真故排除。 至於為何會執著除與第二集+第三集,可能是網站主的經驗上認為, 第二集跟第三集比較能呈現第一話話題過去消風後,初期的實際平均觀看人數吧。 正常你看一些代理商自己放水管的按讚數和觀看數,你也會發現會隨集數下降 是很常見的狀態。所以他把它量化評估"該作品跟一開始比剩多少人看" 也不能說錯,但也是有可能後來越來越多人看,那麼這個變化量自然就會大於100% 好我知道一定會有人問:幹這算法很奇怪為啥不是根據次前期來比? 比如說同樣12集應該是:(12+11)/(10+9) 來比吧? 因為你要描述的統計量就會不一樣,像這種算法就是我們做期貨程式交易時 來算有錢人的法人們在淨多單跟空單,在近幾個禮拜的連續變化量。 正常用這方法算一定會有忽多忽少的雜訊,但你要抓的多半是連續一直增加或減少 的"異常"訊號。不過這種訊號出現的機會不多啦,如果用這種方法排序比較 這種排法結果就很可能是把一堆雜訊放在一起排名,完全沒有意義。 至於大於三季的年番會改列為"長期劇組"而排除在外,我認為也是有道理啦 因為正常人連看烏龍派出所也不可能死忠到從第一集看到好幾百集吧。 另一個問題就是如果他取樣的樣本太少,那麼依照中央極限定律, 隨機抽樣樣本的平樣本均數之標準誤差會是母體標準差除以樣本數 n 的平方根, 故n小於一定數字下誤差會開始擴大,而不足以代表你想要知道的母體統計特徵。 (講人話:數學會告訴你樣本太少跑出來的結果,很可能誤差會大到不具參考價值) n要多少會取決於各學門的研究方法限制,如果是用統計抽樣的,目前學界建議是 n最好要大於30,那套入公式算標準差就比較沒有問題。 至於30以下要用不是不行,但你可能要比較的項目就要獨立出來, 例如小眾版本就只能跟小眾比。或者乾脆就缺乏樣本數的小眾作品。 所以要怎麼解讀這排行比較好呢: https://ckworks.jp/animeradar/ranking/remain/202210/eplast 我個人認為是把它都是作為跟自己比,也就是: 這動畫後來看的人跟一開始看的人比變多少人。 它可能會變多,也可能會變少。但要講"大家都去看xxxx了" 由於你缺乏真的抽樣統計不特定觀眾現在看啥動畫的調查資料, 而用這排名來推論大家去看啥,統計上不見得是正確的。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.32.100.244 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1673243264.A.E83.html
whiwhiwhi: 推解說 01/09 13:51
修正錯字 ※ 編輯: midas82539 (114.32.100.244 臺灣), 01/09/2023 13:53:58
aram9527: 推認真解說 01/09 14:10
jsstarlight: 推 01/09 14:17
CactusFlower: 統計的分析一直都是很有趣的一門學問 01/09 14:22
emptie: 同意 01/09 14:45
willytp97121: 同時也是超級燒腦的學問(最近在搞研究整個就看不 01/09 16:46
willytp97121: 懂那些公式到底) 01/09 16:46
Meuf: 推認真 01/09 17:34
a1487546: 推 01/09 18:22
lordsky29: 推認真 01/09 18:34