作者qitar888 (OAO/)
看板AKB48
標題[閒聊] TPE48 號次影響票數的可能性
時間Wed Dec 6 02:13:32 2017
小弟剛剛讀書讀累了,閒來無聊想到一個東西
就是應該有一些人投票的時候會從一號二號一路看下去
但是要一路看到一百多號也是很累的
所以應該不少人都會中途而廢
這樣看起來號次很前面的可能會有一些票數上的優勢
坐而言不如起而行
坐在這邊想不如實際上看看數據
於是小弟就從 shouko 大的票數變化圖(
https://zaka46.github.io/tpe48-votelog/graph.html)
提供的 Github 連結(
https://github.com/zaka46/tpe48-votelog)找到了最近期的資料
我用的是 20171206.csv 裡面 1512493501 的那筆數據
先來個 disclaimer:統計的手法總是會有盲點,而且我也沒有跑任何 test,所以我在這邊沒有打算下任何結論
為了做一些應該比較有效的分析
我將所有徵選成員每十號 group 在一起,但是把台研拿掉
也就是所有人理論上都是「素人」的身份(不過 112 的數據我懶得拿掉就是了)
這樣就可以假設每個組平均實力都一樣強,當然實際上強弱應該會差很多
上一下表格:
算術平均:32873.5 標準差:19011.7 標準差 / 平均: 0.58 [1~10]
算術平均:21700.9 標準差:10538.6 標準差 / 平均: 0.49 [11~20]
算術平均:13225.1 標準差:9792.5 標準差 / 平均: 0.74 [21~30]
算術平均:14041.7 標準差:15017.1 標準差 / 平均: 1.07 [31~41]
算術平均:12999.8 標準差:13906.9 標準差 / 平均: 1.07 [42~52]
算術平均:9995.9 標準差:12802.7 標準差 / 平均: 1.28 [53~62]
算術平均:15694.8 標準差:9912.4 標準差 / 平均: 0.63 [63~72]
算術平均:15695.4 標準差:13400.7 標準差 / 平均: 0.85 [73~82]
算術平均:10721.2 標準差:7142.7 標準差 / 平均: 0.67 [84~94]
算術平均:14533.6 標準差:21322.5 標準差 / 平均: 1.47 [95~104]
算術平均:29764.8 標準差:25228.7 標準差 / 平均: 0.85 [106~116]
算術平均:12894.0 標準差:10615.7 標準差 / 平均: 0.82 [117~126]
算術平均:20163.1 標準差:16206.2 標準差 / 平均: 0.8 [127~136]
算術平均:17919.2 標準差:14282.5 標準差 / 平均: 0.8 [137~146]
算術平均:6522.5 標準差:4548.8 標準差 / 平均: 0.7 [147~148]
除了平均我還算了標準差跟正規化後的標準差,
第三欄「標準差除以平均」越大代表組內票數多寡的差異越大,
可以看到有很多組別大概在 0.8 上下,超過 0.8 很多的組內應該都找得到票數很高的徵選成員
第一組跟第二組則是最小的兩組,代表兩組組內的票數相對平均
從這份數據可以說,前兩組的票數普遍高而平均,
或許跟號次有關,當然也很有可能是前兩組的成員有比較容易吸引到很多人的魅力點
P.S. 表格的 gist 版在這:
https://gist.github.com/qitar888/5df0155f490c08b6c40bf88958213776
P.P.S. 分析的原始碼的在這:
https://gist.github.com/qitar888/027047cccde259081dabf9213d051832
P.P.P.S. 看完這篇文請不要起爭議,候補生們都很努力才走到這一步,雖然 48G 的風格好像就是要起一下爭議(?)
--
推 breadf: 身是菩提樹,心如明鏡台,GGininder,勿使惹塵埃。 11/29 22:30
→ breadf: 菩提本無樹,明鏡亦非台,GGininder,何處惹塵埃? 11/29 22:30
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 129.217.132.49
※ 文章網址: https://www.ptt.cc/bbs/AKB48/M.1512497630.A.D57.html
推 tentenlee: 你知道官方有為了這個每次開啟都隨機排序嗎? 12/06 02:27
→ tentenlee: 我是覺得你想太多 不然就是你都在用我那個網站吧 12/06 02:27
→ tentenlee: 因為我覺得隨機順序很阿砸 所以我懶得做 12/06 02:28
推 jazz19972: 是不是做研究做到走火入魔了XD 12/06 02:28
→ borriss: 100多本來就超過一般人防守範圍 12/06 02:37
→ borriss: 就算是飯好幾年的也很難看完 (? 更不用說持續力 12/06 02:38
→ borriss: 雖然不知道要選幾個... 可能的話不要掉出主集團就好(X 12/06 02:40
推 gainx: 我想起當年研究在畫分布圖的時候也跑來畫分布圖 XDDD 12/06 02:47
我都是網址直連然後改尾巴的數字啦,但是我自己就是有一次從1號開始看,一路看到100出頭就累了
回想了一下自己的票也是幾乎都集中在前面
不過也是這樣發現了 26 號,我有持續在投的裡面唯一一個不是朋友推荐或朋友的朋友推荐的(?)
另外我平常雖然不是在做統計的題目,但是偶爾會用到一些統計的手法沒錯啦……
※ 編輯: qitar888 (129.217.132.49), 12/06/2017 03:02:25
推 fragileness: "網址直連然後改尾巴的數字"這就不像一般人會做的啦 12/06 03:06
推 xx52002: 現在有投的全都不是因為課題投的 ._.); 12/06 03:10
推 jazz19972: 如果要看一個改一個數字 我還真看不完100多人XDD 12/06 03:10
→ qitar888: 我那次就是先點進去1號,然後一直按往右的小箭頭 12/06 03:15
→ qitar888: 看到心很累 12/06 03:16
→ borriss: 一人一分鐘也要兩小時啊… 12/06 03:25
推 xx52002: 沒有天天大的網站我也看不了一百多人.. 12/06 03:32
推 tentenlee: 你們太有心了... 當初我看6個就受不了 然後就生出來了 12/06 03:33
推 ojkou: 我也是從頭點看不完,有些人到現在還沒點到過 12/06 06:22
推 cku100: 前兩次投票都是從一號開始點點點的 後面有清單就直接投了 12/06 06:40
→ cku100: 所以現在加推的都是版友推薦再點進去看的~ 12/06 06:40
推 SMUGEN: 我現在會投的都是各自有episode和原因的 @@ 12/06 07:15
推 rofea: 我承認,除了台研必投外,其他一開始都是看顏...(逃 12/06 08:36
推 orangetv: 一開始都亂投,現在票不夠了都投看直播吸引我的+1 12/06 08:37
推 rainfull: 第三、四週的影片要每個看真的很困難 所以後來都跳過.. 12/06 08:54
→ KunioFAN: 課題影片我是全部下載後用1.5倍速看過...@@a 12/06 08:56
推 joshua5201: 我也是照數字每個看 12/06 09:21
推 MukaichiMion: 會仔細看都是靠推坑或是剛好看到直播 12/06 10:38
→ MukaichiMion: 內文我只主動看過台灣蘿莉最後希望<- 12/06 10:39
推 bonnienini: 號碼很後面又不能直播的140需要大家支持一下(?????ˍ 12/06 16:22
→ bonnienini: ?????) 12/06 16:22