http://hkupop.hku.hk/chinese/columns/columns48.html
點算人數方法系列
遊行集會的靜態點算方法
陳素娟(香港大學統計及精算系講師)
李亮坤(香港理工大學應用數學系助理教授)
註:本文只代表作者個人意見,與所屬大學立場無關。
繼「四一一」遊行之後,「七一」遊行人數的統計再次引起爭論。作為專事研究統計的學
者,我們就時下的討論提供一點意見。我們今天首先討論靜態點算方法,明天再討論動態
點算方法,及我們對今年七一遊行人數的估計。
首先聲明,我們無意介入任何政治層面的爭拗。事實上,遊行集會人數的多寡,與市民訴
求的強弱和質素並無必然關係。在一個民主開放的社會,政治層面的的數字比拼,往往體
現於選舉及相關的公決制度,或充其量擴展至民意調查的結果。以參與遊行集會的人數作
為意見強弱的基準,似乎只會出現在相對封閉的社會,希望香港不會朝著這個方向發展。
從另一個角度看,當社會開始引用群眾數字作為決策依歸的時候,無可避免地各方人士總
會對數字本身以至數字背後的社會現象,根據各自的理念作不同的詮釋,甚或扭曲。
歷年來,在大型遊行集會之後,主辦機構公佈的數字,往往與官方機構的統計相距很遠。
我們認為,如果科學精神要在我們的社會植根、開花結果,則我們一定要有求真問究的勇
氣,破解這個迷思。身為研究統計的專業人士,我們覺得責無旁貸。
經過初步研究,我們有理由相信主辦機構和官方數字的出入,是源於不同的量化定義和統
計方式。例如:集會人數是否包括短暫駐足的人士?遊行人士是否包括只在起點結集而沒
有隨隊出發的人士?如果主辦機構以派發場刊的數目去估計集會的人數,而警方就只以某
時段的人流面積去估計當時的人數,則兩者所得的數字,自然會很大的差距。雙方都是基
於實際需要和運作去估計人數,但可能與事實真相出現距離。
為了探究有關問題,我們一群來自不同院校的朋友,包括來自中文大學的蘇鑰機和郭婉鳳
、香港大學的鍾庭耀、和我們兩個筆者,在5月籌備點算今年六四燭光晚會的人數。在總
結六四的經驗後,在6月下旬,我們又決定點算今年七一遊行的人數。我們的目的只在求
真。
各樣方法的歸類
首先,有關遊行集會人數的統計方法,我們按其應用特性分為兩大類。第一類方法是先以
某些方法如高空拍攝,估計遊行集會人士佔據路面的密度,再乘以場地或路面面積,以推
算在某一個時刻佔滿場地的總人數。這類方法常用於靜態活動的點算上;若要應用在動態
活動如遊行上,則再以該佔滿遊行路線的人數推算,乘以一個在遊行期間可行畢的程數,
推算整體遊行人數。
另一類方法是定點點算,即直接在某個站位點算經過的遊行人士,基於人力的限制,通常
只作系統抽樣,點算在抽樣時段內經過的遊行人士。由於此方法無法點算中途加入或離開
的遊行人士,故部份研究會再進行一個抽樣調查,以評估經過點算站的遊行人士佔整體遊
行人士的百份比。舉例說,若調查顯示在一百名參與遊行的受訪者中,有八十位經過某一
點算站,則在該點算站只可點算到八成的遊行人士;因此,要推算遊行的整體人數,便需
要把經過該點算站的人數,乘以1.25 (即100除以80的商) 作為調整基數。
六四燭光晚會的點算
我們嘗試用不同的方法來計算參加今年六四燭光晚會的人數,包括先錄影後點算、全部點
算及抽樣點算,這些方法均屬於第一類的靜態推算法。但錄影方法因影像欠佳,效果不理
想,令點算很困難。而全部點算法的結果亦不可靠,不同組別間的數字相差很大,所以也
只好棄用。於是抽樣點算成為主要的方法,它是以密度乘以面積作為計算基礎的。
計算密度是以一個三米乘三米的空間為標準。我們在維園六個足球場內,有系統地在晚會
的高峰期抽樣量度此空間所盛載的人數,得出的平均數是廿五點三人,即每平方米人口密
度是二點八一人。我們在現場又做了一個實驗,發現在兩米乘兩米的面積中,可緊密地容
納十個人,即每平方米是二點五人,與上述數字接近。
我們又量度了六四燭光晚會現場六個足球場的觀眾面積,所得數字是一萬四千九百一十七
平方米。因此,以密度乘面積,所得人數是四萬一千九百人,但此僅是在足球場區內的人
數,並未包括場區外圍的人。我們又派出三個小組點算外圍人數,其中包括坐在後面的觀
眾看台及草地的參加者,但不包括警方及其他工作人員,所得的數目是約九千四百人。因
此,以密度和面積推算,不計算中途加入或離開的人,我們估計總參加人數約是五萬一千
人。
七一遊行的靜態推算
至於點算七一遊行人數方面,警方、民陣、《明報》都是以場地面積作計算基礎,並乘以
某一時間的人流密度及在遊行時間內可行畢的程數,來推算整體遊行人數。
警方根據拍攝所得的人流密度,乘以所需遊行時間速度,得出總遊行人數是大約二十萬。
警方曾向民陣表示,如果遊行路線全程都充滿了人,應有十七萬。民陣根據警方這個密度
數字,乘以他們運算出來的遊行程數,再略加調整以反映中途離隊人數,得出五十三萬之
總數。
《明報》則利用高空拍攝的照片,經電腦計算相中人數,從而計出平均一百平方米容納一
百人。該報再推算遊行路線面積為七萬二千平方米,從而計出全程的人數為七萬二千人。
遊行時間方面則以五小時半為基準,每程用了一小時半,即共有三點六七程,最後推算遊
行人數為廿六萬四千人。
這些計算方法的準確程度,視乎面積、密度和時間這三個因素。面積方面的爭議不大,密
度則是個大問題。依據警方十七萬的數字,計算出來的每平方米人口密度是二點三六人。
但用《明報》的數字作推算,每平方米人口密度只是一人。我們的研究隊在七一遊行當日
,發現每分鐘的人流量約為七百人。假設人流速度為每分鐘五十米及馬路的平均寬度為廿
米,得到每平方米的密度為零點七人。如果假設人流速度為每分鐘三十五米,得到每平方
米的密度為一人。
從上面簡單的實驗及六四燭光晚會實際情況得知,每平方米人口密度達二點五人的情況,
只會在肩踫肩的極擠迫環境如銅鑼灣才會出現。按常理推測,流動遊行人士的平均人口密
度,應低於這個數字,以每平方米一人較為合理,即與《明報》所得的數字相若。
第三是時間。如果遊行路線全程三千米,以整體遊行隊伍由頭到尾都經過某一點判斷總遊
行時間約為四小時,又如每程需一個半小時,得出應是二點七程。因此,如果用《明報》
的七萬二千人作基礎,乘以二點七,得出十九萬四千人。如果用《明報》的遊行時間五小
時半為基準,共有三點六七程,最後推算遊行人數相差不可謂不大。這些數字與我們採用
定點點算法得出來的結果有多大的差別,我們會在明天討論。
動態點算七一遊行人數
我們昨天介紹了靜態點算六四集會和七一遊行的方法,談到面積、密度和遊行時間的關係
。我們今天會集中討論動態的人數點算方法,及用這個方法推算今年七一遊行人數得出的
結果。
七一遊行的動態推算
基於人力的限制,我們採用了定點點算法統計七一的遊行人數。我們以軒尼詩道與軍器廠
街交界的行人天橋為點算站,六位義務學生分別負責點算一條行車線的人流,以每五分鐘
點算一分鐘的方式,作系統抽樣點算,然後將一分鐘內點算到的人數乘以五,作為在該五
分鐘時段內經過的遊行人數。以此計算,得到所有經過該點算站的人數約為十四萬九千人
。為了評估調整基數,研究隊遂於7月2至11日期間,以隨機抽樣電話訪問形式,成功訪問
了3,512位年滿十八歲的巿民,平均回應率是百分之六十三點八,其中二百三十一位曾參
與七月一日遊行。他們回答了下列問題:你遊行時有沒有經過軒尼詩道與軍器廠街交界的
行人天橋,從灣仔進入金鐘地段?在該些巿民中,百分之七十七點四謂曾於軒尼詩道經過
該道天橋,故調整基數為 1.29 (即100除以77.4得出的商) 。將基數乘以十四萬九千的點
算人數,並以純抽樣誤差六個百分比計,推算整體遊行人數約為十八萬至廿一萬之間。
我們採用事後進行的抽樣調查,因為調查若在遊行當日進行,受訪者無法預計他將會在何
處離開。即使調查在終點站進行,亦只可捕捉到那些在中途加入,直至到達終點才離開的
遊行人士,至於那些在中途進出的遊行人士,仍然無法包括在內。由香港大學統計及精算
系高級講師葉兆輝領導的另一支研究隊,在銅鑼灣及金鐘分別有點算站,並在金鐘太古廣
場附近天橋進行抽樣調查以計算調整基數。可惜,他們的調整基數,並未能包括在銅鑼灣
點算站與金鐘調查站之間加入並離開,以及在金鐘調查站後加入的遊行人士。他們在整體
遊行人數上加上百分之十作為調整,雖是無可厚非,但以百分之十作為調整基數具有相當
的主觀成份。
各種推算方法的局限
平情而論,筆者論及的每一個推算方法,皆有其局限。按遊行人士佔據路面密度推算總遊
行人數的方法較為粗疏,因為推算要基於多項假設,所以根據不同的假設,推算的數字間
差異很大。除了人流密度可能被錯誤評估外,受著路面情況的影響,不同時段與地點的人
流密度差異可以很大,而以程數估計遊行人數的部份,亦會受到當日的天氣,以及遊行人
士的年齡有所影響。理想的處理方法,是在不同時段與地點,收集多個數據樣本,以期對
人流密度作出較精確的評估;可是,在計算上又會變得十分複雜。
雖然如此,這類推算方法仍無法計算中途加入或離開的遊行人士。在七一當日三十五度非
常高溫下,假設扶老攜幼的遊行人士,只能行畢三分之一的路程,則整個遊行期間的程數
假設便要相應增加,因為對於這類遊行人士而言,實際的路程減少了。到底這類遊行人士
有多少呢?他們平均行多長的路程呢?這些因素均會影響推算的準確性,但極難評估,因
為要接觸這類遊行人士並不容易。
即使採用定點點算法,如何點算進進出出的遊行人士,仍然是一個很大的難題。理論上,
一個事後進行的抽樣調查,可以接觸到不同的遊行人士,但因為抽樣對象全是年滿十八歲
的市民,要累積一定數量的遊行人士樣本,要相當的時間及資源。讀者可能亦擔心受訪者
會虛報資料,如把沒有參與說成曾經參與,不過,就算如是,其偏差應該沒有方向性。但
由於調查只限於年滿十八歲的遊行人士,十八歲以下遊行人士的情況便沒法反映出來。
讀者或許已注意到,不單按人流密度的多個遊行人數推算存在著很大差異,即使在相近地
方作直接點算的遊行人數亦有很大差異。舉例說,本研究隊在軍器廠街天橋接近金鐘的點
算站共錄得十四萬九千名遊行人士經過,而葉兆輝領導的另一支研究隊在金鐘太古廣場附
近的天橋卻點算得十一萬人,兩個點算站相距不遠,但人數卻相差了四萬人。同樣地,葉
兆輝領導的研究隊在銅鑼灣電業城點算到十二萬遊行人士,而《星島日報》刊載的大埔專
上學生同盟研究隊,亦於銅鑼灣作點算,他們採用每十五分鐘拍攝一分鐘人流,然後投影
及點算人流的方法,點算到途經該點算站的遊行人數為九萬人,兩者之間亦相距了三萬人
。若非點算不準確,則中途加入或離開的遊行人數確實不少!
最後,筆者希望再次強調,在面對眾多的推算結果時,不應單看一個點算數字,要對各種
推算方法的可信性及局限例如推算的假設是否合理等作深切理解。就本文提及的各項研究
推算,只有本研究隊及由葉兆輝領導的研究隊,有報告推算誤差。其實推算誤差,可以讓
讀者評估推算的可信性,若推算誤差大,則其可信性便較低。比方說,若推算誤差為十萬
人,對於一個二十萬的推算值,其確實數值應該在十萬至三十萬之間,上下限相距甚遠。
況且,本研究隊報告的推算誤差,只反映了來自調整基數的誤差來源,對於來自系統的抽
樣誤差,即以一分鐘的遊行人數推算五分鐘內的總遊行人數的誤差,及其他非抽樣誤差,
皆沒有被反映出來。
怎樣才可以更準確有效地統計遊行人數,是一道非常有趣的研究題目。不過,筆者認為,
掌握群眾的訴求應該遠較討論遊行人數重要。此外,市民亦應公正客觀地評價各項統計結
果,不要單看數字本身,因為各種統計方法均有其局限,未可盡信!
--------------------------------------------------------------------------------
本網站內一切內容與香港大學立場無關。專欄文章內的文章及民意平台內的言論及法律責
任由作者自負,其餘內容則由民意研究計劃主任鍾庭耀博士負責。
香港大學民意研究計劃版權所有。 本網站由webmaster@hkupop.hku.hk 製作。最後更新
: 22/3/2005
--
台北‧老是‧天災
非典‧淹水‧色情
露奶‧慢跑‧俊馬
依法處理‧謝謝指教‧好膽邁造
傳真機在天涯
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 61.217.32.4
※ 編輯: medusan 來自: 61.217.32.4 (03/27 02:37)