【01周报】IT人制作互动地图 勾画选区变形记

撰文: 吕凝敏
出版:更新:

每届区议会选举网页均会显示选区分界图,让选民知道自己所属选区,然而,每届区议会选举均有重新划界的区域,选举事务处只公布更改划界的选区数目,要知道所属选区是否有重新划界,可能比想像中困难。

 

与政府周旋多月 才取得数据地图

 

“要向政府取得选区分界图的digital format并不容易,由于版权属于选举事务处,故先要向选举事务处填表申请,交了700元,还要再向地政署查询,因为digital format在他们手中”,叶俊延(Stanley)是一名网页程式编写员,两年前曾向选举事务处索取2007年及2011年两届区议会选举的全港分界图,希望将两届区选的分界图重叠作对比,哪一个选区被重新划界,市民可一目了然。“但区选网页的分界图是以PDF形式显示,我必须得到digital format,才可制作互动地图”,结果,Stanley与两个部门周旋多个月,才成功取得地图。今年,Stanley成功制作出两届区选的分界互动地图,全港划界是否有改变,每个选区谁胜谁负,甚至得票数目及政治联系亦清楚列出。

步骤一:互动地图的右上角,可拣选区选年份,剔了2011的方格后,选区分界以红色线显示。
步骤二:拣选2015方格后,可见选区变成黑色分界。
步骤三:在每个选区上按一下,会显示今届该选区的选举资料;若同时剔选两个年份,可看到改划分界后的分别。
“天后和维园上届属于东区,今届划去湾仔区,有没有计算在内?有些改了名称,如尖沙咀中变成尖沙咀东,亦有些一区的范围被鎅成三个选区,又有没有算入这109个选区内?”

在制作分界图对比网页的背后,Stanley付出大量时间搜集各项资料,例如全港参选人的政治连系、年龄、甚至计算出每个选区划界与上届的误差比率,懂得编写程式的他,认为一般市民也能做到这种制作,“我只是用了R来写程式,再以Excel形式输出,不算太复杂,只是搜集各项资料非常花时间”。记者曾在过去数届区议会选举网页翻查资料,例如每个选区的当选人得票及其政治联系,分别载于“候选人简介”及“选举结果”两个栏目内,而选区分界及预计人口,亦分别载于“选区分界图”及“区议会选区概要”两个栏目内,市民也无法一览全港431个选区的分界,在网页设计上对使用者极为不便。

 

对于选举事务处指今届有109个选区重新划界,Stanley质疑数目是否准确,“天后和维园上届属于东区,今届划去湾仔区,有没有计算在内?有些改了名称,如尖沙咀中变成尖沙咀东,亦有些一区的范围被划成三个选区,又有没有算入这109个选区内?根本没有人考证”,若以他搜集的分界数据运算出来,被改动的选区不只109个,故他认为选举事务处应界定“重新划界”的定义。

Stanley表示,向政府索取区选分界的电子版本时困难重重。 (蔡正邦摄)
“很多资料明明是公开的,为何要市民主动询问才发放出来?文件没有写的东西,政府就不会额外整理给你们”

数据图像化是全球趋势

 

为何花费大量时间,Stanley仍坚持要做?他认为,数据图像化是全球趋势,“外国传媒如New York Times经常在报道中使用量化数据,更聘请了一名教授专门制作infographic(信息图表),香港的网媒近年亦常用”。Stanley表示,受哥伦比亚大学统计学及政治学教授Andrew Gelman及美国有线电视联播网ESPN的记者Nate Silver影响,开始在工余时间量化本港区选数据,“Andrew Gelman出版过一本《Red State, Blue State, Rich State, Poor State: Why Americans Vote the Way They Do》的书,研究在美国总统选举上,穷人是否票投民主党,而富人是否一定投共和党,经他量化数据后,发现原来不是”,他又指,Nate Silver是一名数据新闻记者,专门负责体育及选举新闻,2012年的美国总统大选,因选情太接近,被评论家认为无法预计结果,但Nate Silver却凭量化数据准确预测了所有州分的选票结果,故Stanley认为量化数据对研究选举新闻非常有用。

 

Stanley认为香港也值得将选举的资料量化,然而政府各部门的网页设计欠佳,资料既不齐全,转换档案的教学亦不多,令市民在查询资料时感到不便,“很多资料明明是公开的,为何要市民主动询问才发放出来?文件没有写的东西,政府就不会额外整理给你们”,若有心人希望仅以政府提供的资料做研究,将感到非常困难,故他将已量化好的区选数据放上网,希望方便市民或传媒作不同研究,被问到会否将9月的立法会选举甚至下届区选的数据整理,他苦笑道:“有时间才做吧,况且我知道,网上越来越多人在做同样的事。”

更多精彩内容,详见逢周五出版的《香港01》周报,请即订阅。