【个人私隐】你的数据不是你的 个人私隐保障成疑

撰文: 陈嘉慧
出版:更新:

美国大热的网上惊栗剧《黑镜》中,有这样一个故事:在不久的未来,有技术可保存人的全部记忆,剧中主角因偏执猜疑,沉迷观看记忆录像,终致妻离子散。剧中探讨个体如何自作自受,但未有拷问的是,究竟谁拥有这项技术?谁持有其产生的海量数据?科技公司会如何处理个人私隐?这些公司又应该负起哪些责任?你的数据不是你的,是我们正面对的问题。当人人24小时手机不离身,不论是发布社交媒体动态,还是上网查地图或天气,你的每一个行动都会被智能手机记录下来,传送至云端并串联成无数个数据集,甚至在不同公司的手中流转。究竟用家会如何受到影响?不妨从手机应用程式的私隐权限说起。《你的数据不是你的 个人私隐保障成疑》系列二之一

私隐权限,即用家赋予手机应用程式获取数据的权限,包括个人短讯及电邮内容、联络人资料、行事历、相片、文档内容等私人讯息,也可以是地理位置定位、电话状态等行为及系统数据。常用App平均取用23项权限记者统计51款港人常用的Android手机应用程式,涵盖社交媒体、通讯、电子支付等种类,发现这些程式平均索取23项权限,当中以Facebook、Facebook Messenger、微信及支付宝香港使用的权限总数最多,均达到40项或以上。这四款程式均要求读取用户短讯内容的权限,微信更要求存取人体探测仪,如测心率仪的权限。华尔基利信息安全研究组织研究员赖灼东指出,一般情况下,应用程式只应要求用家授权关乎程式核心功能的权限,如地图要求存取用家的地理位置、通讯工具存取联络人资料,否则可视为过度收集数据,例如支付工具索取位置数据,天气预报工具索取联络人资料等

为进一步分析,记者将涉及私隐数据的24个重要权限分为三类,以更具体统计各App使用权限的情况:

1. 敏感私隐权限:涉及个人私隐资料的权限,如短讯及电邮内容、联络人资料、行事历、相片、文档内容等。2. 行为及系统数据权限:涉及使用者行为纪录以及系统数据的权限,一旦被恶意取用,容易造成敏感个人资料泄漏,如地理位置定位、测心率仪、读取电话状态及手机硬件识别号等权限。3. 涉及系统风险的权限:可用于网络及电话诈骗、入侵系统的权限,例如直接拨打电话号码、编辑你的文字讯息、在不发出通知的情况下下载档案等。

按照这个分类统计,使用最多敏感私隐权限的应用为Facebook、Facebook Messenger及Uber。有趣的是,使用最多行为及系统数据权限的前三名全是内地公司开发的应用,分别是微信、支付宝香港及Trip.com。而涉及系统风险的权限,则主要是社交类应用取用得较多,当中包括Facebook、Facebook Messenger、Kakao Talk及支付宝香港(见表)。

统计截至4月底。

资讯科技私隐投诉急增一倍

随着流动网络及智能手机发展,手机应用程式对个人私隐的侵扰愈加频繁。个人资料私隐专员黄继儿今年3月在立法会发表2018年工作报告,提到个人资料私隐专员公署(下称公署)去年接获501宗有关资讯科技的投诉,较2017年的237宗急增逾一倍。2014年,公署对手机程式作抽样调查,发现由本港公司研发的60个程式中,有51个过度取用权限,占整体85%。去年消委会调查亦发现,本港的士预约应用程式存取权限过大,收集过多资料。现时两大手机程式平台App Store及Google Play均要求应用程式允许用家按需要调整私隐权限,但“捆绑式”授权情况依然普遍,有程式要求用家必须授权某一权限,否则不能使用,更有程式在用家不知情下收集敏感个人资料。美国科技媒体TechCrunch早前发现,包括酒店手机程式Expedia及Hotels.com在内的iOS程式装有应用数据分析机构Glassbox的录屏技术,此技术本用作分析用户浏览行为,惟当时被揭录屏内容涉及密码、信用卡号码等敏感资料,且影片未有加密,易被盗用,其后苹果公司要求相关应用移除相关程式码。全球每时每刻都在产生天量数据。研究机构IDC估计,2018年全球产生多达33ZB数据,相当于33万亿GB。即使按每名用家计算,亦涉及大量数据。英国《卫报》记者曾分别从Google及Facebook下载自己的个人数据,文件大小分别达到5.5GB及600MB,相当于300万个及40万个文字档案。

赖灼东指,程式只应要求存取关乎应用程式的核心功能的权限,否则可视为数 据过度收集。﹙洪业铭摄﹚

科企收集大量个人数据

企业为从数据中发掘商机获取更多利润,正更频繁地互相传送及共享数据,甚至交给第三方。透过数据组合(Data Harmonization)等手段,将原本由不同公司持有的数据放在一个平台上汇集及组合,用家在不同地方留下的电子印记便会被汇集成一部完整的合辑。原本A公司持有A数据,B公司持有B数据,会变为A、B公司共同持有A、B数据。

互联网公司为了更有效组合数据,会为用家设置特定识别编号作追踪之用。不同来源的数据可以通过这些编号,组合成更全面的数据。例如Google Play设有广告识辨码(Advertising Identifier)工具,程式能够基于一组由32个数字及字母组成的号码组来辨别用家,向用家发送特定广告。苹果公司的App Store平台也有专门的广告发送辨别组(Identifier Segment),每组至少5,000人;而每组人都有类似特征,广告商会根据各组特征投放适合的广告。

一些应用程式开发商会将部分核心功能包装成软件开发套件(SDK),供其他程式开发员使用。SDK是一段代码,也可理解为工具包。例如某程式要用Google地图功能,就要在程式码中置入Google Map SDK代码,而使用SDK通常也意味着更直接的数据传送。以程式经常采用的、供开发者赚取广告收益的Google AdMob SDK为例,透过SDK发送广告的同时,亦会同时收集用家的行为数据。

现代人机不离身,其行动会被智能手机记录下来,传送至云端并串联成无数数 据集,甚至在不同公司手中流转。﹙梁碧玲摄/资料图片﹚

“你在一家网上书店选了书,这些资讯会即时传送到另一个拍卖网站,后者会向你推介一个书架。”赖灼东说,商家追踪用家行为,发送定制化的广告,甚至将数据转交第三者。第三方数据公司(Data Broker)擅长将资料汇编(Profiling),通过人工智能及机器学习将人群特征描绘出来。例如某人若有A特征,通常就会有B行为,此类信息可用作预测个人行为、喜好及抉择等,包括决定信用评级或保险费用。除网上数据,有公司甚至会循不同渠道购买线下个人资料数据,再作整合。去年欧盟实施的《通用数据保障条例》(GDPR)就对数据汇编作出规范,包括要求数据处理者须先征求数据当事人同意,设法保障后者权利等。

反观本港,现时仍只靠没有法律约束力的指引供社会参考。私隐专员公署去年推出《开发流动应用程式最佳行事方式》指引,建议应用程式开发商应告知用家,将有哪些个人资料用于汇编档案,并容许用家拒绝相关安排;若所收集资料仅用作分析某类型用家,则要向用家保证相关分析将不会以个别用家为对象等。公署回复本报指,经汇编的资料若足以辨识一名在世人士的身份,并可供他人查阅及处理,便属《个人资料(私隐)条例》(下称《条例》)下的“个人资料”,应用程式开发商及营运商在处理个人资料时须遵从《条例》的规定。

因此有人说,互联网公司或许比你更了解你自己,但个中风险大多数由用家承担。赖灼东指,用家的数据会被公司用作买卖,数据库亦有可能因保安不足而被黑客盗取。他续指,随着用家不同资料被组合,互联网公司掌握的资料可扩展至你的家庭和朋友圈,令相关数据会更加形象化,构成更大风险。以联络人资料为例,数据一旦被盗取,人际关系资料将被泄漏,不法份子会基于这些资料进行诈骗。赖灼东提醒:“愈便宜的东西,有时反而愈昂贵。大家不要失忆,八达通奖赏当时看起来也很着数(注:八达通曾出售客户数据予第三方)。”

上文节录自第164期《香港01》周报(2019年5月27日)《数据保护法规滞后 个人私隐保障成疑》。

相关文章:【个人私隐】个人资料难定义 港规管仍停留在前互联网时代

更多周报文章︰【01周报专页】《香港01》周报,各大书报摊、OK便利店及Vango便利店有售。你亦可按此订阅周报,阅读更多深度报道。