【大数据】贵州数据铁笼管人管事 大数据非收集私隐?

撰文: 林可欣
出版:更新:

目前金融行业是数据交易的重中之重,通过对个体生活、工作或学习等加强相关领域,应用数据了解一个人的诚信程度。而需要了解的方面事无巨细,王京形容,这其中的细致可以聚焦到一个人在学校的各科成绩、有无考试作弊的记录、有无违纪抑或正面的记录;如果一个人是驾驶员,其驾驶习惯、有无酒驾或闯红灯的记录、一年的违章次数;在生活中,缴交水、电、煤气费用的习惯,会否拖延缴纳。此乃《贵州大数据》专题报道之二

承接上文:【大数据.一】用大数据重新定义人 当经济穷省贵州遇上高科技

从一个人的手机号都能看出端倪,“手机号码是非常能说明问题的,如果一个人经常换电话号码,说明这个人可能有诚信问题。”贵阳大数据交易所(下称“交易所”)商务总监王京想了想,决定换一个词来形容,“精确地来说,应该是‘不稳定’”。银行对手机使用习惯会分为四个维度,其一,是否为实名注册;其二,使用了多少年;其三,手机通话费的区间段;最后,则是手机大部分使用地。贵阳大数据交易所服务金融业时,会尽可能打通和生活相关的数据。“这些点点滴滴构成银行对用户的画像,就是这么细致。”王京说。

王京说大数据能精准扶贫。(梁鹏威摄)

尽管GDP伴随着大数据产业发展有了实质提升,扶贫依旧是贵州的关键词。2013年,中国提出“精准扶贫”的战略,旨在2020年实现全国的贫困人口脱贫。通过不同政府部门数据的交叉验证,便可以判断个体是否真正属于贫困人口,“是否贫困就一目了然。”王京解释道。“你可能会想坐飞机和扶贫有什么关系。一个人在农村登记为贫困人口,不断在享受社会带来的福利,同时天天坐飞机在外面玩,这里面是有严重的问题,甚至有腐败的问题。”他笑言,“大数据精准扶贫,可能动了很多人的‘蛋糕’。”

大数据不仅可以刻划个体,对于企业亦然。若要判断一间公司是否为空壳公司,可以通过调查企业的注册地和实际办公的地点,再借助其缴纳水、电费用的情况,就能判断公司是否只是一具空壳。

贵阳大数据交易所服务金融业时,会尽可能打通和生活相关的数据。(梁鹏威摄)

实现以大数据重新定义人、为人“画像”,首先需要大量且多元的数据。在采集和应用数据时,更容易涉及私隐问题。在立法保障数据安全亟待解决之前,数据使用的界线究竟在哪里?王京认为,大数据做的事和个人私隐之间有所区别,“我了解的是特征值啊,不是私隐。”他笃定说道,“大数据本身就是特征,大数据就是去研究这个事物的本质,去研究DNA,而不是研究长得漂不漂亮。”

各据资源挖宝 数据壁垒难攻

然而,对于用数据为用户画像能够多准确,存在另一种质疑的声音。力创科技总经理兰海翔对记者表示,大数据发展存在数据壁垒的问题,现在政府提出要把政务数据公开,但是能公开的范围也有限。数据壁垒致使画像只能描绘轮廓,例如用手机的通话联络对象来判断这个人,“我平常跟他们开玩笑说,如果你这个人经常电话联系的都是政府官员,那估计要么你的政府人脉很深,要么你本身就是政府官员。如果你打的电话都是商人、高端人群的话,那你这个人本身也就不低级。如果你出入的都是一些低端场所或者都跟低端的人打交道的话,那估计你离低端的人也就不远。”

贵阳大数据交易所服务行业广泛。(梁鹏威摄)

但是判断一个人是否“高端”,可能要纳入银行存款的考量。“银行不可能把你的存款数据交给我,我也不可能把你的私隐数据交给银行。”兰海翔解释。

真正要打通数据交易,似乎不那么容易。兰海翔指出,大家都认为数据是个宝,但这个宝的价值还没发挥出来。“谁抢占资源,谁就是未来的赢家。我把资源留在手里,我不愁,我知道底下有金子,哪怕我没有办法挖出来,也不让你挖,等到有能力挖时,我再去挖,大家都抱这种心态,那就没法实现互通。”对于企业,几乎不可能提供绝对准确的信息。至于具有公信力的数据交易平台,兰海翔认为,“理想是丰满的,现实是骨感的。也许作为交易所的成员或联盟单位,我可能贡献一部分数据来进行这个平台的交易。”通过不同数据方的叠加,来得到相对接近真实的结果。

建设“数字贵州”是贵州发展大数据的目标,上至城市治理,下至民生事务。(梁鹏威摄)

“数字贵州”构筑“数据铁笼”

建设“数字贵州”是贵州发展大数据的目标,上至城市治理,下至民生事务,贵州省政府试图创造一个用大数据作为燃料的社会。贵阳公安交通管理局利用大数据和云计算,建立了“数据铁笼”。这个系统将通过对大数据的综合分析,实现对权力的监督。在贵阳大数据综合实验区展示中心,有两句话显示了数据治理的野心,“在大数据的视野中,我们怎么来描述一个人;在大数据的技术中,我们怎么来管住一个人”。

一位民警的一天将会如此被记录:每天都需要记录考勤,书写工作日志,每次的执法行为都需要视频资料。若没有写工作日志、离开工作区太久,指挥平台便会发送提醒预警,若没有修正问题,预警将先后抵达上级主管和监督部门。“管住人”便是要掌握执法人员的每个行为,通过数据监管及预警。

贵阳公安交通管理局利用大数据和云计算,建立了“数据铁笼”,将通过对大数据的综合分析,实现对权力的监督。(梁鹏威摄)

管人管事管权 不再无迹可寻

“通过大数据的方式,管住了人、管住了事、也管住了权。”数据铁笼项目如此宣传。这个项目也成为贵阳政府展示治理能力的标志,官方媒体也大力赞扬,形容数据铁笼“破解了权力运行无迹可寻的特点”。

贵阳在大数据应用的实验,逐渐为全国闻名。第一次来到贵阳大数据综合实验区展示中心时,展示厅的参观人数寥寥无几,但预约的场次就有八场,来自全国各地的机构考察团会专程来此参观。这一天,有中央电视台及外省卫视考察团、澳门工商界骨干考察团,以及山东省淄博市食品药品监督管理局等。

大数据的应用不只在监督权力方面,展示中心显示的“云上贵州”系统平台,是中国首个实现政府和企业数据资源共享交换的平台,这项使用阿里云技术的系统,绝大多数使用者是政府部门。具有国企性质的云上贵州公司,因为2017年与苹果中国区iCloud服务合作而声名大噪。前文提及的精准扶贫,在展示中心有更详细的解释,识别可对焦当地的贫困人数。贵州的应用层面,在扶贫精准识别方面,识别率高达98%以上。

贵阳大数据交易展示中心的实时监控画面。(梁鹏威摄)

城市治理亦是大数据应用的重地。人工智能开放平台首席技术官张立铭表示,“坦白说,这三年贵阳已经积累了非常厚实的大数据基础,依靠这个基础,贵阳接下来想怎样应用大数据?”厚实的数据基础多是来自政务数据。2017年贵阳市政府与英特尔合作建立人工智能开放平台,该平台目标是成立“政产学研”的生态平台。张立铭透露,平台创立初期,贵阳市政府提供了十类政府数据,平台再将数据提供给初创公司,以此建构AI初创应用。这十类政府数据,涵盖医疗、景区人流统计,以及居民的水、电、燃气应用等。

掌握数据是步入人工智能时代的敲门砖。张立铭认为,科技巨头往往拥有自己的数据资源,在自己的平台做应用训练,贵阳创造了新模式,“没有一个这样公开的模式,由市级或省级提供这样的数据让初创公司解决问题。”

张立铭认为,贵阳市政府能创立开放平台,并将政务数据与AI结合,在中国是创新的模式。(梁鹏威摄)

由政府提供的数据训练出来的技术,亦能反哺改善城市治理效率。有初创公司拿到十字路口的视频录像,利用真实的场景训练模型,例如通过十字路口出事的概率、堵塞的时间段来调整红绿灯。张立铭透露,“很多初创公司在做这样的创新,这结果能够直接反馈到政府机关。”他指出,“对政府来讲,能够得到AI的助力,对他们整个政务的管理很有帮助。我们讲的红绿灯管理是最基本,包括很多社会治理方面,实际上都可以用AI算法解决。”张立铭认为,贵阳市政府能创立开放平台,并将政务数据与AI结合,在中国是创新的模式。

“贵阳从当初做大数据产业开始,就是国家层面的,最终达成所谓更高效的政府治理,还有社会治理,对于贵州来说,算是它的使命吧。”而这种以政府或国家力量推动的模式,是一种非典范的形式。张立铭来自台湾,他认为两地发展路径有所不同,“台湾政府推动这件事情的话会有一些其他杂音,例如私隐法,一般来说台湾的AI创新还是比较片断式,以行业内的创新为主。”相较之下,贵阳市的行动力很强,“说干就干”。

有初创公司拿到十字路口的视频录像,利用真实的场景训练模型,例如通过十字路口出事的概率、堵塞的时间段来调整红绿灯。(梁鹏威摄)

延伸阅读:【大数据.三】数字化时代争议四起 社会恶果有待分解

上文节录自第139期《香港01》周报(2018年11月26日)《用网络重新定义人  大数据如何打救贵州​》。

重温贵州大数据系列文章:【大数据.一】用大数据重新定义人 当经济穷省贵州遇上高科技【大数据.二】数据铁笼管人管事 大数据非收集私隐?【大数据.三】数字化时代争议四起 社会恶果有待分解

浏览更多周报文章︰【01周报专页】《香港01》周报各大书报摊及便利店有售。你亦可按此订阅周报,阅读更多深度报道。