“大数据”如何接地气

01.09.2015  11:10

核心提示

■ 数据就是生产力,数据创业将会全面爆发

■ 由于没有共享和挖掘,大量部门数据一直在“沉睡

■ 政府应通过体制机制改革打破数据割据与封锁

■ 大数据应用应建立在保护个人隐私权利基础之上

8月19日,国务院常务会议通过《关于促进大数据发展的行动纲要》,提出要通过促进大数据发展,提升创业创新活力和社会治理水平。在上述国务院常务会议中,大数据被定义为“基础性战略资源”。促进大数据发展,有利于推动大众创业、万众创新,改造升级传统产业,培育经济发展新引擎和国际竞争新优势。《纲要》强调,使开放的大数据成为促进创业创新的新动力。让各类主体公平分享大数据带来的技术、制度和创新红利。

1.产业 开放:数据创业全面爆发

案例:

在日前举行的“云上贵州”大数据商业模式大赛总决赛上,涌现了很多实用的大数据应用。其中,获得一等奖的“东方祥云”项目设想为全国15万座水电站、水库提供免费来水预报,帮助合理调度用水,据估算可为这些单位信息化改革节省90%的成本。

纲要》提出,使开放的大数据成为促进创业创新的新动力。对此,阿里云总裁胡晓明表示,这将极大地推动数据经济的发展。他认为,在数据处理技术时代,数据就是生产力。“数据创业会在明年全面爆发,会有更多的人参与到为政府、企业提供数据服务、数据能力、数据交易、数据撮合中来。

百度、阿里淘宝和支付宝、腾讯QQ和微信、银行业、移动运营商、公交卡、各种手机App……在各行各业,许多有价值的大数据潜力正待挖掘。今年5月,成立仅一个月的贵阳大数据交易所推出的《2015年中国大数据产业白皮书》显示,预计到2020年,中国大数据产业市场规模将超过这个市场去年规模的10倍,由2014年的767亿元扩大至8228.81亿元。

中国的大数据时代才刚刚开始,各路群雄创新商业模式、抢占战略高地。传统产业中藏有海量的宝贵数据,只是没有利用起来。”清华大学数据科学研究院执行副院长韩亦舜说。

大数据的“新玩法”可谓超乎想象,但大数据的利用价值远不止如此。以中国公路物流行业为例,其市场价值已达亿万元级,而90%以上运力为个体车主,空驶率达30%以上,大数据应用可以充分利用物流资源。

中国工程院院士、中国互联网协会理事长邬贺铨表示,硬件、软件和服务三者之和,也仅仅是狭义的大数据产业,广义的大数据产业的范围和规模都更大。通过大数据挖掘的服务,大数据可以利用在各行各业,提高生产效率,支撑节能降耗,促进经济发展,因此广义的大数据产业的产值,更多地体现在工业、农业、交通运输、建筑等产业中。事实上,大数据分析在社会福利和民生服务上的效益很显著,并不是简单地用GDP可以衡量的。这是我国实现跨越式发展的宝贵机会。

大数据加速了信息技术向传统产业渗透,成为新产业革命的重要引擎。”邬贺铨表示。

2.政府 共享:消除信息孤岛

案例:

8月17日,河北省承德市政府与神州数码签署市民融合服务平台及企业融合服务平台战略合作协议。至此,神州数码与近40个城市签署智慧城市战略合作协议,形成了一系列卓有成效的解决方案,成为中国市场领先的“智慧城市专家”。

事实上,在我国,各级政府的交通、医疗、就业、市政、民政等各个部门都拥有大量的统计数据,但由于没有共享机制和价值挖掘,这些数据一直在“沉睡”。“已有的数据首先要使用起来,发现闲置的价值;那些原本没有,但事实证明对自己有用的数据要赶紧采集、挖掘新价值。”韩亦舜说。

此次《纲要》提出,要推动政府信息系统和公共数据互联共享,消除信息孤岛,加快整合各类政府信息平台,避免重复建设和数据“打架”,增强政府公信力,促进社会信用体系建设。优先推动交通、医疗、就业、社保等民生领域政府数据向社会开放,在城市建设、社会救助、质量安全、社区服务等方面开展大数据应用示范,提高社会治理水平。

神州数码董事局主席郭为指出,此次通过的《纲要》强调消除信息孤岛,实际上就是要求将分散在各个部门的政府服务及公共服务进行统一,这些服务和大数据将来都有助于大数据领域企业的发展。郭为分析说,此举还会对大众创业、万众创新带来明显的推动力。在政府数据开放的要求和规则下,大数据领域的企业可以通过城市公共信息服务平台汇集城市的各类基础性数据,通过平台实现数据共享。以此为基础,广大年轻人和创业者就可以利用政府开放数据和其他相关开放数据,开发出成千上万为百姓民生服务的丰富多彩的应用产品,进一步营造大众创业、万众创新的氛围。

数据既具有一般资产的价值,又具备一般资产不具备的属性。”韩亦舜说,“一般资产你有了,我就没有;把我的给了你,我就没有了。但数据不一样,把我的数据给了你,我的数据还在,这就决定了大数据时代需要人们的心胸更开阔。大数据时代,1+1产生的价值将会被无限放大,远远大于2,数据的叠加会发生化学反应。

美国将大数据分析作为国家战略来推动,政府带头进行数据开放。美国联邦政府建立统一数据开放门户网站,为社会提供信息服务并鼓励挖掘与利用。中国很多部门拥有的数据互不沟通,很难共享,导致信息不完整或重复收集等。因此,中国需要有国家层面的大数据战略、开放数据的措施及法规等。”邬贺铨说,政府应通过体制机制改革打破数据割据与封锁,应注重公开信息,重视数据挖掘。

3.法制 安全:要防止数据被滥用

案例:

2012年2月16日,《纽约时报》刊登了一篇题为《这些公司是如何知道您的秘密的》的报道。文中介绍了这样一个故事:一天,一位男性顾客怒气冲冲地来到一家折扣连锁店向经理投诉,因为该店竟然给他还在读高中的女儿邮寄婴儿服装和孕妇服装的优惠券。但随后,这位父亲与女儿进一步沟通发现,自己女儿真的已经怀孕了。

这一故事,经常被作为大数据挖掘能力的典型例证。但在专业人士看来,这一案例体现出的并不是大数据的“聪慧”,而是大数据的“傲慢”,个人隐私并没有得到足够尊重。

我今天上淘宝网购物,淘宝有我个人数据,我的行为数据是属于淘宝还是属于我?目前国际法律认为这个数据属于消费者。淘宝可以用,可用于提升用户体验,但如果淘宝把该数据卖给第三方就不行。”百分点董事长苏萌说,但如果淘宝卖出的不是原始数据而是其分析结果,这种第三方分享的形式在美国目前大部分市场上是认可的,如IBM等企业也在利用这些数据为第三方提供服务。

但有业内人士认为,大数据在涉及交换、分析、挖掘时,个人信息是无法直接过滤的。这些个人隐私数据散落在中介、银行、保险、航空公司等机构间,危险性可能不大。但如果被共享之后,又被系统整合、相互印证的话,消费者的个人基本信息,甚至性格、爱好以及生活轨迹等信息将被他人一览无余,很多普通人将变成“透明人”。

韩亦舜认为,目前,隐私问题存在着利己主义的悖论。“举例来讲,上海跨年夜发生的踩踏事件,技术上可以看到人流的变化趋势,是完全可以预警、预防的,悲剧的发生直接关系着数据伦理问题。数据安全或者保护数据就一定对吗?这里也有一个伦理问题。

在美国,一些公司把‘底层’的详细个体数据去除掉,这样能规避掉一些隐私和安全问题。”清华大学苏州研究院大数据中心副主任赵勇表示,从大数据监管来说,“最适合的是政府”。上海已成立大数据局,这是对数据管理的专业政府机构。最核心的管理是从法制上界定“数据拥有者是谁”“使用者是谁”“使用权限如何定义”“谁是受益者”等。(来源:甘肃日报)