从淘宝CPI到百度GDP 国家统计局拥抱大数据

16.06.2014  11:38

  中国兰州网6月16日消息 国家统计局发布5月份社会消费品零售总额数据,而1~5月份限额以上单位网上零售额1435亿元,增长53.2%。

  6月13日,国家统计局发布5月份社会消费品零售总额数据,而1~5月份限额以上单位网上零售额1435亿元,增长53.2%,这是国家统计局第三次发布网上限额以上单位网上零售额。该数据的发布基于对电商企业大数据的搜集整理。

  大数据,在国家统计局内部是个“热词”,因为国家统计局局长马建堂是大数据的一位“超级粉丝”。

  在2012年末的全国统计工作会议上,马建堂用近10分钟的时间专谈“大数据”和“云计算”,这在国家统计局以往的年度会议上从未出现过。

  马建堂曾说,一个大规模生产、分享和利用大数据的时代正在来临,“这一滚滚浪潮浩浩荡荡、不可阻挡”,谁掌握了大数据,谁就能更好抓住宏观调控的主动权,中国统计系统要做拥抱大数据的弄潮儿。

  在这位“超级粉丝”的倡导下,宏观经济数据正从自产自析的1.0时代走向借助全社会大数据的2.0时代。

  5月20日,马建堂到百度公司调研大数据生产及应用情况。此前,马建堂的身影出现在京东商城、阿里巴巴、中国银联、1号店、CBI易贸集团等企业,直奔大数据而去。

  在向社会“找数”的进程中,淘宝网是统计部门最先瞩目的大数据来源。因为淘宝网上的交易数据既是实时成交数,又真实有效,这正是统计部门以往驱动庞大的调查队伍所希望寻找的绝佳数据。

  2012年,国家统计局上海调查总队就开始了网络采价试点。上海调查总队发现,淘宝网上有大量销量较大但不在CPI统计的产品,比如进口糖果、进口巧克力、进口饼干、进口奶粉、进口美容用品和鲜花快递等,通过一定的方式这些产品都可以被整合进CPI。另外,原有CPI规格品中有的数据比统计部门抽样调查得到的数据更为及时,比如书籍销售价格就可以从亚马逊、当当网、京东网上选取。上海的试点发现,2012年含网络采价的CPI和不含网络采价的CPI衔接性非常好。

  阿里巴巴利用大类数据制作了自己的淘宝CPI,其后又推出了ISPI指数。后期的研究发现,这一价格指数的产品分类与国家统计局的CPI价格体系相接轨。虽然其波动比CPI更大,但数据的长期表现也同国家统计局CPI表现基本吻合。这意味着,市场观察宏观价格的变化不必再等到下月月初,而是可以将观察期细化到每日、每时、每刻。

  相关统计学者对《第一财经日报》记者表示,未来统计部门可以直接使用ISPI数据反映网购商品价格的变化,或者将国家统计局的CPI同阿里巴巴所发布的ISPI加权平均来计算得到能涵盖线下和线上的综合CPI指数供决策者参考。

  前述学者对本报记者说,统计部门完全可以在详细论证后利用谷歌和百度的搜索数据来预测中国GDP,这有助于帮助政府部门更快掌握经济环境的变化。

  还有一块能被利用的“大数据”是行政记录。无论是工业生产、用电、运输、财政税收、工商登记等行政记录都暗藏了经济增长的轨迹。比如,工商登记的高峰期往往是经济周期启动的前兆。

  不过,面对大数据应用的美好前景,对于数据隐私的保护也需要同步关注。

  在马建堂看来,大数据已成为重要的国家战略资源,正在深刻地影响着时代发展的进程。积极开发利用这一战略资源,需要实现大数据的高度开放。政府机构要尽快确立数据开放基本原则,带头开放公共领域的行政记录等公共数据,鼓励推动企业等民间机构开放其在生产经营、网络交易等过程中形成的海量电子化数据。