feedback

意见

反馈

back-to-up

回到

顶部

关于开放数据:上海是中国第1,而中国是世界第71

Open Data

程一祥   2017-05-27

2017年贵阳“数博会”上最新发布的《中国地方政府数据开放平台报告》显示,近年来,虽然各地政府日益强调开放数据的重要性,但总体上,全国范围内,真正做到开放数据的仍是少数地区。而这些地区,在分布上也存在着极不均衡的状况。

2017中国城市“数据开放”指数:上海第一,贵阳第二

随着“开源”思想在互联网领域的蔓延,这几年,全球越来越多人开始呼吁政府和企业“开放数据”。对数据开放的需求,这在大数据时代表现地尤为迫切。

作为全球互联网大潮的前沿阵地之一,中国政府相关的数据开放情况也一直受到关注。

5月27日,由复旦大学数字与移动治理实验室出品,复旦大学和提升政府治理能力大数据应用技术国家工程实验室联合发布了2017年《中国地方政府数据开放平台报告》(简称《报告》)。报告评估了国内19个城市的数据开放平台,并建立了一套“开放数林”指标评估体系。在最终的榜单上,上海市夺得头把交椅,贵阳紧随其后,排第三的则是青岛,但是青岛与上海和贵阳已经有较明显的差距。

在解读这份榜单之前,我们首先要了解什么是开放政府数据?

国际上普遍认为,开放政府数据应符合8大基本原则:完整、原始、及时、可公开获取、可机器读取、非歧视获取、非专属以及免于授权许可。简单来说,就是任何人可以凭借任何目的免费地使用、修改、分享的数据

2017年,国务院办公厅印发的《政务信息系统整合共享实施方案》也指出,要向社会开放“政府部门和公共企事业单位的原始性、可机器读取、可供社会化再利用的数据集”。在对待开放数据的定义上,中国与国际社会的标准总体是一致的。

上述《报告》也基于这些大原则,按照更细化的指标要求,对入围的19个城市的开放数据平台进行了“开放数林”指数评分。接下来就让DT君具体带大家看看,中国各地市的数据开放情况究竟如何?

中国地方政府开放数据:平台较少,但数据丰富程度尚可

从整体上看,中国地方政府开放数据的建设与国家政策有着密切联系。

2012年,上海市首先推出了中国大陆地区第一个开放数据平台。但全国其他地区的开放数据平台的增长速度却一直较为缓慢。直到2015年国务院印发了《促进大数据发展行动纲要》,各地数据开放的速度才明显加快。浙江、贵州、广东等地方陆续上线了开放数据平台。

另一方面,对于已经开放的数据,各地平台对于元数据的提供还是比较友好的。(DT君注:元数据为描述性数据,主要说明数据的属性信息。有助于数据利用这更了解数据集的内容和背景,从而更好地获取和利用数据。

目前,国内大多数平台已经能提供数据描述、主题、关键字等元数据信息,虽然更新频率、访问量、数据项等信息较少,但是从属性上看,数据的丰富程度还是值得肯定的。

想用开放数据创业?你还应该注意这些“坑”

全球最大的开放数据NGO“开放知识基金”认为,政府开放数据的价值,不仅在于促进政务信息透明和市民的参政议政,还在于创造社会和经济价值。DT君也看到,不少科技创新型企业是利用政府开放数据作为商业活动的载体。在北京冬天雾霾最严重的日子,DT君也曾经想过创业,如果能把政府开放的天气数据和体育结合起来,说不定能做一个“霾都跑步指南”呢。

作为政府开放数据的使用者,DT君最担心的,是开放数据的数量、质量和可持续性。

首先是数量。《报告》显示,各地平台上开放的数据集数量尚可,但即便如此,各城市之间的差异仍然非常明显。

虽然上海是综合指数最高的城市,但是如果仅从数据集总量上看,武汉以1297的数量力压上海和贵阳,名列第一。不过另一方面,各地的差异也非常大,最少的湛江只有29个数据集,连第一名武汉的零头都不到。

其次是质量。

比起清洁度、真实性等细节的数据质量问题,DT君更关心的是政府开放数据的法律保障。

理论上,开放数据应该通过开放授权协议从法律上保障数据的开放性。协议内容应明确授予用户免费获取、不受歧视、自由利用、自由传播分享的权利。但是目前国内的19个开放平台,没有一个平台的协议全部明确授予了上述四项权利。

看来,企业在利用政府开放数据的时候,可能要考虑更多的政策性风险。

最后是可持续性。不更新的开放数据都是耍流氓。

对于大数据产业来说,迭代速度是另一个非常重要的指标。DT君如果要做那个霾都的项目,没有实时更新的数据是注定做不成的。那么中国这些地方政府的开放数据平台,表现如何呢?

上海不愧为综合排名第一的开放数据平台。其上线时间最早,持续性也最好,至今已经保持了连续9个时段的持续增长了。北京紧随其后,持续增长时段为6个。湛江的表现依旧垫底,自从2014年上线后,便不再新增数据集。如果你用湛江的开放数据创业,可能此时就要喝西北风了。

总的来说,2015年后新上线的开放平台,基本都能保持数据集的增长,整体形势是趋向好的一面发展。

上海这么牛,中国整体怎么样呢?

从上面这些指标看来,把上海称为中国开放数据第一城,还是很有道理的。但如果我们把目光放到国际上,中国整体的政府开放数据水平怎么样呢?

由互联网之父蒂姆·伯纳斯·李(Tim Berners-Lee)创办的万维网基金会(World Wide Web Foundation)公布了最新一期的“开放数据晴雨表”(Open Data Barometer)全球报告。报告比较了全球各个国家的政府开放数据情况。

在纳入评价的114个国家和地区中,英国在“开放数据”上得分居首,加拿大、法国、美国、韩国紧随其后。榜单中排在前列的多数是欧美国家,亚洲国家中韩国、日本表现出色,都挤入了前十的位置。

中国只排在了71位,比上一年度下降了15个名次。虽然上海在国内表现出色,但是中国总体上各类型的数据开放程度和质量,在国际上依然处于落后的状态。中国到底哪些类型的政府数据没有开放得很好,导致得分偏低呢?

数据显示,中国只在人口数据开放方面做得相对较好(65%),其他方面全部乏善可陈,各类数据的质量都在5%或15%之间。选举数据是开放数据中表现最不好的项目,数据质量为0%。

其实,“开放数据”这个词,如果把它看做一个人,也不过只有不到20岁的年纪。它血气方刚,正在蓬勃生长,但同时又经验不足,经常犯错。中国在政府开放数据的探索中,也是一样。我们能够看到诸如上海这种,有战略、有计划、渐进型的开放模式榜样,也看到了国内不同地区开放数据质量分布的不均。

独木不成林,要建设中国的开放数据,还需要更多的“上海”和“贵阳”,一座城市开放数据形成示范效应,带动更多城市加入,最终形成开放数据的森林,提升中国整体的开放数据水平。

备注

本文部分参考自报告《中国地方政府数据开放平台报告》。该报告由复旦大学和提升政府治理能力大数据应用技术国家工程实验室联合发布。“开放数林”指数由复旦大学数字与移动治理实验室出品。

扫码关注DT财经

(了解更多有趣又有料的商业数据分析,欢迎关注DT财经微信公众号“DTcaijing”,下载“DT·一财”APP)

分享这篇文章到