EN

政府数据开放问题探析


摘 要:数据产业已成为许多国家的战略产业。政府数据开放,通过降低应用创新成本,加速社会创新,提高整个社会的福利。论文通过政府数据怎么开放和向谁开放的建构,具体阐释数据开放对于创新和社会福利的影响,最后提出了政府数据开放中应注意的问题。

关键词:大数据;政府数据;数据开放

一、引言

数据的开发和应用正改变着当今世界。数据资源变成了数据资产,数据的生产、流通和应用使数据产业应运而生。各发达国家纷纷制定大数据发展战略,以提升获取大数据知识和洞见的能力,促进大数据应用和创新发展。数据已成为国家基础性战略资源。由万维网基金会所组织开展的“开放数据晴雨表”(Open Data Barometer)和英国开放知识基金会(Open Knowledge)组织开展的“开放数据指数”(Open Data Index)是得到各国政府、国际组织及国际开放数据社群广泛认可的两项开放政府数据评估项目。在“开放数据晴雨表”(2014)中,中国位于第 46位(共 86),而在“开放数据指数”(2014)中,中国位于第57位(共97)郑磊、高丰:《中国开放政府数据平台研究:框架、现状与建议》,《电子政务》2015年第7期。。这表明中国政府数据的应用潜力尚未得到充分挖掘,有较大的开发空间。

目前数据产业发展的最大障碍之一是数据的可获得性,它关系到数据的分析、使用和价值的发现,关系到数据产业的健康发展。中国“十三五”规划纲要中提出:“实施国家大数据战略,推进数据资源开放共享。”政府作为核心数据的拥有者,通过数据开放与共享来满足社会对数据资源日益增强的需要,对于社会的创新和福利的增长具有十分重要的意义。

二、政府数据开放的意义

政府数据是政府机构或部门为实现既定资源条件下社会福利最大化而在提供公共产品和公共服务中自动生成和收集的数据。目前,美国、英国和韩国等信息化发展水平比较高的国家已开始利用大数据提高政府决策水平或改进公共服务,并通过向社会开放政府数据以提高整个社会的创新水平和社会经济效益。因此,政府数据开放对中国经济社会发展的意义如下:

1.增加高质量数据的供给

政府数据的开放增加了整个社会高质量数据的可得性。由于目前还没有一个数据标准,各种数据价值含量参差不齐,总体来看,政府数据相对价值含量较高,质量较高,以高质量、高精度和高标准化为特征。如教育部掌握着最全面的教育信息;农业部掌握着最权威的全国农业信息;工业和信息化部掌控着全国的工业和信息化发展方面的数据。政府部门在履行职能、提供公共产品的过程中产生了大量的数据,同时还采集和存储了大量的数据。开放政府数据有利于全社会获得更广泛、更充裕的数据资源进行分析和挖掘,创造更多的社会经济价值。为开发大数据的潜在价值,充分利用大数据的分析结果为产业发展寻找新的出路,人们千方百计地从各方面获取数据。除了依靠数据市场交易取得数据外,很大一部分数据的取得依赖于政府各部门。政府拥有一个社会最大的数据源和信息源。在一个国家或社会共同体中,最核心数据的70% ~80%掌握在政府手中。所以,大数据是建立在开放数据基础上的,由政府开放,公众利用,才能实现创新,提高人们生活的质量。

数据是信息社会人们进行创新的力量源泉。当前大数据应用的难题,不只在于数据的分析、挖掘、解读和应用,更在于数据资源的获得。具有数据挖掘能力的一方,往往难以寻找到一个足够大的数据库去挖掘与分析;而政府各部门手中虽然拥有海量数据,却因为相关的制度障碍或部门利益被闲置和荒废。2010年中国存储的数据为250PB(Petabyte千万亿字节,拍字节),仅为日本的60%和北美的7%。《中国工程院原院长:中国数据存量仅为北美7%》,《解放日报》2013年7月1日。一些部门和机构拥有大量数据,自己不用也不愿提供给有关部门共享,导致数据信息不完整或重复采集。

开放政府数据已成为信息社会创新发展的关键。开放政府数据使人们在更完整的信息中挖掘到更多的需求信息和创新灵感。美国2010年在世界上首推国家级政府开放数据平台data.gov后,联邦政府已开放了多个领域的13万个数据集。鼓励大家在农业、商业、气候、生态、教育、能源、金融、卫生、科研等领域应用数据苏东:《政府大数据开放刻不容缓立法与市场需同步推进》,和讯网,网址:http://news.hexun.com/2015-04-17 /175069349.html。。2011年9月,巴西、印度尼西亚、墨西哥、挪威、菲律宾、南非、英国、美国等八个国家联合签署《开放数据声明》,成立开放政府合作伙伴(OGP)。截至2014年2月10日,全球已有63个国家加入开放政府合作伙伴,既包括发达国家,也包括发展中国家。经济合作与发展组织(OECD)、联合国(UN)、世界银行(WB)也加入到开放数据的行列,建立了数据开放门户网站李苑:《全球政府开放数据的四大特点》,中国经济网,网址:http://intl.ce.cn/specials/zxgjzh/201402/20/t20140220_2343409.shtm l。

2.降低应用创新成本

数据的价值是其所有可能用途的总和。数据从产生到被收集、存储、流通,再到被分析、挖掘产生信息和知识,直至最后的应用,期间会产生大量的费用,这些费用能否成为数据价值的组成部分,还要看这些数据能否产生有价值的信息和知识,并被实际生产和生活部门利用而实现价值的增值。马克思认为从商品到货币的转换是商品的惊险跳跃,跳跃不成功,摔坏的不是商品,而是商品所有者自己。那么大数据的应用者能否获得价值增值,则是数据产业链条上最后的惊险跳跃,跳跃不成功,摔坏的不仅是大数据的应用者,而且包括整个数据产业链条上的利益相关方。因此,降低应用创新成本是降低风险的关键。

数据资源的收集、存储和流通要花费一定的成本,但数据的潜在价值究竟能否被挖掘出来,以及能挖掘出多少,却存在较大的不确定性,这意味着前期投入的风险。数据分析师认为中国数据采购和运营成本高达40.2%王丛:《中桥国际:2014年中国市场大数据对存储的市场需求调研,硬件设备业》,《计算机与网络》2014年 第9期。。因此,前期数据资源的获得应尽可能降低成本。而政府提供的数据基本是作为公共资源免费提供的,这与政府本身的职能相一致。政府用纳税人的钱履行职能或收集数据,都是为整个社会服务的,这些公共资源在不影响国家安全、商业秘密和个人隐私的前提下,应向数据的广大需求者无偿提供。这与数据需求者从其他来源取得的有偿转让数据不同:一方面会降低社会开发利用数据的成本;另一方面,也可以降低整个社会数据应用创新的风险。

政府数据开放是一个动态循环的生态系统。从政府开放数据到社会公众开发利用数据,再到价值的创造和社会福利的提高,然后进入新的、更高层次的数据开放过程(如图1)。政府开放数据之后,由开发者利用数据,为社会创新和提升价值服务。数据利用者的利用方式和利用能力直接关系到数据利用的效果,两者间的动态互动关系共同决定开放数据的价值创造大小。政府开放的数据越多、越广泛,整个社会的创新成本和创新风险就越小;数据利用者的利用能力越强,数据的利用效果就越好,创造的价值也越大;如此又促使政府开放更多更广的数据,形成良性循环。政府数据的开放共享还可以避免整个社会重复收集数据,节省社会资源,惠及民生需要。

图1 数据开放循环系统

3.加速社会创新

在经济转型和产业结构升级背景下,最关键的就是创新,而数据又是推动创新的非常重要的资源。政府数据的开放共享有助于提高科研的深度和效率,有助于开展跨学科研究,提高研究成果的可见度、利用率和影响力。世界知识产权合作组织提出,数据开放将加速科技创新,提高科学事业的透明度和诚信度。

加快数据产业发展,深化大数据应用,已成为我国调整产业结构、促进经济持续增长、惠及民众生活、推动政府治理能力提高的内在需要和必然选择。国务院《促进大数据发展行动纲要》指出,大数据目前已成为推动经济转型发展的新动力、重塑国家竞争优势的新机遇以及提升政府治理能力的新途径黄鑫:《把大数据巨大潜能挖出来》,《经济日报》2015年9月7日。。政府数据的开放可以促使企业“做新、做优、做强”产品和服务的能力得以释放,鼓励创业者利用数据资源创新创业,支持传统行业利用数据资源转型升级,培育高端智能、新兴繁荣的产业发展新业态。政府数据社会化增值开发,可以生产出各种各样的增值信息产品,满足社会不同层次、不同领域的需要李辉:《做好顶层设计推动大数据开放共享》,《中国高新技术产业导报》2015年3月9日。。通过政府的数据开放可以带动全社会的创新,创造出有助于大众更好地适应现代生活的实用工具和产品(如图2)。

图2 政府数据开放的意义郑磊:《开放政府数据的价值与实践》,《中国行政管理》2015年第11期。

一些数据的应用有着极强的时效性,随着时间推移,一些数据的应用价值会大幅度下降。因此,在政府数据资源共享渠道不畅的情况下,大量数据资源逐渐丧失其价值。在大数据应用相关技术已经达到较高水准的今天,这种资源的无谓浪费令人痛惜,因此,政府数据共享工作的推进刻不容缓。

从数据中撷取洞见和灵感以提振经济。美国政府开放数据后,已形成了一个对政府数据进行加工、创新和利用的产业。2013年在政府管理、医疗服务、零售业、制造业、位置服务、社交网络、电子商务七个重点领域产生的潜在价值已经达到了2万亿美元南都社论:《政府开放数据的政治意义》,《南方都市报》2015年9月6日。。政府盘活自身拥有的数据资产,是国家治理、企业决策乃至个人生活服务的重要方面,是政府当前工作的重点之一;汪玉凯:《互联网+政务:政府治理的历史性变革》,《国家治理》2015年第21期。是信息社会条件下实现国民经济转型升级、实现资源替代的必由之路。

4.提高政府社会治理的科学性

政府对社会的治理,要能够激发市场活力,提高社会的福利水平。通过信息技术把政府的权力运行约束在制度框架内。借助信息网络技术构建政府的权力清单、责任清单和负面清单,实现社会治理的科学性。同时,社会公众对政务信息的需求不断增长,希望政府能够提供更多、更简便的公共服务汪玉凯:《互联网+政务:政府治理的历史性变革》,《国家治理》2015年第21期。。通过对政府运行数据的分析,对政府的履职行为、成效和行政成本进行验证,使政府运行处于公众的监督之下,从而减少或防止腐败,降低行政成本,提高行政效率,达到在既定财政支出条件下社会公共福利的最大化。如2009年金融危机时,美国政府通过Recovery.gov上的地图,标明各地公共财政资金的流向,点击链接可以看到政府每笔资金的地点、数目、签约方,直接监督政府的资金使用情况。

大数据让数据挖掘更加深入和精细化,从而使政府公平、公正、透明的公共服务成为可能。数据资源增值性应用每年可为美国的医疗服务业节省3000亿美元,为欧洲的公共部门管理节省2500亿欧元,为全球个人位置数据服务提供商贡献1000亿美元美国总统行政办公室:《美国白宫“大数据”白皮书,大数据:抓住机遇、保存价值》,浙江大学译2014-05-29。。由此可以确信,政府数据的开放共享使中国打造精准治理、多方协作的社会治理新模式成为可能。

三、政府数据开放的原则和开放对象

基于以上分析,可以得出政府数据开放总的原则应该是:只要不构成对国家安全、商业秘密和个人隐私的侵犯,数据就应向社会开放。人们对政府开放的数据进行利用和再利用,从而使数据的潜在价值不断被挖掘出来。如2012年美国纽约市许多非政府救援组织使用政府公布的“飓风疏散区域数据”来制作地图,在艾琳台风到来时引导市民疏散应急郑磊:《我国政府数据开放现状如何》,《人民邮电报》2015年10月19日。。我们认为,中国政府数据的开放应主要包括以下方面:

1.政府部门之间的数据共享开放

在保障信息安全的前提下,首先要保障政府部门间数据的共享开放。政府部门之间的数据开放与共享,一方面可以节省数据重复采集导致的人力物力财力的消耗,提高公共部门的办事效率;另一方面,可以提高政府部门提供公共服务的水平和效益。根据国务院《促进大数据发展行动纲要》提出的目标,2017年底前形成跨部门数据资源共享共用格局;2018年底前建成国家政府数据统一共享交换平台。中央政府层面实现金税、金关、金财、金审、金盾、金宏、金保、金土、金农、金水、金质等信息系统通过统一平台进行数据共享和交换。建立政府部门和事业单位等公共机构数据资源清单,制定实施政府数据开放共享标准。

目前政府部门之间数据共享开放的阻力主要包括:一是维护部门利益不愿开放数据。每个部门都希望将信息牢牢掌控在自己手中,从而增加自身在整个体系内的地位和增大与其他部门的博弈能力何哲:《打通政务信息孤岛》,《学习时报》2015年5月25日。。二是缺乏大数据思维观念不愿开放。三是出于数据安全考虑不愿开放。以往政务信息的保密条款是否适用于现在的数据开放?哪些数据可以开放?哪些数据需要脱敏、脱密之后才可以开放?目前还没有一个明确的标准或规范。四是害怕权力受到监督不愿开放。数据共享和开发意味着权力要实时接受社会全方位的监督,这更增加了开放数据的阻力。

大数据、云计算这些新技术要派上用场,其前提条件是政府开放数据,政府部门之间共享数据。如果上述阻碍数据共享开放的机制体制障碍难以克服,这些新技术很难真正派上用场汪玉凯:《政府如何盘活海量数据资产将成为“互联网+政务”的核心议题》,《信息化研究》2015年第5期。,也就谈不上大数据应用及其给社会带来的福利。

2.政府对企业的数据开放

政府数据向企业的开放对企业的创新应用尤为重要。企业创新的灵感和洞见依赖于对大数据的分析和交叉验证。政府数据对企业开放,使企业获得更多的数据,从而使数据分析挖掘的信息更为精准,创新的源头更为充盈。同时,政府也可从企业直接购买数据分析结论用于社会治理。这种双向流动提高了数据的应用价值。

长期以来,中国的信息化是以部门为中心展开的,客观上形成了行业垂直的信息化体系,在地方上形成了条块分割的信息孤岛,数据开放需要纵向层层审批,造成了数据信息在一个区域平台共享的难度钟慧:《数据开放说易行难》,《中国电子报》2015年3月17日。;而在制度层面上,政府数据开放共享,始终缺乏相应的法律法规、执行标准、开放标准,导致许多部门完全不知道要怎样开放,开放什么,程序怎样,如何管理,等等李辉:《做好顶层设计推动大数据开放共享》,《中国高新技术产业导报》2015年3月9日。。目前中国只有一部《政府信息公开条例》,开放数据需要进行整个体系的全面调整,需要进行专门立法。

3.政府对个人的数据开放

政府数据对个人的开放,有助于公民了解自己的信息档案,知道自己的信用评分状况,了解、纠正与删除不正确信息。因个人数据的敏感性,以及不准确数据对公民个人有产生不良后果的风险,公民有权查阅并更正个人资料已成为一些国家对个人数据开放的内容之一美国总统行政办公室:《美国白宫“大数据”白皮书,大数据:抓住机遇、保存价值》,浙江大学译,2014-05-29。

数据开放可以监督政府到期删除负面信息以确保公民权利。数字世界,信息可以被无限期保存。正如舍恩伯格所说,永不磨灭的数字记录让人无法告别过去。“永久记忆”的个人数据就像达摩克利斯之剑悬在头上,多年之后会被翻出来再次刺痛人们。由此,美国《公平信用报告法》授权信用报告机构在一定时间后删除负面信息,例如,逾期付款与税收滞留记录将在7年后从档案中删除,破产记录将在10年后被删除。

数据开放使个人获得便捷的社会服务。2014年,美国国税局通过一个名为“创建副本计划”(Get transcript)的工具将纳税人的信息数据加以共享,纳税人可以通过它获得自己最近三年的纳税记录。个人纳税者可以借此下载过去的纳税申报单,这使居民进行抵押、学生贷款、商务贷款等活动与填写纳税表变得更加便捷。美国政府与电力行业合作推出了“绿纽扣”计划,使家庭与企业方便地获得他们的能源使用信息,帮助他们节约资源美国总统行政办公室:《美国白宫“大数据”白皮书,大数据:抓住机遇、保存价值》,浙江大学译2014-05-29。。美国政府数据的开放和管理给我们提供了很好的借鉴。

4.政府对世界的数据开放

云计算使大规模的政府数据、商业数据和个人数据通过云服务进行存储和处理,并且数据的跨境流动更加频繁,各国开始重新审视跨境数据流动制度,并重点关注政府和公共部门数据的跨境流动与管理严峰、潘斐斐、宋谨谨、张静:《数据“安全港”事件折射出的国家跨境数据管理博弈》,《中国信息安全》2016年第3期。。从国际组织以及其他国家对跨境数据流动的管理制度来看,跨境数据流动包括两类:一类是数据跨越国界传输和处理;另一类是数据即使没有跨越国界,但第三国的主体能够访问。

从国际上来看,数据流动根据禁止程度分为三大类:一是重要的数据禁止跨境流动。对涉及国家秘密、国家安全以及经济安全的数据严格禁止跨境,必须在境内的数据中心存储和处理。如美国,虽然没有法律规定禁止数据跨境流动,但在外资安全审查中,对于国外网络运营商通常要求其与电信小组签署安全协定,要求其国内通信基础设施应位于美国境内,通信数据、交易数据、用户信息等仅存储在美国境内。二是政府和公共部门的一般数据和相关行业技术数据有条件地限制跨境流动。三是普通的个人数据允许跨境流动,但要满足安全管理要求。对于上述做法中国可以借鉴。

图3 政府数据开放时间及领域

资料来源:国务院《促进大数据发展行动纲要》2015年9月

四、政府数据开放应注意的问题

政府基于社会需求及职责开放数据,但数据开放共享需注意相关法律法规体系、行政体系及安全和标准问题,特别要注意保护用户隐私、保护知识产权、强化国家数据资源统筹管理等黄鑫:《把大数据巨大潜能挖出来》,《经济日报》2015年9月7日。。图3是中国政府数据开放的时间节点和2020年底前开放的9个领域。在政府数据这一开放过程中应注意的问题主要包括:

1.数据主权问题

大数据的优势有赖于全球信息的自由流动。国外跨境数据流动管理可提供的借鉴是:在管理上重点关注政府和公共部门数据的跨境流动,特别是加强对跨境服务提供的监管,在管理机制上加强跨境执法合作,增进各国用户对跨境数据流动的信任。

中国在立法尚不完善的情况下,应借鉴国外安全审查机制及签订安全协议的方式,通过协议对外资的数据安全管理人员、数据存储地址、数据处理方式、服务的范围等内容提出特殊要求,实现对外资企业的跨境数据流动管理。对数据跨境流动提出要求,建立对跨境提供数据服务的事前、事中、事后全生命周期管理,保护数据安全。

2.数据开放秩序问题

政府在权力清单、责任清单和负面清单向社会公开条件下,要开放数据必须摸清数据资产问题。第一,政府究竟有哪些数据资产?第二,对厘清的数据资产进行分类开放。哪些数据可以跨国流动?哪些数据向全社会开放?哪些数据在一定条件下向特定的对象开放?第三,尽快建立数据标准问题。不单是政府数据标准问题,市场上交易的数据应确立一个共同的标准;否则,数据产业的发展就会受到影响。中国政府的数据开放量和标准化都较低。复旦大学数字与移动治理实验室和“开放数据中国”联合推出的《2015中国开放政府数据“探显”报告》,对北京、上海、武汉、江苏无锡、广东湛江、浙江宁波海曙和广东佛山南海七个在开放数据实践走在前列的地方政府开展评估。报告显示,截至2015年5月20日,样本地方平均公开278个数据集,数据可机读率为84.1%。各地方目前普遍发布的都是静态数据(更新频率为一年或不定期),比例高达86.25%郑磊:《我国政府数据开放现状如何》,《人民邮电报》2015年10月19日。。第四,政府数据开放的法律制度保障。数据资源的开发利用是信息社会条件下经济可持续发展的动力。因此,法律制度与能力建设是政府数据开放不可或缺的。

3.数据隐私权问题

大数据时代,若使数据能够在世界范围内流动,发挥最大的效能,就必须解决数据的隐私权与使用权之间的平衡问题。个人数据主要包括:用户行为数据、用户消费数据、用户地理位置数据、互联网金融数据、用户社交等 UGC(User Generated Content,用户原创内容)数据和基因组信息等,个人用户留下的各种痕迹被企业收集储存起来,这一切都涉及到个人隐私问题。由于数据的价值很大一部分体现在二次应用上,个人隐私权的保护也就由个人许可转变为数据使用者承担责任。因为数据使用者比任何人都清楚他们将如何使用数据。

数据一旦被采集,就很难保持提供者的匿名性和隐私性。在大数据时代,不管是告知或许可、模糊化还是匿名化、脱敏还是脱密,隐私保护几乎都失效了[英]维克多·迈尔·舍恩伯格、肯尼恩·库克耶:《大数据时代——生活、工作与思维的大变革》,盛杨燕、周涛译,浙江人民出版社2013年版。。当大数据应用变得更为普遍时,情况变得更加不堪设想。目前,中国还没有专门的法律来界定用户隐私,处理隐私问题一般采用其他相关法规条例来解释。但随着民众隐私意识的日益增强,合法合规地获取数据、分析数据和应用数据,是大数据产业发展的关键。

4.数据安全问题

近年来,随着云计算、大数据技术的快速发展,数据的安全问题日益凸显。大量与经济运行、社会服务乃至国家安全相关的数据向以居于优势地位的美国等发达国家的跨国企业集中,大规模的数据跨境存储在全球各地的数据中心,存在较大的安全风险。

目前巴西和俄罗斯政府已经通过立法,要求境外的互联网公司在其境内开展互联网业务必须使用其境内的数据中心,通过对数据中心的管理实现对数据的可控、可管。英国政府强调了信任和保持数据安全的必要性,将“极其谨慎地”对待个人数据和敏感数据刘长安:《英国拟升级政府数据基础设施提高数据利用效率》,《人民邮电报》2015年12月2日。

问责制的管理模式,要求对数据控制者的数据安全管理责任做出规定,要求其承担在数据跨境的整个过程中的安全管理责任,包括对数据主体的通知、对外包商的资质审查和监督。从立法上,应将政府内部网和“城市数据资源管理中心”的安全边界划分清楚,由“数据资源管理中心”承担其所承载数据安全的法律责任,政府内部网的信息安全由各数据采集应用部门承担相应的法律责任,从而明确数据安全的责任主体。尽快启动数据开放立法,界定数据开放边界,切实有效地为数据开放提供政策层面上的架构支持郭为:《大数据价值的释放,共享乃真谛所在》,《中国产经新闻报》2015年4月2日。

总之,政府开放数据本身不会直接产生价值,只有开放的数据被社会利用了才真正有意义汪玉凯:《“互联网+政务”:政府治理的历史性变革》,《国家治理》2015年第27期。。政府数据开放之后,一方面要推动利用,不断将其潜在的价值变为现实的价值。另一方面,还要规避风险,防止滥用。在大数据被用来造福社会的同时,也有可能被用来制造社会危害。大数据变革正处于最初阶段,我们需要数年才能理解其完整的技术内涵、其对健康、教育、经济和社会的强化作用,特别是对人们价值观的影响美国总统行政办公室:《美国白宫“大数据”白皮书,大数据:抓住机遇、保存价值》,浙江大学译2014-05-29。

On Opening Government Data to the Public

Du Zhenhua,Cha Hongwang

Abstract:The data industry has become a strategic industry inmany countries.Opening government data to the public reduces the application costs of innovation, accelerates social innovation, and enhances the welfare of the whole society.Yet how should government open its data, to whom it should open, and how this opening specifically affects innovation and social welfare, all these remain to be studied.Finally, the author points out a number of problems in the process of opening government data.

Key words: Big data; Government data; opening data to the public


作者简介:杜振华,女,北京市人,北京邮电大学经济管理学院教授;茶洪旺,男,云南南涧人,北京邮电大学经济管理学院教授,博士生导师。(北京 100876)