您好,欢迎来到派智库! 手机版|微博|设为首页|加入收藏

派智库

今天是:

主页 > 区域 > 闽台地区 > 大数据经济背景下公共数据获取与开放探究

大数据经济背景下公共数据获取与开放探究

发布时间:2017-04-20 作者:派智库 来源:《经济体制改革》2017年第 浏览:【字体:

[摘要]大数据的发展引发了大数据革命,大数据革命催生了大数据经济。本文通过公共数据的获取和利用来构建大数据库。大数据的挖掘、转化和利用能够提高经济的宏观预测能力、企业创新能力和产业转型升级能力。我国公共数据的“信息孤岛”和“信息闲置”现状亟需改变。通过借鉴美国的公共数据获取和开放的理论和实践,构建我国的公共数据开放机制和体制,可为我国的经济发展做贡献。

copyright dedecms

[关键词]公共数据;获取与开放;存在的问题;对策与建议 本文来自织梦

2010年以来大数据的发展引发了大数据革命。大数据革命也可以称之为人类第六次技术革命。大数据革命本质上就是以物联网、云计算和大数据等相关技术为主的第二次信息技术革命。大数据革命引起了传统经济的诸多变革,称之为大数据经济。首先,大数据改变了宏观经济预测的范式。大数据对经济预测的影响涉及数据来源、预测方法、预测结果等几乎每一个环节,在某种程度上改变了常规经济预测所遵循的基本范式。[1]复杂数据处理方法,尤其是特征提取方法,以及高频数据建模,逐渐用于宏观经济预测与预警、宏观经济分析。[2]其次,开放的大数据促进了企业创新。通过引导支持大数据产业发展,深化大数据在各行业创新应用,催生新业态、新模式,使开放的大数据成为促进创业创新的新动力。[3]第三,大数据促进了中国企业产业转型升级。利用大数据改变现有传统生产模式下的中国企业,使传统经济参与新一轮产业转型和产业升级,进而带动中国经济的新一轮增长。[4]

织梦好,好织梦

大数据经济发展的前提是大数据,即跨部门公共数据的关联和广泛应用。大数据的发展能够产生社会经济效益。然而,大数据体系的构建需要数据的共享,共享需要激励机制和制度框架,但对于如何定价、授权模式、所有权和控制机制、知识产权制度等,都还有待进一步了解。[5]大数据归根到底源于人类具有对4V[1]特征数据掌握和分析的能力,而对广泛、完整的相关数据获取和挖掘则是大数据的核心。数据作为公共产品,有私人供给则会导致供给不足和不效率,另一方面,我国80%数据信息由政府及相关部门掌控并闲置。数据的公共产品属性以及我国“数据孤岛”和“数据闲置”的现状,亟需构建新的数据理论和完善相关公共数据获取和利用的相关制度。

内容来自dedecms

一、公共数据的公共产品属性理论 dedecms.com

公共数据由于其具有非排他性和非竞争性,若由私人市场提供则会导致搭便车因而公共产品供应不足或者在强制提供的情形下导致不效率,因而应当由公共数据的实际控制者政府提供。政府可以通过税收的方式进行转移支付以保证效用最大化,并同时履行其公共服务的职能。 织梦好,好织梦

1.公共产品理论 本文来自织梦

公共产品指具有消费的非排他性和非竞争性特性的产品。所谓非排他性是指只要有人提供了公共产品,不论其意愿如何都不能排除其他人对该产品的消费。若想排除其他人从公共产品的提供中受益,或者在技术上是不可行或极其困难的,或者排除的成本过于昂贵而缺乏可行性。所谓消费的非竞争性是指某物品在增加一个消费者时,边际成本为零,即在公共产品数量一定的情况下,将其多分配给一个消费者的边际成本为零。[6]因此,萨谬尔森对公共产品的经典定义是:公共产品是指每个人对它的消费不会减少其他人对该产品的消费量的产品。[7]对于公共品和一些具有非排他性或者非竞争性的准公共品,[2]仅仅有私人提供会导致不经济、搭便车等现象,因而应当由政府承担提供者的角色(如图1所示)。[8]

本文来自织梦

dedecms.com

正如曼昆(2012)在其《经济学原理》中所举的经典例子说明的那样:由私人提供公共物品将会导致搭便车或者不效率。[9]假如美国一个小镇居民喜欢在每年7月4日国庆日观看焰火表演,全镇500居民每个人观看表演的平价均为10美元,总利益就是5000美元,放烟火的成本是1000美元。由于5000美元的利益大于1000美元的成本,因而小镇居民国庆日观看表演的习惯是有效率的。但是这一有效率的结果却很难由私人所提供,若小镇企业家Ellen承办这一活动,由于难以将不买门票的居民与烟火表演效果所隔离开,所以门票难以卖出。因此,私人市场难以解决这一问题的情况下,政府可以赞助这一活动,通过每人2美元税收的方式,并雇用Ellen进行表演。这样每个居民的福利都增加了10-2=8美元。这就是典型的公共物品问题解决之道。如果政府确信一种公共物品的总利益大于成本,它就可以提供该公共物品,并用税收收入进行支付,从而可以使每个人的状况变好。 织梦好,好织梦

2.公共数据的公共产品属性

copyright dedecms

公共数据具有非竞争性和非排他性:(1)公共数据具有非竞争性:数据接受主体的数量对数据本身不会产生任何额外成本增加的影响,因为数据本身是极为标准化、可重复利用的,并且作为公共数据,其本身的对象即为不特定公众。(2)公共数据具有非排他性:采取措施将个别主体排除在公共化数据的接受范围之外是成本过高难以做到的。数据的公开性和数据接受主体范围限制本身就是存在矛盾的。

内容来自dedecms

这里讨论的范围限定为公共数据,对于公共数据,其收集本就与公共服务的提供阶段相重合,从性质上也可以将其纳入公共服务的范围之内:(1)从性质上具有公共产品属性,难以私人化;(2)从实际控制上,由政府直接或间接控制;(3)从结果看,通过政府提供并采用税收支付的方式是有效率的。 织梦内容管理系统

二、我国公共数据利用现状和存在的问题 织梦好,好织梦

1.我国公共数据利用“数据孤岛”和“数据闲置”现象严重 织梦好,好织梦

目前我国数据的拥有者主要为政府及相关企事业单位和其他市场主体,直接或间接由政府持有的数据资源占比超过80%,[10]在这些数据中大部分由医疗、水电煤等公共基础服务企事业单位所拥有,并由政府所间接控制。政府所拥有的数据具有以下特点:第一,公共服务机构对大数据的运用意识差异大,并且更多重视存储数据而非分析、利用数据。第二,数据往往由不同的公共机构所掌握,公共机构自身难以做到全面的分析利用。以人口管理为例,掌握准确的基础人口数据是人口管理的一大难点。而且涉及人口管理的有八九家部门,税务部门有纳税人口数据,教育部门有在读人口数据,公安局有户籍人口数据,社保局有参保人口数据等等。孤立的任何一个数据库都不能全面展现一个地方的实有人口情况。[11]第三,大数据采集、分析的利用均需要专业人员。专业人员除了要对本单位的业务非常熟悉外,还要对大数据技术知识做到熟练运用。第四,公共部门数据还涉及用户隐私等问题,因而公共机构存在政策顾虑。[12]这些因素都是导致了公共数据闲置的主要原因。 本文来自织梦

除了公共数据之外,市场主体通过自身平台和交易渠道所沉淀的数据处于“自产自销”、“数据孤岛”状态。阿里巴巴、京东等的数据资源依托于其交易平台,腾讯等依托于其社交媒体,百度则依托于其搜索引擎。这是国内目前最有代表性的拥有沉淀数据资源的市场主体。但是,对于大部分市场主体而言数据沉淀都远远不够,即使是具有较为丰富沉淀数据资源的“BAT”互联网巨头,缺乏数据的互联互通也会导致数据“孤岛化”和数据的“应用偏差”。

copyright dedecms

2.构建我国公共数据获取和利用存在的问题 织梦内容管理系统

国务院出台的《关于促进大数据发展的行动纲要》中明确提出:“2017年底形成跨部门数据资源共享共享格局;2018年底建成国家政府数据统一开放平台”战略构想。目前,我国公共数据的获取和利用存在以下问题: copyright dedecms

(1)数据分布零散和格式混乱

本文来自织梦

政府所直接、间接控制的公共数据具有数量大,质量高的优势;另一方面,也具有分布零散,格式混乱的劣势。首先,由于对于一个数据库所需要的数据往往要通过比较完整的数据,而这些数据则要通过本由不同部门收集、控制的不同侧面进行反映。比如,如果要建立一个个人信息数据库,那么这个由政府所成立的公共数据库就应该包括由公安局所收集的户籍信息、由民政局收集的婚姻家庭信息、由不动产登记机构收集的个人不动产所有信息、由能源、交通、通信、医疗、社保、教育等各个公共服务机构所收集的个人生活、消费数据等信息。而这些数据分别由各个部门进行收集、使用,数据录入、保存格式类型各不相同,会造成数据库构建的重大困难。因此,进行公共数据公开首先要进行数据整合。 dedecms.com

(2)数据更新以及数据应用挑战 dedecms.com

公共数据应当保证准确性,要求其应当进行实时更新,特别是对于那些实时变化的信息,如对于一个市政交通数据库而言,实施路况信息、交通拥堵情况以及天气情况均应实时进行更新。除实施数据更新方面外,如何充分发挥公开数据的作用,创新与应用而非沦为政绩工程也是一个挑战。

织梦好,好织梦

(3)数据安全风险 内容来自dedecms

公共数据整合便意味着数据泄露的后果将更加严重,因而数据安全则更为重要。因此,需要合理规定数据查询主体的资格、数据查询权限范围的界定、以及数据中介机构对匿名化数据的合理使用等。

内容来自dedecms

三、美国政府数据开放的理论与实践 本文来自织梦

1.从“数据之痛”到LEHD

内容来自dedecms

美国的数据开放历史上同样有过现在我国所需要解决的问题:数据分散,整合成本大;法律障碍;联邦政府与各州政府之间权利义务关系协调等问题。而2001年美国发生的“9·11”事件却意外地有力推进了美国数据放开。例如在悲剧发生时,“双子塔中究竟有多少人?”这立即成为危机现场人人关注的焦点,但是面对这一问题,当时却没人能够回答,联邦人口普查局(US.Census Bureau)的统计学家也拿不出可靠的数据。因为当时美国的人口普查数据和中国一样是以居住地为依据统计的常住人口数量,而对于某一特定时刻某一特定区域的人口数目则无法统计估计。美国国家标准与技术研究院经过多次统计勘察,直到4年后的2005年才最终确定当时双子塔中共有17500人。 内容来自dedecms

这一悲剧同时也成为了美国统计部门的“数据之痛”它有力地推动了美国政府数据整合和数据公共化的进程。2007年美国“工作单位和家庭住址纵向动态系统”(LEHD,Longitudinal Employer Household Dynamics)开始运营。该系统是由美国联邦人口普查局牵头,通过与全国50个州谈判达成数据共享协议,并统一构建整合完成的。该系统一开始就有60多亿条记录。[13]该系统数据主要包括3个方面来源:(1)由人口普查局和社会保障局所记录的年龄、性别和个人住址等基本信息;(2)由州政府劳工部门拥有的工作职位数据;(3)由州政府部门拥有的工作单位数据。 内容来自dedecms

这一数据整合的主要作用在于,可以将个人的住址等基本信息与其工作信息相联系,并可以随时追踪某区域的工作人口和居住人口及其变动情况。这一系统开始只是政府机构用以人口统计之用,后来其价值被广泛发现。例如,通过以时间为纵轴分析某区域的工作人口,可以完成对某区域的经济发展和人口流动的分析,用以作为政策效率检验的依据。通过LEHD根据区域人流量还可以确定公共设施的选址,以及公交车站和加油站的数量。特别是对于商业店铺的选址,某区域的人流量、平均薪金、行业类型以及平均年龄都是重要的参考依据。 copyright dedecms

LEHD项目获得的成功是美国数据公开运动的开端。2004年以来美国开始数据开放,从而公共数据开放运动兴起。特别是2009年5月建立的官方门户网站“Data.gov”,兴起要求联邦政府各部门均需定时开放数据。2011年9月,美国作为发起者之一成立了国际促进政府信息开放的国际组织——“开放政府联盟”(Opening Government Partnership,OGP)。该组织在其纲领性文件《开放政府宣言》中指出:“我们支持政府信息开放并承诺在公民的参与下不断提高服务水平,管理公共资源,促进创新以及创造更安全的社区;我们认为透明、开放的政府将在一国内创造更多的财富、善举以及人类尊严,并促成一个联系更加紧密的世界。”《开放政府宣言》特别在其促进政府信息开放部分承诺:“要不断努力系统化地收集、公布政府开支和政府在重要公共服务等活动中的行为数据;积极提供高信息质量,包括初始数据。致力于及时的,公众易于定位、理解、使用和重复使用的信息公开格式。”这一国际组织最初由美国、英国、巴西、印度尼西亚、墨西哥、挪威、菲律宾、南非8国创立,目前已经有69个成员国,每年公布对各成员国数据开放承诺执行情况的评估报告,该国际组织在国际社会起着越来越大的影响。 织梦好,好织梦

2.美国公共数据开放主要内容 本文来自织梦

纵观美国数据开放运动和数据公共化历史,从2001年双子塔“数据悲剧”到2007年LEHD项目的完成,从数据开放运动到OGP国际组织的建立,可以看出美国政府始终注重由联邦政府统筹进行各部门、各州之间的数据整合;注重数据向公众开放;注重公民的参与,除此之外还有一些特点值得国内进行数据公共化时进行借鉴。

织梦内容管理系统

(1)通过立法将数据公开制度化

织梦好,好织梦

美国“Data.gov”2009年成立时,美国总统奥巴马签署行政命令《透明和开放政府》,要求联邦政府应当定时、定量在该网站上开放数据。2013年5月9日奥巴马签署新的行政命令并将数据开放上升到法规层面:《使政府信息默认格式改为开放且机器可读格式》,并且根据这一命令,所有产生的政府信息,在其产生的时候其格式就应当是开放的和机器可读的。[3][14]在美国数据开放的过程中,面临跨部门数据整合、数据开放方式、数据安全等问题时始终以法令的方式明确联邦对数据开放的正面态度,构建统一框架和法定化开放模式。 dedecms.com

(2)注重公开数据的可应用性和专业性 织梦内容管理系统

数据开放的目的在于提高政府运行效率、透明,促进经济发展和生活便利,为创新提供数据支持。因此数据的可应用性则必然是数据开放政策执行过程中的重要因素。美国联邦总统办公室于2011年7月任命了“智能开放项目特别小组(The Task Force on Smart Disclosure:InfoITnation and Efficiency in Consumer Markets,TFSD)”成员,授命对“智能开放计划(Smart Disclosure)”提高公开数据可应用行和专业性的效果进行调查。2013年该小组提交报告《智能开放和消费者决策:智能开放计划报告》。该报告用生动的语言解释了什么是智能开放计划以及这一计划的主要目的:“今日的消费者身处于信息旋涡中。不论是选择大学、健康保险、信用卡、航班或是能源提供者时,消费者都要在众多复杂的信息中做出选择。在纷繁复杂的信息中寻找到有用信息并做出最好的选择是十分耗费精力的。在其他的一些情况下,非组织化的、不可读的信息也会降低消费市场效率、竞争力和创新能力”;“智能开放计划是为了解决这一问题,提高数据信息的易读性和易接受性。使消费者更有效的获得信息,使创新者可以开发出提高市场产品服务透明度和效率的产品”。

本文来自织梦

“智能开放计划”是一种数据支持,是关于消费产品服务、提供服务的公司或者其用户的数据支持:1、广大产品、服务、提供者、机构、用户的信息数据可以在《信息安全法》的框架下被公开获取;2、公布的数据是“机器可读的”,应当符合“易于理解”要求;3、所公布的信息应当保持高质量并且符合“全面、及时、准确”的特点。

本文来自织梦

“智能开放计划”实质上是对LEHD计划范围的扩展和数据的专业化。LEHD计划所整合的是联邦人口普查局和各州劳工等部门拥有的个人、公司、职位信息;而“智能开放计划”将数据信息扩大到了包括个人健康、医疗、能源、教育、环境、商业消费在内的各个领域。而所整合的数据所有者也扩大到公共和商业主体两方面(见表1)。

织梦好,好织梦

表左为信息的提供者,包括政府和非政府机构;表右为信息的类型,包括商品、服务和个人信息,据此将信息分为四类,对于政府控制的信息主动整合公布,对于商业主体控制的信息,成立“推动小组”进行推动。 内容来自dedecms

本文来自织梦

通过“智能开放计划”整合的数据大部分采用“Choice Engine”[4]用中心门户(centralized portal)查询的方式以满足可识别、分析和可视化的要求。不同于LEHD的OntheMap统一查询系统,为了做到准确专业和可应用化,“智能开放计划”多与商业中介合作或自行开发专业性的查询系统。[5]如在教育部所整合的门户查询界面“Education.Data.gov”上可以轻松利用其提供的价格计算其“计算一个与查询者具有相同情况的学生上一年在获得奖学金后的支出总和,这一结果会给予查询者较高的参考价值”;而医疗类信息则可以在美国卫生部整合的“Health Data.gov”和“Medicare.gov”上查询,比如比较健康医疗计划提供者的商业保险产品和质量。再比如对于产品质量问题、召回情况和消费者投诉、反馈数据,就可以在美国“消费产品安全委员会(Consumer Product Safety Commission,CPSC)”建立的“Safer products.gov”上进行查询。 织梦内容管理系统

织梦好,好织梦

(3)积极参与数据开放国际交流 copyright dedecms

美国在进行数据开放运动的同时也积极参与国际交流。除了作为发起国参与国际组织“开放政府联邦”OGP以外,还于2012年与印度联合开发了一个开放的政府信息公开网络平台——“政府开放平台(The Open Government Platform,OGPL)”(如图2所示)。在其官方网站上,任何人或机构都可以下载并使用这一开放的网络平台程序,“政府开放平台”融合了美国“Data.gov”和印度“India.gov.in”两国信息公开网站的优势。

织梦内容管理系统

OGPL这一政府信息公开网络平台代码可以帮助使用者构建一个具有(1)数据公开;(2)低成本发展云技术;(3)格式统一、多平台可互联;(4)可收集传播评论反馈等功能的国内数据平台。 织梦好,好织梦

(4)运用技术手段保护信息安全

织梦内容管理系统

在政府数据开放的讨论中,数据安全问题总是最有力的质疑。[15]相比于商业数据,政府直接、间接控制的数据与公民的切身利益相关,均表现为个人的核心信息,一旦泄露将会带来极为严重的后果。

copyright dedecms

美国推行数据开放运动时采用“人工合成数据(Synthetic Data)”方式实现数据开放和数据安全的平衡。根据“麦格劳一希尔”字典解释“人工合成数据”指的是“任何非经直接测量(direct measurement)获得的加工处理数据产品(produc.tion data)”。《数据之巅》一书将其作比为“合成机油”,即在掌握了全体统计特征的基础上,采用人为手段,产生一些统计特征和原始数据一样的人工数据,但在个体信息层面,其敏感的数据字段都被虚拟的数值取代了,个体信息因此不会泄露。[16] dedecms.com

这和贵阳大数据交易所所推崇的理念相一致,即并不开放含有个人隐私信息的原始数据而是开放同类型,具有同等代表性的加工后数据。

内容来自dedecms

四、我国公共数据开放的对策与建议

织梦内容管理系统

国务院《关于促进大数据发展的行动纲要》明确提出要在2017年底形成跨部门数据资源共享共享格局,在2018年底建成国家政府数据统一开放平台。为完成《关于促进大数据发展的行动纲要》中大数据发展计划,要在2018年底成立中国的:“Data.gov”,应当借鉴美国数据开放的经验,稳步完成中国的数据开放计划。在这一过程中,应充分借鉴美国数据开放经验,着力于形成制度化和长效机制。

织梦内容管理系统

1.构建和完善我国公共数据的整合和开放体系 dedecms.com

数据开放的基础是数据整合,而数据整合的前提是数据标准的统一。无论是统一数据开放标准,还是整合各部门拥有的数据,都需要政府起到主导作用。因此,政府有关部门应当做以下工作:(1)在国家层面成立专门数据开放小组,负责协调各领域数据开放工作。(2)分部门和数据领域,由各部门主管部门带头整合本部门直接或间接控制的数据。以人身保险最为依仗的个人医疗、社保信息为例,国家卫生部门通过对管理的各级公立医院数据信息进行整合,社保部门对个人社会保险缴纳、使用情况进行整合,并提供以匿名化数据或者其他脱敏手段进行处理的数据查询、下载,数据中介机构就可以根据目标保险客户的相关信息进行统计分析,从而形成科学精确的费率,并由保险公司进行准确营销。(3)建立应用性门户查询界面。进行数据整合的各部门可以自行或者委托市场主体仿造美国数据门户网站建设各部门的查询网站,并提供处理分析工具。如使用美国“OntheMap”可以轻松的对任一区域的居住人口、工作人口的行业分布、收入情况、时间空间变动情况等数据进行分析。对于保险公司而言,就可以轻松有针对性的向目标保险客户营销;利用场景营销,如该区域有一星巴克咖啡店,由于其与众多高档写字楼相邻,因此来往消费人群年薪均较高,并多为金融从业者,保险公司即可以与星巴克合作推出理财险并附赠星巴克优惠券。(4)加强国际交流。建议我国积极参与国际数据开放活动,学习经验。建议参加“开放政府联邦”(OGP),接受其每年对政府数据开放承诺的完成情况调查和“政府开放平台”,利用其开源系统构建我国的“Data.gov”。

本文来自织梦

2.完善公共数据获取和利用的监管制度

copyright dedecms

数据安全问题始终是数据开放过程中的核心问题之一。美国采用“人工合成数据”这一技术手段,通过加工处理数据,产生统计特征和原始数据一样而不含个人隐私信息的人工数据这一方式实现数据安全。这应当是我国实现数据安全的发展方向,然而在此技术之外,还应当采取以下制度化手段来保证数据安全。 copyright dedecms

(1)建立数据准入制度

织梦好,好织梦

这一制度并不意味着建议规定个人进行数据查询需先行核准,而是建议对进行大量数据获取和数据处理的中介类机构设定一定的登记备案要求。 织梦内容管理系统

(2)建立数据托管制度

本文来自织梦

即使是匿名化数据也存在经技术处理“逆向开发”的可能,因此对于获取海量数据进行数据加工的数据中介类机构可以考虑建立数据托管制度,即数据应当存贮于具备数据托管资质的第三方数据托管机构处,数据中介应当在其服务器上进行数据处理,这样就可以留下数据处理留痕,形成“数据处理底稿”,为数据监管预留空间。 内容来自dedecms

(3)建立数据滥用责任制度

本文来自织梦

建议对于未经登记获取使用数据、对数据进行“逆向开发”、利用数据进行非法活动的行为以明确数据滥用的责任。 内容来自dedecms

参考文献: 织梦内容管理系统

[1]蔡跃洲.大数据改变经济预测范式[N].中国社会科学报,2015-12-09(04). 内容来自dedecms

[2]汪寿阳.大数据经济[N].文汇报,2015-08-30(08). 本文来自织梦

[3]方烨.大数据顶层设计打造经济新引擎[N].经济参考报,2015-08-20(03)

内容来自dedecms

[4]黄亚钧.大数据时代的传统经济转型[N].文汇报,2014-04-21(10).

织梦好,好织梦

[5]李辉,汤琦,梁侣.数据驱动的创新——大数据时代经济社会动力分析[N].文汇报,2013-07-10(10). dedecms.com

[6]张宏军.西方公共产品理论溯源与前瞻——兼论我国公共产品供给的制度设计[J].贵州社会科学,2010,(06):121.

copyright dedecms

[7]贾晓璇.简论公共产品理论的演变[J].山西师范大学报(社会科学版),2011,(05):32.

copyright dedecms

[8][加]约翰·利奇着,孔晏,朱萍译.公共经济学教程[M].上海:上海财经大学出版社,2005.143.

本文来自织梦

[9][美]曼昆着,梁小民等译.经济学原理:微观经济学分册[M].北京:北京大学出版社,2012.224.

织梦好,好织梦

[10][12]潘旭涛,贺璞薇.大数据最值钱马云爆“数据是阿里最值钱的财富”[EB/OL].http://media.people.toni.cn/n/2015/0418/c14677-26865653.html.

织梦好,好织梦

[11]孙晓莉.大数据如何优化公共服务[N].学习时报,2015-09-28. 本文来自织梦

[13][14][26]涂子沛.数据之巅:大数据革命,历史、现实和未来[M].北京:中信出版社,2014.230,247,238-239.

本文来自织梦

[15]应钦.大数据安全与隐私保护技术探究[J]硅谷,2014,(10):72. dedecms.com


[1] 4V分别是Volume、Variety、Vaule和Velocity,意味着数据容量大、数据源多、价值密度低以及增长速度快。 本文来自织梦

[2]包括消费具有非排他性的“拥挤型准公共品”(消费者的数目达到一定程度时便产生消费上的竞争性,即“拥挤”),如“公共绿地”;和具有非竞争性的“俱乐部型准公共产品”(消费具有非竞争性,多增加一个使用者的边际成本是微不足道的),如“收费公路”,对于准公共产品,完全由私人供给也会导致缺乏效率。 织梦好,好织梦

[3] “机器可读”指的是进入数据库并且可由计算机自动读取、使用。 织梦内容管理系统

[4]可以理解为是一个查询、可比较的信息搜索界面平台;和搜索引擎的使用方式类似但功能更专业。 织梦内容管理系统

[5]政府相关数据都被整合进了Data.gov,但是每个查询的系统都是各部门制作的,Data gov主要是一个桥梁作用。

内容来自dedecms