随着我国“互联网+”专项行动的实施和***《促进大数据发展行动纲要》的推进,我国大数据的体量呈指数级增长。大数据的流通、开放、共享、安全等问题也受到越来越多的关注。
随着大数据的价值被广泛认可,尤其是***高层的主动推进,越来越多的企业加入到该领域中掘金。目前,大数据主要在***、消费、金融、公共安全等这几大非公开领域被讨论和研究得较多。目前较少有人关注公开数据,其实公开数据比私有数据具有更大的价值挖掘空间。
一般而言,大数据根据访问权限可分为私有数据和公开数据。很多人认为私有数据才具有价值,例如银行交易记录、***信息、***、通讯、电商交易数据等,因此大量机构和企业聚焦于私有数据的价值挖掘。
与私有数据不同,公开数据是指每个人都能够访问的数据,种类繁多。人们日常生活中随处可接触到的行政处罚信息、土地出让公示、***公告、新闻、外汇交易信息、交易信息、商标公示信息、***公示、域名备案等,都是公开数据,却较少人关注其价值和挖掘潜力。或许正是因为所有人都能访问,很少有人关注其背后的价值,也鲜有机构具备挖掘其价值的技术能力。
据统计,2015年我国大数据项目规模超过100亿元,预计到2020年国内企业级大数据市场应用规模将突破200亿元,其中私有数据占大部分,是大数据挖掘领域的红海;但私有数据因其私有性,连接性差、流通壁垒高,和公开数据相比,挖掘后的价值增值空间并不明显。
而让公开数据产品化,对大数据企业的产品理念和技术能力都提出了更大挑战。这个鲜有人关注的领域常面临“有数据的没技术,有技术的没数据”的困境,
公开数据具有公开、透明、种类繁多等特征,***够体现大数据“连接”本质,相反,私有数据则因其私有性而具有连接性差、流通壁垒高的特点。私有数据已经是大数据的红海领域,而公开数据则是一块蓝海。
国家发改委副主任林念修称,未来5年,中国大数据产业规模年均增长率将超50%,到2020年数据总量将占***两成,成为世界***数据资源大国和***数据中心。
国际数据挖掘协会中国分会***、香港科大计算机系主任杨强***指出,少量公开数据的获取难度不大,但是真正对于商业决策有帮助的大量公开数据的收集难度是很大的,搜索、整理、挖掘、呈现出其中的关联关系、并呈现出一个具象化的结果,这个难度就更大,所以目前需要一个***、直接的方法把杂乱信息转换为决策支持。
版权所有©2024 天助网