我要找:  
您的位置:电源在线首页>>行业资讯>>产业纵横>>中国大数据行业分析与展望正文

中国大数据行业分析与展望

2014/3/21 8:42:26   电源在线网
分享到:

——吕天文

    一、大数据市场规模与特征分析

    大数据产业是指对互联网、移动互联网、运营商等渠道产生的大量数据资源进行快速获取、收集存储、价值提炼、智能处理和分发,从而用于企业决策支持等方面的信息服务业。

    大数据全生命周期可以划分为”数据产生--数据采集--数据传输--数据存储--数据处理--数据分析--数据发布、展示和应用--产生新数据”等阶段。因此,大数据产业链主要包括数据源层、数据存储平台层、数据分析和挖掘层以及大数据应用层。大数据应用层主要分布在互联网、电信、金融、零售和政府等行业,和企业用户的业务更加结合得紧密,通过大数据分析实现商业智能(BI)、决策支持和用户需求挖掘等应用价值。

大数据产业链分析

图1 大数据产业链分析

数据来源: ICTresearch

    由于中国互联网业务规模和移动终端数量的快速增长,业务数据和交互信息的爆炸式增长,中国大数据应用开始进入发展元年,应用市场规模增长提速。根据ICTresearch的研究显示,2012年,中国大数据应用市场规模为4.5亿元,同比增长40.6%。

    表1 2010-2012年中国大数据应用市场规模与增长

2010-2012年中国大数据应用市场规模与增长

数据来源: ICTresearch

2010-2012年中国大数据应用市场规模与增长

图2 2010-2012年中国大数据应用市场规模与增长

数据来源: ICTresearch

    二、当前大数据相关政策分析

    大数据是一个具有国家战略意义的新兴产业,正受到政府的高度关注。2012年5月,国务院颁发了《”十二五”国家战略性新兴产业发展规划》,提出高端软件和新兴信息服务产业发展目标:加强以网络化操作系统、海量数据处理软件等为代表的基础软件、云计算软件、工业软件、智能终端软件、信息安全软件等关键软件的开发,推动大型信息资源库建设,积极培育云计算服务、电子商务服务等新兴服务业态,促进信息系统集成服务向产业链前后端延伸,推进网络信息服务体系变革转型和信息服务的普及,利用信息技术发展数字内容产业,提升文化创意产业,促进信息化与工业化的深度融合。在关键技术开发方面,开展移动智能终端软件、网络化计算平台与支撑软件、智能海量数据处理相关软件研发和产业化。

    2012年2月,工信部发布《物联网”十二五”发展规划》,把“加强处理技术研究”作为核心技术攻关之一,提出:重点支持适用于物联网的海量信息存储和处理,以及数据挖掘、图像视频智能分析等技术的研究,支持数据库、系统软件、中间件等技术的开发,推动软硬件操作界面基础软件的研究。将“信息处理技术”列为四项关键技术创新工程之一,包括海量数据存储、数据挖掘、图像视频智能分析。另外三项关键技术创新工程,包括信息感知技术、信息传输技术、信息安全技术,也是大数据产业的重要组成部分,与大数据产业发展密切相关。

    2013年,国务院发布《关于推进物联网有序健康发展的指导意见》,提出加快传感器网络、智能终端、大数据处理、智能分析、服务集成等关键技术研发创新,推进物联网与新一代移动通信、云计算、下一代互联网、卫星通信等技术的融合发展。重视信息资源的智能分析和综合利用,避免重数据采集、轻数据处理和综合应用。

    自2012年,国家已经陆续出台了与大数据应用相关的产业规划和政策,从不同侧面在推动大数据产业的发展。然而,专门针对大数据发展尤其是基于互联网应用的社交大数据的政策规划还没有。为了充分利用大数据的价值,中国大数据产业的发展需要上升到国家战略层面,特别需要从政策制定、资源投入、人才培养等方面给予强有力的支持。企业与相关的新兴产业和行业结合,通过相关产业的政策带动大数据产业的发展;另一方面是在国家政策的引导下,成立联盟、建立专业组织,引导大数据政策提出和产业环境的建立。

    三、当前主要技术发展趋势分析

    在目前大数据发展背景下,数据存储技术、处理技术、分析技术等在不断创新和完善,开放的技术平台和系统的发展主要呈现以下几方面的趋势:

    (1) 大数据的去冗降噪技术

    大数据一般都来自多个不同的源头,而且往往以动态数据流的形式产生。因此,大数据中常常包含有不同形态的噪声数据。另外,数据采样算法缺陷与设备故障也可能会导致大数据的噪声。大数据的冗余则通常来自两个方面:一方面,大数据的多源性导致了不同源头的数据中存在有相同的数据,从而造成数据的绝对冗余;另一方面,就具体的应用需求而言,大数据可能会提供超量特别是超精度的数据,这又形成数据的相对冗余。降低噪声、消除冗余是提高数据质量、降低数据存储成本的基础。

    (2) 大数据的新型表示方法

    目前,表示数据的方法不一定能直观地展现出大数据本身的意义。要想有效利用数据并挖掘其中的信息或知识,必须找到最合适的数据表示方法。数据表示方法和最初的数据产生者有着密切关系。如果原始数据有必要的标识,就会大大减轻事后数据识别和分类的困难。但标识数据会给用户增添麻烦,往往得不到用户认可。研究既有效又简易的数据表示方法是处理网络大数据必须解决的技术难题之一。

    (3) 高效率低成本的大数据存储

    大数据的存储方式不仅影响其后的数据分析处理效率也影响数据存储的成本。因此,需要研究多源多模态数据高质量获取与整合的理论和技术、流式数据的高速索引创建与存储、错误自动检测与修复的理论和技术、低质量数据上的近似计算的理论和算法等,实现高效率低成本的数据存储方式。

    (4) 非结构化和半结构化数据的高效处理

    目前,非结构化和半结构化数据在整个大数据中占有相当大的比重,而关系数据库系统的出发点是追求高度的数据一致性和容错性,因此,传统的关系数据库技术无法胜任这些数据的处理。系统的高扩展性是大数据分析最重要的需求,必须寻找高扩展性的数据分析技术。以MapReduce 和Hadoop为代表的非关系数据分析技术,以其适合非结构数据处理、大规模并行处理、简单易用等突出优势,在互联网信息搜索和其他大数据分析领域取得了重大进展,已成为大数据分析的主流技术。然而,MapReduce 和Hadoop 在应用性能等方面还存在不少问题,还需要研究开发更有效、更实用的大数据分析和管理技术来适应大数据分析方面的技术需求。

  • 1
  • 2
  • 3
  • 总3页
   免责声明:本文仅代表作者个人观点,与电源在线网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
本文链接:中国大数据行业分析与展望
http:www.cps800.com/news/48602.htm
  投稿热线 0755-82905460    邮箱  :news@cps800.com
关于该条新闻资讯信息已有0条留言,我有如下留言:
请您注意:
·遵守中华人民共和国的各项有关法律法规
·承担一切因您的行为而导致的法律责任
·本网留言板管理人员有权删除其管辖的留言内容
·您在本网的留言内容,本网有权在网站内转载或引用
·参与本留言即表明您已经阅读并接受上述条款
用户名: 密码: 匿名留言   免费注册会员
关键字:
        
按时间:
关闭