日前,由中国电子学会主办,中国电子学会云计算专家委员会、中国云计算技术与产业联盟承办的“中国电子学会大数据与云计算专题研讨会”在京西宾馆召开。原信息产业部部长、中国电子学会名誉理事长吴基传,工业和信息化部总经济师、中国电子学会副理事长周子学等领导,以及中国科学院院士李未、中国电子学会云计算专家委员会主任委员、中国工程院院士李德毅等专家,围绕大数据挖掘、大数据与云计算的关系、大数据带来的技术和产业变革等话题展开讨论。
吴基传部长在发言中表示:“有人说云计算和大数据是一对孪生兄弟,我认为不要把这两者等同,云计算和大数据在我国的发展都处在发展初期,用户对其认知度还有一个过程。”
李未院士向与会嘉宾介绍了其牵头的非结构化数据四面体模型课题,该课题已经历时三年半,正在申请国际专利。所谓非结构化数据的四面体模型,即将非结构化数据分为原始数据、基本属性、底层特征、语义特征四个方面,目前课题组已经建立500万个非结构化数据样列,通过语义关联的方式进行数据查询和检索的实验。他认为非结构化数据标注与处理的工程量十分浩大,大数据的加工必须有群体的介入。
李德毅院士在发言中表示:“当前云计算的落地极为迫切且至关重要,可以先从关乎民生的五大应用入手,这五大应用包括位置云、教育云、健康云、安全云、社保云。而无论大数据还是云计算,其应用前提都是带宽的支持。”
作为企业代表,百度技术委员会理事长陈尚义也向与会嘉宾介绍了百度大数据面临的挑战及应对方法。据他介绍:“百度拥有的数据总量上百PB,且呈现高速增长的态势。这些数据中非结构化数据占据绝大份额,此外还包括百度自己产生的日志。”
现在用户对降低PUE(数据中心总设备能耗)的急迫性越来越高,据介绍,每降低0.1PUE,数据中心成本每年将节省1000万元。据陈尚义介绍:“百度PUE是1.3,我们的数据中心建设极其重视绿色、节能、降耗,而且自建的数据中心考虑了众多软硬件的配合问题,并且将资源进行动态调度和重新分配。”
友友CEO姚宏宇在发言中表示:“大数据分析具有较为典型的行业特征,其专家将产生于行业内部。”<