我们生活在一个混合数据的世界中。在过去十年间,世界创建、捕获、复制和使用的结构化数据量已从2011年的不到1ZB增长到2020年的近14ZB,这已经很惊人了,但还有另外更巨大的50ZB数据——非结构化数据、云数据和机器数据。
到2025年,数据总量预计将增加近两倍,原因就是混合数据——这是企业组织在有运营的任何地方(云上、本地和边缘)创建的大量数据。只有一小部分创建的数据被实际存储和管理,分析师估计到2020年它会在4ZB到6ZB之间。显然,混合数据带来了巨大的机遇和严峻的挑战,要将这些潜能变现需要能够利用所有数据的价值,无论数据在哪里。
再来看下Cloudera
对于Cloudera来说,这是一个回到未来的时刻。大数据又是潮流了。作为向世界传授大数据价值的公司,我们心知肚明。就像九十年代的时尚又兜兜转转回来了,只是个时间问题不是吗?但这已经不是过去的大数据。它已经演变成一种新的东西—混合数据。当然,我们依然可以帮助您保护、管理和分析PB级的结构化和非结构化数据。我们在本地管理着近1ZB的数据—占全球总量的近20%。我们还可以管理您选择的公共云上的数据——AWS、Azure或GCP。而且,正如德勤所说:“混合云是事实上的模式”。
Cloudera是Gartner’s Cloud DBMS魔力象限分析中仅有的两位远见者之一。我们赢得了Gartner Peer Insights Cloud DBMS产品类的客户选择奖。此外,Cloudera DataFlow在GigaOm Radar for Streaming Data Platforms中获得了很高的分数。
领先的行业分析师对Cloudera的分析型和操作型数据用例评价比许多知名云供应商更高。这些分析师认为,我们在混合和多云分析解决方案方面的评级优于所有供应商。
在我们自己的企业数据成熟度研究中,对3,000多名IT和业务高层负责人进行了调查,我们发现40%的组织目前正在运行混合方式,但主要是在本地,36%的受访者预计将在未来18个月转向混合多云。同一项研究还显示,89%的IT决策者同意,将混合架构作为其数据战略的组织将获得竞争优势。
价值随数据而来
今天,我们在混合数据方面处于领先地位。Cloudera独特地赋能每个人都能够从任何云上的任何数据中获得实时洞察力,从而快速、明智地做出决策,从而缩短实现价值的时间。想要随时随地管理和分析所有类型的数据,包括机器数据、结构化数据、事务数据和非结构化数据?依靠Cloudera的能力使用混合数据平台跨越多云和本地。我们在整个数据生命周期中——数据分发、数据工程、数据仓库、事务数据、流数据、数据科学和机器学习——提供云原生数据分析,还具备跨基础架构移植性。Cloudera能够实现一次编写并在任何地方运行的多功能分析。
选择混合数据优先策略以更快地交付价值
企业组织现在可以通过现代数据架构提供混合数据平台,从而有可能将所有数据的价值变现。Cloudera Data Platform(CDP)旨在满足当今和未来现代数据架构的关键要求。
它是一个统一平台,具有可移植、可互操作的数据分析,适用于在公共云、本地和边缘运行的完整数据生命周期和分布式数据管理。通用的安全性、治理、元数据、复制和自动化使CDP能够作为一个集成的系统运行。这正是行业分析师对于数据编织、数据湖库、数据网格和未来数据生态系统架构所推荐的强制性要求。
随着大数据演变为云数据,现在又演变为混合数据,企业要访问数据、使用数据和从数据创造价值变得更加复杂。这就是现代数据架构(如数据湖库、数据编织和数据网格)的用武之地。这些新架构旨在解放IT团队来自动处理复杂性。由Cloudera SDX支撑的统一数据编织以自助服务的方式智能、安全地编排所有不同的数据源。现在,我们的客户能够获得对其所有数据的统一、可信和全面的视图。只有使用SDX,公司才能跨多个云和本地实现这个功能。
作为提供开放数据湖库的公司,我们能够跨多个云和本地的云原生对象存储中的流数据和存储数据进行多功能分析,使我们的客户能够自由选择。Cloudera优先考虑开放性和互操作性,这就是为什么我们在社区中积极参与Apache Iceberg项目作为我们的下一代表格式,使CDP客户在数据湖仓中能够使用他们所选择的分析工具。
对于希望能使用可扩展数据网格的企业组织,能够结合数据编织和数据湖库架构的元素将数据视为产品,我们提供拥有和发布数据产品的能力。Cloudera使企业组织能够以一致的安全、治理和编排的方式跨多云和本地实现这一目标。CDP的混合部署能力和集中治理对于实现想要的数据网格架构绝对是基础。能够提供安全、治理良好且可按需访问的数据才能推动增长。CDP能够提供现代数据架构的灵活性,因为它是为未来而构建的混合数据平台。事实上,CDP非常贴切Gartner在其《将数据管理迁移到云的战略路线图》中提供的指导[2022年3月21日发布-ID G00746011,分析师:Robert Thanaraj、Adam Ronthal、Donald Feinberg]
“未来的数据生态系统应该利用分布式数据管理组件——它们可以在多个云和/或本地运行——但需被视为具有高度自动化的一个紧密整体。集成、元数据和治理功能将各个组件粘合在一起。”
我们客户的回报是,CDP作为一个真正的混合数据平台,提供了一次写入、随处运行的功能,使数据应用程序的开发更快、更容易和更具成本效益。
以速度和控制推动增长
90%的业务高层决策者表示,如果他们能够更有效地管理数据,他们的组织将获得更多的创收机会。我们已经看到我们的客户使用CDP来拥抱现代数据架构并利用其混合数据的价值。一个很好的例子是HelloFresh正在做的事情。他们是世界上最大的餐包公司,拥有由少量内部和外部数据源组成的典型集中式数据管理设置。这是一种典型的竖井式数据管理方法。在经历了一段非凡的增长之后,该公司认识到数据将成为可以提供竞争优势的关键战略资产。他们与我们合作构建了一个数据网格,向组织的其他成员提供可信的数据产品。采用数据网格方法可实时提供干净、整合的数据,使云部署速度提高30%,并提高客户留存率。如今,数据网格已帮助公司消除了数据竖井,提供了数据产品为业务带来重大价值,例如能够监控错误率并提供动态配方建议的仪表板。
我们正在通过现代数据架构帮助许多客户利用他们的数据实现重要的商业价值。Regions Bank部署了基于Cloudera的数据编织作为新数据产品的基础,从而改善了客户体验,提高了效率,每年留存储蓄1000多万美元。德国电信正在使用基于Cloudera的数据湖库来支持AI/ML驱动的分析,进行欺诈检测和服务质量,他们实现了降低10%客户流失率,同时运营效率提高了50%。汇丰证券服务,得益于其数据网格实施,现在可以为其客户提供标准化的资产净值,无论源数据所在的会计系统、格式或数据结构。
只有12%的受访IT决策者表示,他们的组织与生命周期过程的所有阶段都有交互,这揭示了在组织如何利用其数据方面尚未开发的机会。我们的目标是让每个企业都能获得这样的优势,以更简单的方式更快地行动。Cloudera助力客户将混合数据战略变为现实。我们可以管理和分析任何形式的数据,无论是公共云还是私有云,还是在边缘。我们提供统一的安全和治理网格,以一致和统一的方式控制整个数据分析管道。我们的数据分析旨在提供一次写入、随处运行的云可移植性。我们可以以业内无可比拟的规模做到这一点。
未来是混合数据
我们的技术战略100%与现代数据架构行业专家的推荐一致——将多功能数据分析与安全和治理的数据管理相结合,用于混合和多云数据,以开源技术作为紧密的系统进行构建。我们仍然致力于实现让每个人都可以轻松访问数据和分析的愿景,以及我们成为混合数据领导者的使命。我们相信,数据可以让今天的不可能,在明天成为可能。让我们与您一起踏上混合数据之旅。