Cloudera:定位混合数据公司,满足现代数据架构需求

原创
大数据
Cloudera定位于混合数据公司。提供适用于数据编织、数据湖库、数据网格和未来数据生态系统架构要求的混合数据平台,允许客户在多个公共和私有云以及本地访问和分析数据,使企业能够做出由数据驱动的明智决策,帮助企业建立由数据驱动的未来。

大数据时代已来,人们对大数据对经济社会起到的推动作用已经有了清晰的认知,数据的获取、分析、分享、技术人员等要素决定着大数据的应用是否顺畅,这些要素也组成了大数据生态系统。

当今,业界如何看待未来的数据生态系统架构呢?三种技术框架和方法论成为了大数据领域热度最高的词汇:Data Mesh、Data Fabric、Data Lakehouse。

未来数据生态系统的构想

 “数据网格”Data Mesh的想法是数据与产品思维的融合,其中的产品是指企业内部数据对外提供服务的方式。数据网格是一种范式转变,其中数据由业务中的不同域拥有和管理,数据由最了解数据的域拥有,随时可供企业内的任何其他域使用。数据网格范式基于四项原则:域主权,即去中心化;数据为产品;自助式数据平台;联合计算治理。

Gartner认为数据编织(Data Fabric)是一种跨平台的数据整合方式,它不仅可以集合所有业务用户的信息,还具有灵活且弹性的特点,使得人们可以随时随地使用任何数据。作为一种新兴的数据管理和处理方法,数据编织改进了数据仓库和数据湖的概念,引入了一个新的架构(网络状),使整个企业能够统一利用数据。数据编织使用基于网络的架构而不是点对点的连接来处理数据,实现了从数据源层面到分析、洞察力生成、协调和应用的一体化数据结构。

Gartner提出,随着数据变的越来越复杂,数据业务的加速发展,Data Fabric的终极目标是为了数据的集成和访问提供一种更灵活的,无缝的自动化方式。Data Fabric能够连接服务,让数据有灵活的集成方式,与其他系统进行构建。

Data Fabric提供自助服务,允许业务用户轻松发现数据资产,访问数据,实现主动人工智能,自下而上推广人工智能的方式,通过主动的原数据构建,让生命周期的每一个环节实现智能的数据治理。

湖仓一体(Data Lakehouse)是一种新型的开放式架构,打通了数据仓库和数据湖,将数据仓库的高性能及管理能力与数据湖的灵活性融合了起来,底层支持多种数据类型并存,能实现数据间的相互共享,上层可以通过统一封装的接口进行访问,可同时支持实时查询和分析,为企业进行数据治理带来了更多的便利性。湖仓一体,又称为数据湖仓,解决了数据仓库缺乏数据灵活性、实施和维护成本高的问题,又解决了数据湖商业智能和数据分析用例性能不佳和缺乏数据可靠性、安全性的痛点。

在企业内部,不同的角色会关注不同的方法论。CEO/CIO/CDO会关注如何在管理成本和维护人员规模的同时进行扩展,因此更关心数据网格的方法论。CTO/CSO的焦点则是如何做,用什么样的技术方案来保持一致性并构建标准模式,因而更加关注数据编织。对于领域从业者,则更为关注可以视为方法论的湖仓一体,他们将此看做工具,寻求在具体项目上的优化。

Gartner 提出,“未来的数据生态系统应该利用分布式数据管理组件 - 可以在多个云和/或本地运行 - 但应被视为具有高度自动化的紧密的整体。集成、元数据和治理功能将各个组件粘合在一起。“

Cloudera的混合数据定位

Cloudera定位于混合数据公司。提供适用于数据编织、数据湖库、数据网格和未来数据生态系统架构要求的混合数据平台,允许客户在多个公共和私有云以及本地访问和分析数据,使企业能够做出由数据驱动的明智决策,帮助企业建立由数据驱动的未来。

在平台能力方面,Cloudera的产品技术适应Data Lakehouse、Data Fabric、Data Mesh。在多云和本地部署上,都可以做到管理和分析。Cloudera的分析代码在一次编写之后,可以跨平台,在不同云、本地和私有云平台上运行,对于业务人员来说,可以在复杂环境中让代码方便的移植。

Cloudera通过SDX (共享数据体验)来提供集中的数据管控和处理。SDX能够真正帮助客户在新的形势下跨云,包括云原生、不同的存储中,做到数据统一的安全管控和治理。

Cloudera数据平台 - 支持现代数据架构

说到Cloudera的优势,Cloudera大中华区技术总监刘隶放指出, Cloudera会帮助客户建立数据驱动的文化,如果客户有Data Mesh跨域管理需求,Cloudera能从产品平台上能支持企业做数据驱动的转型。在此基础上,Cloudera可以从降本增效方面,帮助客户在最佳的形态下执行自己的数据分析需求,支持跨云和多云,包括本地私有云的部署。Cloudera也与大量合作伙伴做了开放性认证,可以支持开放的标准和互操作性,以最快的速度拉动企业的增长。

Cloudera大中华区技术总监刘隶放

刘隶放表示,从Cloudera的角度来看,未来数据平台会把边缘计算作为一个重要的方面。从算力的角度来说,没有必要把在边缘就可以处理的问题拿到本地,有些机器学习的处理模型在边缘就会处理掉。当然,对客户端等数据要进行脱敏和过滤等预处理和预判断,保障数据的安全性。未来的数据平台是云化和跨云的,无论客户选择何种部署,Cloudera都会尊重客户的选择。

责任编辑:赵立京 来源: 51CTO
相关推荐

2020-06-22 17:26:36

数据仓库数据数据库

2013-03-20 10:19:19

数据中心解决方案

2022-09-02 14:01:40

Cloudera大数据

2022-06-28 12:02:11

ClouderaCDP混合数据

2016-03-09 10:07:54

数据架构大数据即服务数据分析

2011-09-21 08:12:02

瞻博Terra数据中心

2016-02-25 14:40:01

云数据中心

2018-11-21 14:44:33

数据库容器数据架构

2018-03-09 12:00:02

数字化数据库容器

2021-01-15 11:40:38

混合数据湖数据湖数据

2020-03-06 16:04:10

DataOps数据分析数据质量

2024-03-21 15:54:00

数据堆栈数据管理数据结构

2014-11-07 10:04:56

混合存储IOPS

2016-02-18 10:27:39

数据

2015-07-01 09:58:28

大数据移动化开放云

2015-10-10 09:23:31

数据中心挑战创新

2017-03-16 09:24:31

数据集成业务

2023-05-03 21:47:22

2022-10-18 09:57:40

​​Cloudera混合数据CDP
点赞
收藏

51CTO技术栈公众号