Google打造新大数据系统Mesa

数据库
Google最近发表了一篇有关大数据系统的论文,讨论了一个名为Mesa的数据仓库系统,它能处理近实时数据,即使在整个数据中心断线后还能正常工作。Google工程师将在下月于中国举行的超大型数据库会议上,提交一篇有关Mesa的论文。

 

[[117955]]

Mesa是什么

先行发布的论文摘要可以让我们对Mesa一窥究竟:

Mesa是一个高度可扩展的分析数据仓库系统,能存储与Google广告业务有关的关键测量数据。Mesa能满足复杂和具有挑战性的用户与系统需求,包括近实时数据提取和查询,同时在海量数据和查询量中保持高可用性、可靠性、容错率和扩展性。Mesa每秒能处理数百万行更新,每天进行数十亿查询抓取数万亿行数据。Mesa能进行跨数据中心复制,即使在整个数据中心故障时,也能以低延迟返回一致和可重复的查询结果。

本质上来说,Mesa是一个ACID式数据库(即,如果有人进行查询,就会得到相应数据),速度快,规模大,可靠性强。它被设计为处理与Google广告业务有关的需求(服务内部用户,以及消费者的前端查询服务),但也能作为一般数据仓库系统,供其他用途。

与其他产品有何区别

当然,Google早就拥有自己的数据系统,比如BigTable、Megastore、Spanner和F1。但BigTable无法提供必要的原子性;Megastore、Spanner和F1在跨区域数据上能保证一致性,却无法满足峰值更新吞吐量需求。当然,Mesa在元数据存储和维护上利用了之前的技术。

另外Google自身的Dremel,以及Facebook 与Twitter数据系统,一般只用作处理批量数据装载,而不是像 Mesa那样即时处理数据。而且,目前的商业产品或产品系统均不能用来管理跨数据中心的重复数据,这些系统也并非基于云技术,灵活性也不强。它们对动态条款和资源置换的适应性也很弱,无法处理数据负载波动。

不只是一个数据库

Mesa比较值得注意的一点是其硬件。之前的系统都使用价格昂贵的企业级硬件,但Mesa使用Google的标准云设施,均由自己设计和建立。

长期来看,Mesa不只是一个数据仓库系统。像Hadoop那样的社区也在密切关注Google的新动向,这可能会代表一波技术潮流。另外,从云计算角度看,这会加剧与亚马逊和微软云服务的竞争,进一步拉低市场价格。Google一直以高精尖技术闻名,这一次Mesa估计也会拉开其与同类公司的距离。

 

责任编辑:彭凡 来源: 雷锋网
相关推荐

2020-04-24 20:33:18

联通大数据

2009-08-17 08:37:31

2013-07-31 09:20:07

大数据引擎云计算个性化搜索

2021-08-11 15:49:34

大数据智慧城市大数据分析

2012-08-27 10:04:20

Google Drem

2012-05-03 10:48:43

Google大数据云计算

2015-08-25 10:56:21

大数据

2017-04-28 22:07:38

威海智慧健身大数据平台

2015-08-27 13:36:31

大数据

2020-09-11 11:10:38

云+数据

2011-10-14 09:36:20

DNA数据库

2013-05-07 14:56:27

大数据应用工具数据中心网络

2018-12-08 11:16:51

京东

2017-12-20 17:11:27

华为

2013-09-22 10:26:06

大数据大数据团队

2019-10-17 09:19:49

大数据智慧交通

2022-02-17 11:11:13

Chrome OSGoogle操作系统

2013-05-06 09:14:26

BigQuery大数据分析大数据分析入门

2015-08-04 15:46:00

点赞
收藏

51CTO技术栈公众号