云原生分布式 PostgreSQL+Citus 集群在 Sentry 后端的实践

开发 前端
优化一个分布式系统的吞吐能力,除了应用本身代码外,很大程度上是在优化它所依赖的中间件集群处理能力。如:kafka/redis/rabbitmq/postgresql​/分布式存储(CephFS,JuiceFS,C urve,Longhorn)等集群的处理能力。

优化一个分布式系统的吞吐能力,除了应用本身代码外,很大程度上是在优化它所依赖的中间件集群处理能力。如:kafka/redis/rabbitmq/postgresql/分布式存储(CephFS,JuiceFS,C urve,Longhorn)等集群的处理能力。

分布式存储集群(Longhorn)

这里主要用于 Citus 集群的协调器(coordinator)和工作器(worker) 节点的数据持久化。

具体文档,请参阅:https://longhorn.io/

图片

图片

分布式 PostgreSQL 集群(Citus)

这里主要用于对 Sentry 事件源数据大表 nodestore_node 的分片。

具体文档,请参阅:

https://docs.citusdata.com/en/v11.1/

图片

读写分离和高可用(PgPool+Repmgr)

这里主要用于对 Citus 节点(协调器/工作器)进行读写分离和主备高可用。

具体文档,请参阅:

https://www.pgpool.net/docs/pgpool-II-4.2.3/en/html/example-kubernetes.html

https://repmgr.org/

图片

图片

管理集群节点(PgAdmin)

具体文档,请参阅:

https://www.pgadmin.org/

图片

nodestore_node 大表分片

选择分布式 key,并将表转换分布式表,这里将表划分为 64 个分片,数据平均分配到 6 台 worker 节点:

# 创建分布式表
SELECT create_distributed_table('nodestore_node', 'id', colocate_with => 'none', shard_count => 64);
# 平衡分片
SELECT rebalance_table_shards();
# 查询分片
SELECT * FROM citus_shards;

图片

总结

中间件集群基础设施建设,本身涉及细节较多,可以说是另一个领域。

本文提供了一种笔者的实践思路,抛砖引玉。

责任编辑:武晓燕 来源: 黑客下午茶
相关推荐

2022-03-24 14:11:25

KubernetesCitusPostgreSQL

2022-03-21 19:44:30

CitusPostgreSQ执行器

2022-03-21 06:45:22

PostgreSQL数据库Citus

2022-03-29 23:17:52

PostgreSQL集群Citus

2022-03-30 19:18:31

PostgreSQL分布式I/O

2022-03-06 21:43:05

Citus架构PostgreSQL

2022-03-31 19:20:39

集群PostgreSQLCitus

2022-03-17 18:52:41

PostgreSQ序列数据集群

2022-03-22 11:35:10

数据建模PostgreSQLCitus

2021-08-17 00:24:38

块存储云原生分布式

2022-03-27 06:37:37

SQLPostgreSQL集群

2022-03-16 19:15:32

PostgreSQL日志Kafka

2022-09-15 21:04:20

JuiceFS云原生

2022-03-28 13:13:58

分布列CitusPostgreSQ

2022-04-01 19:26:15

PostgreSQLCitus分布式

2022-03-15 19:19:04

分布式PostgreSQL集群

2022-03-14 19:40:40

PostgreSQL多租户应用程序Citus

2022-07-07 14:13:46

云原生数据库云平台

2021-08-17 12:36:21

Longhorn云原生存储
点赞
收藏

51CTO技术栈公众号