分布式数据库选型问题有知道的吗?

各位大神,我有个需求,每年接受第三方推送至少 2T 的数据,第三方数据源是 oracle,未来的每年数据增长量可能会更多,偏 OLAP,对事务暂时没什么要求,最好是可以横向扩展的分布式数据库,还有增量、全量复制,运维简单,就我一个人。我初步考察了一下 greenplum,clickhouse,cassandra,doris,tidb,oceanbase,citus 等,眼花缭乱,个人比较偏向 citus,比较灵活,从 pg 转到 citus,学习成本也低一些,大神们觉得 citus 有什么坑,或者有什么更好的建议还请不吝赐教。

分布式数据库
数据源
citus
2022-06-21 13:23:19
浏览
收藏 0
回答 1
待解决
回答 1
按赞同
/
按时间
爱消失的柴郡猫
2

对分布式没有需求,或者需要在节点间大量交换数据的场景,不适合使用Citus,例如:

1.单节点PostgreSQL就能满足的场景,没有必要分布式;
2.离线分析场景,对查询分析的实时性没有太高要求;
3.不需要支持大量并发用户的分析场景;
4.需要返回大量数据的ETL查询场景;
 

“每年接受第三方推送至少2T的数据”,如上所述,Citus不支持大数据量的IO操作。

一次数据量在TB级,建议是:EKL,清洗了再入DB集群。

PB级,建议是:Hadoop+Hive+HBase。

GB级,就个DB集群就可以了。

如果不需要关系型查询,时序数据库也可以。

如果数据类型是图,那就图形数据库了。

分享
微博
QQ
微信
回复
2022-06-21 14:42:13
相关问题
求解分布式数据库使用问题?
2453浏览 • 1回复 待解决
分布式数据库疑惑有懂
1189浏览 • 1回复 待解决
关于鸿蒙分布式数据库key疑问
4094浏览 • 1回复 待解决
数据库主键字段问题有知道?
1048浏览 • 1回复 待解决
关系型数据库有知道
899浏览 • 1回复 待解决
如何做数据库搜索有知道
1110浏览 • 1回复 待解决
关于处理数据库时分层有知道
1220浏览 • 1回复 待解决
求解Redis 分布式问题
2037浏览 • 1回复 待解决
求教大神,分布式软总线流程问题
9011浏览 • 1回复 已解决
分布式数据管理没有了吗?
1195浏览 • 1回复 待解决
spark 分布式数据到oracle
459浏览 • 1回复 待解决
分布式是怎么启用
3386浏览 • 1回复 待解决
Redis 模板分布式
1256浏览 • 1回复 待解决
Harmonyos 分布式迁移失败
1208浏览 • 0回复 待解决
鸿蒙系统是如何实现分布式
11220浏览 • 2回复 待解决
提问
该提问已有0人参与 ,帮助了0人