使用MongoDB进行分片

guwj
发布于 2022-11-23 11:43
浏览
0收藏

使用MongoDB进行分片-鸿蒙开发者社区


• 新部署是否适合进行分片?

• 在对集合进行分片后是否可以更改片键?

• 为什么文档没有分布到各个分片?

• mongos是如何检测到分片集群配置更改的?

• 日志中出现的writebacklisten是什么意思?

• mongos是如何使用连接的?


本文档回答了有关分片的常见问题。或者可以参考手册的分片章节,其提供了 分片的概述,包括如下细节:


• 片键和选择片键的注意事项

• 查询路由

• 高可用性

• 数据分块(Chunk)和数据块(Chunk)迁移过程

• ​​对分片集群进行故障排除​


新部署是否适合进行分片?

有时是适合的。但是,如果您的数据集适合放在单个服务器,则应该以非分片部署作为分开始,因为数据集很小,分片几乎没有优势。


在对集合进行分片后是否可以更改片键?

不可以。

MongoDB中没有对集合分片后更改片键的自动支持。这一现实情况强调了选择好的片键的重要性。如果在集合分片后必须更改片键,最佳选择是:

• 将MongoDB中的所有数据转储为外部格式。

• 删除原始分片集合。

• 使用更理想的片键配置分片。

• 预分割(pre-split)片键范围以确保初始均匀分布。

• 将转储的数据恢复到MongoDB中。

也可以参考:
​​​片键​


为什么文档没有分布到各个分片?

一旦数据块(chunk)的分布达到某个阈值,均衡器就开始在分片上迁移均衡数据。请参阅​​ 迁移阈值​​。


此外,如果块中的文档数超过一定数量,MongoDB将无法移动块。请参阅 ​​每个要迁移的块的最大文档数​​​和​​不可分割的块​​。


mongos是如何检测到分片集群配置更改的?

mongos实例维护​​配置数据库(config)​​​的缓存,该缓存包含​​分片集群​​的元数据。


mongos通过向分片发出请求并发现其元数据已过期来懒更新其缓存。要强制 mongos重新加载其缓存,可以对每个mongos 直接执行flushRouterConfig命令。


日志中出现的writebacklisten是什么意思?

回写监听器(writeback listener)是一个进程,它打开一个长轮询,在迁移之后从mongod或mongos将写入取回,以确保它们没有进入错误的服务器。如有必要,回写监听器会将写入发送回正确的服务器。


这些消息是分片的基础关键部分,不需要引起关注。

(译者理解:写入数据根据片键发送到对应分片mongod,但到达时发现对应chunk已经迁移到其他分片mongod了,回写监听器监听到这种情况,就会把数据取回到mongos,然后再发往正确的mongod。这一些列动作,对用户来说都是透明的,所以不用关注)


mongos是如何使用连接的?

每个mongos实例都维护一个与分片集群成员的连接池。客户端请求一次使用一个连接; 即请求不是多路复用或流水线化的。


客户端请求完成后,mongos将连接归回到连接池。当客户端数量减少时,这些池不会收缩。这可能导致未使用的mongos占用大量打开的连接。如果mongos不再使用,则可以安全地重新启动进程以关闭现有连接。


要返回mongos所使用的所有对外连接池相关的聚合统计信息,请将mongo shell 连接 到mongos,然后运行 connPoolStats命令:


db.adminCommand (“connPoolStats” );
请参阅​​​UNIX ulimit设置​​​ 文档的​​“ 系统资源利用率”​​部分。



文章转载自公众号: Mongoing中文社区



分类
标签
已于2022-11-23 11:43:29修改
收藏
回复
举报
回复
    相关推荐