ThinkChat🤖让你学习和工作更高效,注册即送10W Token,即刻开启你的AI之旅 广告
[TOC] # 和mysql比较 ![](https://box.kancloud.cn/6ec6c8fed2902daeacaf38f2949a10d4_1120x688.png) # 整体存储架构 * mongod: 单机版数据库 * Replica Set: 复制集,由多个mongod组成的高可用存储单元 * Sharding: 分布式集群,由多个Replica Set组成的可扩展集群 ![](https://box.kancloud.cn/aa39bddfb235ede20a1b010284b44256_1022x599.png) * 默认采用WiredTiger高性能存储引擎 * 基于journaling log宕机恢复(类比mysql的redo log) **Replica Set架构** 一主多从 ![](https://box.kancloud.cn/c34f71e3890e078204f8842478cc20c7_776x661.png) * 至少三个节点,其中1个可以只充当arbiter(只投票不存储) * 主从基于oplog复制同步(类比mysql binlog) * 客户端默认读写primary节点 **sharding架构** 分片 有路由层,把写入分配到分片节点 有配置信息服务,记录元信息,那个key在那个shard ![](https://box.kancloud.cn/4b3f1a071da2dbdc106b0c146b75f80c_909x637.png) * mongos作为代理,路由请求到特定shard * 3个mongd节点组成config server,保存数据元信息 * 每个shard是一个replica set,可以无限扩容 **collection分片** ![](https://box.kancloud.cn/060fe1f799c0c42eba9164724a175337_1096x596.png) * collection自动分裂成多个chunk * 每个chunk被自动负载均衡到不同的shard * 每个shard可以保证其上的chunk高可用 **按range拆分chunk** ![](https://box.kancloud.cn/2c0c08cdfbee16a3d3e74fb98c7fa33a_1449x477.png) 如果按照时间划分的话,有个是热点的时间的话,那有个chunk是热点chunk * shard key可以是单索引字段或者联合索引字段 * 超过16MB的chunk一分为二 * 一个collection的所有chunk首尾相连,构成整个表 **按hash拆分chunk** ![](https://box.kancloud.cn/70b1507ced31521586d57fb25ccf71ca_1528x519.png) 把字段hash成hash值 % 到数量 * 要求是shard key必须是哈希索引字段,不允许对hash索引建立唯一值 * 经过hash可以打散,避免写热点 * 支持预分配chunk,避免运行时分裂影响写入 # 重要提示 **按非shard key查询,请求被扇出给所有shard,会广播出去**