1.逻辑结构
MongoDB 与 MySQL 中的架构相差不多,底层都使用了可插拔的存储引擎以满足用户的不同需要。用户可以根据程序的数据特征选择不同的存储引擎,在最新版本的 MongoDB 中使用了 WiredTiger 作为默认的存储引擎,WiredTiger 提供了不同粒度的并发控制和压缩机制,能够为不同种类的应用提供了最好的性能和存储率。
在存储引擎上层的就是 MongoDB 的数据模型和查询语言了,由于 MongoDB 对数据的存储与 RDBMS有较大的差异,所以它创建了一套不同的数据模型和查询语言。
2.数据模型
2.1内嵌
内嵌的方式指的是把相关联的数据保存在同一个文档结构之中。MongoDB的文档结构允许一个字段或者一个数组内的值作为一个嵌套的文档。
主要适用于:
- 数据对象之间有包含关系 ,一般是数据对象之间有一对多或者一对一的关系 。
- 需要经常一起读取的数据。
- 有 map-reduce/aggregation 需求的数据放在一起,这些操作都只能操作单个 collection。
2.2引用
引用方式通过存储数据引用信息来实现两个不同文档之间的关联,应用程序可以通过解析这些数据引用来访问相关数据。
主要适用于:
- 当内嵌数据会导致很多数据的重复,并且读性能的优势又不足于覆盖数据重复的弊端 。
- 需要表达比较复杂的多对多关系的时候 。
- 大型层次结果数据集嵌套不要太深。
3.存储引擎
3.1 概述
存储引擎是MongoDB的核心组件,负责管理数据如何存储在硬盘和内存上。MongoDB支持的存储引擎有MMAPv1 ,WiredTiger和InMemory。
InMemory存储引擎用于将数据只存储在内存中,只将少量的元数据(meta-data)和诊断日志(Diagnostic)存储到硬盘文件中,由于不需要Disk的IO操作,就能获取所需的数据,InMemory存储引擎大幅度降低了数据查询的延迟(Latency)。
从MongoDB3.2开始默认的存储引擎是WiredTiger,3.2版本之前的默认存储引擎是MMAPv1. MongoDB4.x版本不再支持MMAPv1存储引擎。
3.2 WiredTiger存储引擎优势
- 文档空间分配方式
WiredTiger使用的是BTree存储;
MMAPv1使用的是线性存储; - 并发级别
WiredTiger使用文档级别锁;
MMAPv1使用表级锁; - 数据压缩
WiredTiger采用snappy (默认) 和 zlib 压缩表数据;
WiredTiger相比MMAPV1(无压缩) 空间节省数倍; - 内存使用
WiredTiger 可以指定内存的使用大小; - Cache使用
WiredTiger引擎使用了二阶缓存WiredTiger Cache, File System Cache来保证Disk上的数据的最终一致性;
MMAPv1 只有journal 日志;