Redis存储原理与数据模型-天翼云

Redis存储原理与数据模型

2024-12-05 08:49:57 阅读次数：19

Redis存储结构

存储转换

redis-value编码
- string
  - int：字符串长度小于等于20切能转成整数
  - raw：字符串长度大于44
  - embstr：字符串长度小于等于44
- list
  - quicklist（双向链表）
  - ziplist（压缩链表）
- hash
  - dict（字典）：节点数量大于512或者字符串长度大于64
  - ziplist（压缩链表）：节点数量小于等于512且字符串长度小于等于64
- set
  - intset（整数数组）：元素都为整数且节点数量小于等于512
  - dict（字典）：元素有一个不是整数或者数量大于512
- zset
  - skiplist（跳表）：数量大于128或者有一个字符串长度大于64
  - ziplist（压缩列表）：子节点数量小于等于128且字符串长度小于等于64

字典实现

redis中的KV组织是通过字典实现的；hash结构当节点超过512个或者单个字符串长度大于64时，hash结构采用字典实现。

数据结构

typedef struct dictEntry {
	void *key;
	union {
		void *val;
		uint64_t u64;
		int64_t s64;
		double d;
	} v;
	struct dictEntry *next;
} dictEntry;

typedef struct dictht {
	dictEntry **table;
	unsigned long size; // 数组长度
	unsigned long sizemask; // size - 1
	unsigned long used; // 当前数组中包含的元素
} dictht;

typedef struct dict {
    dictType *type;
    void *privdata;
    dictht ht[2];
    long rehashidx; /* rehashing not in progress if rehashidx == -1 */

int16_t pauserehash; /* If >0 rehashing is paused (<0 indicates coding error) 用于安全遍历*/ 
} dict;

字符串经过hash函数运算得到64位整数；
相同字符串多次通过hash函数得到相同的64位整数；
整数对2^n取余可以转化为位运算；
抽屉原理 n+1个苹果放在 n 个抽屉中，苹果最多的那个抽屉至少有 2 个苹果;64位整数远大于数组的长度，比如数组长度为 4，那么 1、5、9、1+4n 都是映射到1号位数组;所以大概率会发生冲突;

冲突

负载因子：负载因子=used/size；used是数字元素个数，size是数组长度；负载因子越小，冲突越小；负载因子越大，冲突越大；redis的负载因子是1；

扩容

如果负载因子>1，则会发生扩容；扩容的规则是翻倍；
如果正在fork(在rdb、aof复写以及rdb-aof混用的情况下)时，会阻止扩容；但是此时若负载因子>5，索引效率会大大下降，则马上扩容；这里涉及到写时复制原理

缩容

如果负载因子 < 0.1，则会发生缩容;缩容的规则是恰好包含 used 的 ;
恰好的理解:假如此时数组存储元素个数为 9，恰好包含该元素的就是，也就是 16;

渐进式rehash

当hashtable中的元素过多的时候，不能一次性rehash到th[1]；这样会长期占用redis，其他命令得不到相应；所以需要使用渐进式rehash；

rehash步骤

将ht[0]中的元素重新hash成64位整数，再对ht[1]长度进行取余，从而映射到ht[1];

渐进式规则

分治的思想，将rehash分到之后的每步增删改查的操作当中；
再定时器中，最大执行一毫秒rehash；每次步长100个数组槽位；
rehash阶段，不会发生扩容和缩容。

scan

scan cursor [MATCH pattern] [COUNT count] [TYPE type]

Redis存储原理与数据模型

采用高位进位加法的遍历顺序，rehash 后的槽位在遍历顺序上是相邻的;
遍历目标是:不重复，不遗漏 ;
会出现一种重复的情况:在 scan 过程当中，发生两次缩容的时候，会发生数据重复;

expire机制

expire key seconds
pexpire key milliseconds
ttl key
pttl key

惰性删除

分布在每一个命令操作时检查key是否过期；若过期删除key，再进行命令操作；

定时删除

在定时器中检查库中指定个数（25）个key；

#define ACTIVE_EXPIRE_CYCLE_KEYS_PER_LOOP 20 /* Keys for each DB loop.
/* Keys for each DB loop. */
    
/*The default effort is 1, and the maximum configurable effort is 10. */

config_keys_per_loop = 
ACTIVE_EXPIRE_CYCLE_KEYS_LOOP + ACTIVE_EXPIRE_CYCLE_KEYS_LOOP/4*effort,
int activeExpireCycleTryExpire(redisDb *db, dictEntry *de, long long now);

大KEY

在 redis 实例中形成了很大的对象，比如一个很大的 hash 或很大的 zset，这样的对象在扩容的时候，会一次性申请更大的一块内存，这会导致卡顿;如果这个大 key 被删除，内存会一次性回收，卡顿现象会再次产生;
如果观察到redis内存大起大落，极有可能是大key导致的；

# 每隔0.1秒，执行100条scan命令
redis-cli -h 127.0.0.1 --bigkeys -i 0.1

活动

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

Redis存储原理与数据模型

Redis存储原理与数据模型

Redis存储结构

存储转换

字典实现

数据结构

冲突

扩容

缩容

渐进式rehash

rehash步骤

渐进式规则

scan

expire机制

惰性删除

定时删除

大KEY

相关文章

【C++动态规划 前缀树】3291. 形成目标字符串需要的最少字符串数 I|2081

【C++动态规划 数位dp】2376. 统计特殊整数|2120

【C++动态规划 】2771. 构造最长非递减子数组|1791

【C++ 无限循环】1625. 执行操作后字典序最小的字符串|1992

【C++动态规划】2466. 统计构造好字符串的方案数|1694

【贡献法 组合数学】2063. 所有子字符串中的元音|1663

基础—常用数据结构：列表、元祖、集合、字典、函数等（爬虫及数据可视化）

shell编程（编写、执行，shell变量、传参、字符串、运算符使用）

Python&Java双语解决力扣必刷算法 10. 正则表达式匹配

JavaScript 中的 Math 对象与字符串操作详解

作者介绍

最新文章

MYSQL中的数据类型（如果想知道MYSQL中有关数据类型的知识，那么只看这一篇就足够了！）

【redis】redis缓存穿透及解决方案|缓存穿透，缓存击穿，雪崩的理解

揭秘Redis底层：如何构建高性能内存数据库？

Nginx第二天学习笔记-Nginx的负载均衡

每日学习一个数据结构-Ziplist压缩表

对话AI-Redis原理相关

热门文章

Redis持久化存储策略（RDB、AOF）

查看Redis的默认设置的过期策略和内存淘汰机制

洞察异常的本质-记一次异常排查

Redis【Redis集群（哨兵监控环境搭建、哨兵工作原理详解、故障转移、Cluster模式概述、Cluster模式搭建、Cluster模式原理分析）】(六)-全面详解（学习总结---从入门到深化）

Redis入门

【Redis】String 类型基本使用

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

Redis【Redis集群（哨兵监控环境搭建、哨兵工作原理详解、故障转移、Cluster模式概述、Cluster模式搭建、Cluster模式原理分析）】(六)-全面详解（学习总结---从入门到深化）

Redis数据持久化的两种方式

Linux：redis集群（3.*版本 和 5.*版本）搭建方法

redis主从+哨兵搭建

[redis] redis配置中的save引起rdb快照生成的规则

Redis持久化存储策略（RDB、AOF）

【C++动态规划前缀树】3291. 形成目标字符串需要的最少字符串数 I|2081

【C++动态规划数位dp】2376. 统计特殊整数|2120

【C++动态规划】2771. 构造最长非递减子数组|1791

【贡献法组合数学】2063. 所有子字符串中的元音|1663

Linux：redis集群（3.版本和 5.版本）搭建方法