云服务器网:购买云服务器和VPS必上的网站!

redis中的数据结构和编码详解

redis中的数据结构和编码:背景:1>redis在内部使用redisObject结构体来定义存储的值对象。2>每种类型都有最少两种内部编码,Redis会根据当前值的类型和长度来决定使用哪一种编码实现。3>编码类型转换在Redis写入数据时自动完成,这个转换进

redis中的数据结构和编码:

背景:

  • 1>redis在内部使用redisObject结构体来定义存储的值对象。
  • 2>每种类型都有最少两种内部编码,Redis会根据当前值的类型和长度来决定使用哪一种编码实现。
  • 3>编码类型转换在Redis写入数据时自动完成,这个转换进程是不可逆的,转换规则只能从小内存编码向大内存编码转换。

源码:

值对象redisObject:

typedef struct redisObject {
unsigned type:4; /* 对象类型 */
unsigned encoding:4; /* 内部编码 */
unsigned lru:LRU_BITS; /* lru time (relative to server.lruclock) */
int refcount; /* 援用计数器,内存回收机制就是基于该值实现的 */
void *ptr; /* 若要存储的是整数值则直接存储数据,否则表示指向数据的指针 */
} robj;

类型type:

说明:查看当前键的类型:type key

#define OBJ_STRING 0 /*字符串对象*/
#define OBJ_LIST 1 /*列表对象*/
#define OBJ_SET 2 /*集合对象*/
#define OBJ_ZSET 3 /*有序集合对象*/
#define OBJ_HASH 4 /*哈希对象*/

编码encoding;

说明:查看当前键的编码:object encoding key

#define OBJ_ENCODING_RAW 0 /*Raw representation 简单动态字符串*/
#define OBJ_ENCODING_INT 1 /*Encoded as integer long long类型整数*/
#define OBJ_ENCODING_HT 2 /* Encoded as hash table 字典*/
#define OBJ_ENCODING_ZIPMAP 3 /* Encoded as zipmap 紧缩map*/
#define OBJ_ENCODING_LINKEDLIST 4 /* Encoded as regular linked list 双端链表*/
#define OBJ_ENCODING_ZIPLIST 5 /* Encoded as ziplist 紧缩列表*/
#define OBJ_ENCODING_INTSET 6 /* Encoded as intset 整数集合*/
#define OBJ_ENCODING_SKIPLIST 7 /* Encoded as skiplist 跳跃表*/
#define OBJ_ENCODING_EMBSTR 8 /* Embedded sds string encoding embstr编码的简单动态字符串*/
#define OBJ_ENCODING_QUICKLIST 9 /* 基于紧缩列表的双端列表实现的 快速表*/

最后被访问的时间lru:

概念:记录对象最后一次被访问的时间。
说明:
1>查看当前键的空闲时间(该命令不会更新lru字段);object idletime key 。可以通过scan + object idletime key 来搜集长时间未被访问的数据,然后手动清算。
2>当配置了maxmemory和maxmemory-policy=volatile-lru或allkeys-lru时,若内存超过了上限(maxmemory)后,则优先回收长时间没有被访问的数据,从而回收内存。

援用计数器refcount:

概念:记录当前对象被援用的次数,当refcount=0时,可以安全回收当前对象空间。
说明:获得当前对象援用:object refcount key

类型对应的编码:

字符串:
int:寄存整形值的字符串。
embstr:寄存字符的短字符串(大小不超过44个字节)。
raw:寄存字符的长字符串(大小不超过44个字节)。

embstr和raw的比较:
raw调用2次内存分配函数,释放时固然也需要释放两次。
embstr调用1次内存分配函数,分配一块连续的内存,释放时只需释放一次。

列表(list):

紧缩列表(ziplist):
结构:所有数据都是采取线性连续的内存结构(大致可类比数组),目的是为了减少内存的占用,寻求空间和时间的平衡。
1>以O(1)时间复杂度入队和出队。
2>读写操作触及复杂的指针移动,最坏时间复杂度为O(n2),故列表的元素不容易太多。
3>新增删除操作触及内存重新分配,加大了操作的复杂性。

优点:占用内存较少,且占用的是一块连续的内存,故加载的速度相对更快一些。
缺点:当元素的个数较大时,访问元素的时间较长。

利用:

合适存储小对象和长度有限(即便O(n2)的复杂度也不会太大)的数据。
当元素个数小于list-max-ziplist-entries(默许512) 且 所有元素值的大小都小于list-max-ziplist-value(默许64字节)时,使用ziplist作为列表的内部实现。

双端链表(linkedlist):

优点:元素的个数较多时,访问元素的时间比紧缩列表更快一些。
缺点:由于是双向链表,故保护了前置指针、后置指针等结构,占用了更多的内存,且内存不是连续的,容易产生内存碎片。
说明:当没法满足ziplist的条件时,使用linkedlist作为列表的内部实现。
利用:当列表对象元素较多时,紧缩列表就会转化为更合适存储大量元素的双端链表。

注意:只能小内存编码向大内存编码转换。(若当元素增删频繁时,数据向紧缩编码转换是非常消耗CPU的,得不偿失)

快速列表(quicklist):

结构:一个双向链表,链表的每个节点都是一个ziplist,故quicklist结合了双向链表和紧缩列表的优点。
Redis3.2开始,列表采取quicklist进行编码。

哈希(hash):

紧缩列表(ziplist):

利用:当元素个数小于hash-max-ziplist-entries(默许512) 且 所有元素value的大小都小于hash-max-ziplist-value(默许64字节)时,使用ziplist作为哈希的内部实现。

哈希表(hashtable):

优点:读写时间复杂度O(1)
缺点:占用内存较多。
利用:当没法满足ziplist的条件时,hashtable作为哈希的内部实现。

hash算法:与传统hash算法类似,根据key计算得到在哈希表中的位置,采取单链表解决冲突,到达加载因子时进行扩大,进而引发重哈希。

rehash:采取增量式重哈希:

概念:在扩容时不会一次性对所有的key进行rehash,而是将key的rehash操作分散延迟到其它操作(哈希表的查找、更新、删除)中。
优点:避免由于大量的key在同一时间段进行rehash操作致使服务短暂无响应的问题。
进程:在增量式的rehash进程中,会使用到两张哈希表:
查找:先从老表中查找,再重新表中查找,另外还会对一些key进行rehash操作。
新增:新增的键值对添加到新表中。

集合(set):

整数集合(intset):
结构:有序、不重复的整数集。
1>查找时间复杂度为O(logn)
2>插入时间复杂度为O(n)
优点:占用的内存远小于hashtable,
利用:当元素都是整数 且 元素个数小于set-max-intset-entries(默许512)时,使用intset作为集合的内部实现。

哈希表(hashtable):当没法满足intset的条件时,使用hashtable作为集合的内部实现。

有序集合(zset):

说明:redis给有序集合中的每一个元素设置一个分数(score)作为排序的根据。

紧缩列表(ziplist):
利用:当元素个数小于zset-max-ziplist-entries(默许128个) 且 每一个元素的值都小于zset-max-ziplist-value(默许64字节)时,使用ziplist作为有序集合的内部实现。

跳跃表(skiplist):
结构:跳跃表通过在每一个节点中(基于层和跨度等)保持多个指向其它节点的指针来实现快速访问。
查找时间复杂度平均O(logn)、最坏O(n)。
利用:当不满足ziplist条件时,使用skiplist作为内部实现。

内存优化:

场景:有海量key和value都比较小的数据,在redis中如何存储才更省内存。
原理:通过大幅减少key的数量来下降内存的消耗。
实现:在客户端通过分组将海量的key根据一定的策略映照到一组hash对象中,由于value较小,故hash类型的对象会使用占用内存较小的ziplist编码。
eg:如存在100万个键,可以映照到1000个hash中,每一个hash保存1000个元素。

本篇文章到此结束,如果您有相关技术方面疑问可以联系我们技术人员远程解决,感谢大家支持本站!

本文来源:https://www.yuntue.com/post/153851.html | 云服务器网,转载请注明出处!

关于作者: yuntue

云服务器(www.yuntue.com)是一家专门做阿里云服务器代金券、腾讯云服务器优惠券的网站,这里你可以找到阿里云服务器腾讯云服务器等国内主流云服务器优惠价格,以及海外云服务器、vps主机等优惠信息,我们会为你提供性价比最高的云服务器和域名、数据库、CDN、免费邮箱等企业常用互联网资源。

为您推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注