Redis 中的底层数据结构(7)——跳跃表(zskiplist)
本文将详细说明 Redis 中跳跃表的实现。
在 Redis 源码(这里使用 3.2.11 版本)中,跳跃表的实现在 server.h(2.8 版本之前是 redis.h)中的 zskiplist 结构和 zskiplistNode 结构,以及 t_zset.c 中所有以 zsl 开头的函数。
# 跳跃表概述
Redis 使用跳跃表来作为 zset 的底层数据结构。跳跃表是一种随机化的数据结构,其内部是多个链表的并联。在插入、查找、删除等操作上都有不错的效率,而且实现起来比红黑树要简单。
/* ZSET(有序集合)使用的特殊版本的跳跃表 */
// 有序集合跳跃表节点结构
typedef struct zskiplistNode {
robj *obj; // 节点数据对象,指向一个sds字符串对象
double score; // 节点分值,跳跃表中的所有节点都按照分值从小到大排序
struct zskiplistNode *backward; // 前置节点
struct zskiplistLevel {
struct zskiplistNode *forward; // 后置节点
unsigned int span; // 该层跨越的节点数量
} level[]; // 跳跃表层结构,一个zskiplistLevel数组
} zskiplistNode;
// 有序集合跳跃表结构
typedef struct zskiplist {
struct zskiplistNode *header, *tail; // 跳跃表表头节点指针和表尾节点指针
unsigned long length; // 跳跃表的长度,即跳跃表当前的节点数量(表头节点不算在内)
int level; // 当前跳跃表中层数最大的节点的层数(表头节点的层数不算在内)
} zskiplist;
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
解释一下zskiplist
:
header:跳跃表头节点指针,跳跃表头节点是一个特殊的节点,它不保存实际分值和对象,它的 level 数组长度为 32。 tail:跳跃表尾节点指针,跳跃表尾节点是一个真实的节点,这点和头节点不同。 length:跳跃表长度,即跳跃表当节点数量,不包括表头节点。 level:跳跃表当前节点中的最大层数,不包括表头节点。
再看看zskiplistNode
:
obj:节点保存的对象,是一个 sds 字符串对象。
score:节点分值,跳跃表中所有节点都按照分值从小到大排序。
backward:指向前驱节点。
level[]:zskiplistLevel
结构体的数组,数组中的每个zskiplistLevel
元素称为“层”。每层中保存了后继节点的指针forward
和一个span
,span
表示当前节点到forward
指向的后继节点之间需要跨越多少个节点。
Redis zskiplist 的数据结构示意图:
跳跃表查找的原理:
unsigned long zslGetRank(zskiplist *zsl, double score, robj *o) {
zskiplistNode *x;
unsigned long rank = 0;
int i;
x = zsl->header;
for (i = zsl->level-1; i >= 0; i--) {
while (x->level[i].forward &&
(x->level[i].forward->score < score ||
(x->level[i].forward->score == score &&
compareStringObjects(x->level[i].forward->obj,o) <= 0))) {
rank += x->level[i].span;
x = x->level[i].forward;
}
/* x might be equal to zsl->header, so test if obj is non-NULL */
if (x->obj && equalStringObjects(x->obj,o)) {
return rank;
}
}
return 0;
}
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
以上图为例,跳跃表中有 4 个节点,score 分别为 1,2,3,4。假设现在我想查询 score 为 3,obj 为"c"的节点在跳跃表中的排名。Redis 会从 level[]从后往前遍历,也就是从跳跃表当前的最大层数向最小层数遍历。从头节点出发,首先遍历第 5 层,直接找到 score 等于 4 的节点,但这个节点并不满足x->level[i].forward->score < score
这个条件,因此跳过这层。接着还是从头节点触发遍历第 4 层,首先来到 score=2 的节点,这个节点满足 while 循环的条件,因此 rank 加上上一个节点到 score 为 2 这个节点的 span,值为 2,且 x 当前指向 score 为 2 这个节点。在第 4 层继续查找,来到 score 为 4 的节点,还是不满足x->level[i].forward->score < score
这个条件,第 4 层查找接触。此时从 score 为 2 这个节点的第 3 层开始查找,下一个节点来到 score 为 3 的节点,这个节点满足 while 循环的条件,rank 加上 score 为 2 的节点在第 3 层的 span 值,为 1,此时 rank 值等于 3,而且 score 为 3 这个节点不但 score 相等,obj 成员也相等,我们找到了我们想要的节点了,它在跳跃表中的排名是 3。
需要特别说明的是,由于头节点的存在,跳跃表排名是从 1 开始的,要注意这和数组下标以 0 开始的区别。
上面的跳跃表查找过程图示如下:
# 跳跃表实现
zslCreateNode
函数创建有序集合跳跃表节点。
zskiplistNode *zslCreateNode(int level, double score, robj *obj) {
// level为跳跃表节点的层数
zskiplistNode *zn = zmalloc(sizeof(*zn)+level*sizeof(struct zskiplistLevel));
zn->score = score; // 设置节点分值
zn->obj = obj; // 设置节点数据
return zn;
}
2
3
4
5
6
7
zslCreate
函数创建有序集合跳跃表。
zskiplist *zslCreate(void) {
int j;
zskiplist *zsl;
zsl = zmalloc(sizeof(*zsl));
zsl->level = 1; // 初始化时,节点的最大层数只有1
zsl->length = 0; // 初始化时,跳跃表中没有节点,长度为0
// 创建表头节点,表头的level为32
zsl->header = zslCreateNode(ZSKIPLIST_MAXLEVEL,0,NULL);
// 初始化表头节点的各层,初始化后置节点为NULL,跨度为0
for (j = 0; j < ZSKIPLIST_MAXLEVEL; j++) {
zsl->header->level[j].forward = NULL;
zsl->header->level[j].span = 0;
}
zsl->header->backward = NULL; // 表头节点的前置节点为NULL
zsl->tail = NULL; // 初始化时表尾节点为NULL
return zsl;
}
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
zslFreeNode
函数释放有序集合跳跃表节点。
void zslFreeNode(zskiplistNode *node) {
decrRefCount(node->obj); // 减少节点数据对象的引用计数
zfree(node);
}
2
3
4
zslFree
函数释放有序集合跳跃表。
void zslFree(zskiplist *zsl) {
zskiplistNode *node = zsl->header->level[0].forward, *next;
zfree(zsl->header); // 释放表头
while(node) { // 遍历跳跃表,释放所有节点
next = node->level[0].forward;
zslFreeNode(node);
node = next;
}
zfree(zsl); // 释放跳跃表
}
2
3
4
5
6
7
8
9
10
11
zslRandomLevel
函数在创建新跳跃表节点时,为它设置一个随机的层数。此函数的返回值介于 1 到 ZSKIPLIST_MAXLEVEL(32)之间(包含 1 和 32)。采用幂率分布的方式,获得越高层级的 level 概率越低。
int zslRandomLevel(void) {
int level = 1;
// 每次有0.25的概率对level+1
while ((random()&0xFFFF) < (ZSKIPLIST_P * 0xFFFF))
level += 1;
return (level<ZSKIPLIST_MAXLEVEL) ? level : ZSKIPLIST_MAXLEVEL;
}
2
3
4
5
6
7
zslInsert
函数在有序集合跳跃表中插入一个节点,节点的分值为 score,数据对象为 obj。
zskiplistNode *zslInsert(zskiplist *zsl, double score, robj *obj) {
// update数组用来存放新节点在跳跃表每一层的前置节点
zskiplistNode *update[ZSKIPLIST_MAXLEVEL], *x;
unsigned int rank[ZSKIPLIST_MAXLEVEL];
int i, level;
serverAssert(!isnan(score));
x = zsl->header; // 跳跃表头节点
// 遍历各层寻找新节点的插入位置
for (i = zsl->level-1; i >= 0; i--) {
/* 大于当前跳跃表节点最大层数的层(这些层没有数据),rank值为0 */
rank[i] = i == (zsl->level-1) ? 0 : rank[i+1];
/* 如果当前节点的后置节点存在且给定的score大于当前节点的后置节点的score,
* 或给定的score等于当前节点的后置节点的score且给定的obj等于当前节点的后置节点的obj,
* 将当前节点的span值加到当前层的rank上,且更新x指向当前层的下一个节点。 */
while (x->level[i].forward &&
(x->level[i].forward->score < score ||
(x->level[i].forward->score == score &&
compareStringObjects(x->level[i].forward->obj,obj) < 0))) {
rank[i] += x->level[i].span; // 记录在该层跨越了多少节点
x = x->level[i].forward; // 移动到后置节点
}
update[i] = x; // 获得新节点在跳跃表每一层的前置节点
}
/* we assume the key is not already inside, since we allow duplicated
* scores, and the re-insertion of score and redis object should never
* happen since the caller of zslInsert() should test in the hash table
* if the element is already inside or not. */
level = zslRandomLevel(); // 随机获取一个值作为新节点的层数
/* 如果层数大于跳跃表节点中最大的层数,初始化表头节点中那些未使用的层(共level - zsl->level个),
* 设置其rank为0,设置其span为跳跃表长度(因为表头节点的层指针直接就指向表尾节点的相应层,接着就指向NULL了,
* 相当于跨越了整个跳跃表)
* */
if (level > zsl->level) {
for (i = zsl->level; i < level; i++) {
rank[i] = 0;
update[i] = zsl->header;
update[i]->level[i].span = zsl->length;
}
zsl->level = level; // 更新跳跃表的level属性
}
x = zslCreateNode(level,score,obj); // 创建一个新节点
// 遍历新节点的所有层,建立该节点在每个层在跳跃表中的前后关系
for (i = 0; i < level; i++) {
x->level[i].forward = update[i]->level[i].forward; // 建立新节点和后置节点的关系
update[i]->level[i].forward = x; // 建立新节点和前置节点的关系
/* 更新新节点的span以及它的后置节点的span */
x->level[i].span = update[i]->level[i].span - (rank[0] - rank[i]);
update[i]->level[i].span = (rank[0] - rank[i]) + 1;
}
/* 由于新节点中从level到zsl->level层的存在,它的前置节点相应层的span需要+1 */
for (i = level; i < zsl->level; i++) {
update[i]->level[i].span++;
}
// 设置新节点的前置节点
x->backward = (update[0] == zsl->header) ? NULL : update[0];
if (x->level[0].forward)
x->level[0].forward->backward = x; // 新节点有后置节点,设置它后置节点的前置节点为它自己
else
zsl->tail = x; // 新节点没有后置节点,它就是尾节点
zsl->length++; // 更新跳跃表节点数量
return x;
}
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
zslDeleteNode
函数是 zslDelete、zslDeleteByScore 和 zslDeleteByRank 函数内部使用的函数,删除一个指定的跳跃表节点。
void zslDeleteNode(zskiplist *zsl, zskiplistNode *x, zskiplistNode **update) {
// zsl为跳跃表,x为要删除的节点,update为指向保存在每一层中要删除节点的前置节点的数组
int i;
// 更新删除点上每一层的的节点关系和跨度
for (i = 0; i < zsl->level; i++) {
if (update[i]->level[i].forward == x) {
update[i]->level[i].span += x->level[i].span - 1;
update[i]->level[i].forward = x->level[i].forward;
} else {
update[i]->level[i].span -= 1;
}
}
// 更新被删除节点的前置和后置指针
if (x->level[0].forward) {
x->level[0].forward->backward = x->backward;
} else {
zsl->tail = x->backward;
}
// 更新跳跃表的最大层数
while(zsl->level > 1 && zsl->header->level[zsl->level-1].forward == NULL)
zsl->level--;
zsl->length--; // 跳跃表节点数量-1
}
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
zslDelete
函数从有序集合跳跃表中删除一个具有指定 score 和 object 的节点。
int zslDelete(zskiplist *zsl, double score, robj *obj) {
zskiplistNode *update[ZSKIPLIST_MAXLEVEL], *x;
int i;
x = zsl->header; // 表头节点
for (i = zsl->level-1; i >= 0; i--) {
while (x->level[i].forward &&
(x->level[i].forward->score < score ||
(x->level[i].forward->score == score &&
compareStringObjects(x->level[i].forward->obj,obj) < 0)))
x = x->level[i].forward;
update[i] = x; // 获得指定节点在跳跃表每一层的前置节点
}
/* 可能有多个节点具有相同的分值,需要找到分值和对象都相等的节点。 */
x = x->level[0].forward;
if (x && score == x->score && equalStringObjects(x->obj,obj)) { // score和obj都相等
zslDeleteNode(zsl, x, update); // 删除跳跃表节点
zslFreeNode(x); // 释放跳跃表节点
return 1;
}
return 0; /* not found */
}
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
zslValueGteMin
函数判断给定值 value 是否大于或等于范围 spec 中的 min,返回 1 表示 value 大于或等于 min,否则返回 0。
static int zslValueGteMin(double value, zrangespec *spec) {
return spec->minex ? (value > spec->min) : (value >= spec->min);
}
2
3
zslValueLteMax
函数判断给定值 value 是否小于或等于范围 spec 中的 max,返回 1 表示 value 小于或等于 max,否则返回 0。
int zslValueLteMax(double value, zrangespec *spec) {
return spec->maxex ? (value < spec->max) : (value <= spec->max);
}
2
3
zslIsInRange
函数判断给定的分值范围 range 是否在跳跃表的分值范围之内,在返回 1,否则返回 0。
int zslIsInRange(zskiplist *zsl, zrangespec *range) {
zskiplistNode *x;
// 先排除总为空的范围值
if (range->min > range->max ||
(range->min == range->max && (range->minex || range->maxex)))
return 0;
// 跳跃表尾部节点是跳跃表分值的上限
x = zsl->tail;
if (x == NULL || !zslValueGteMin(x->score,range))
return 0;
// 跳跃表头部节点的下一个节点是跳跃表分值的下限
x = zsl->header->level[0].forward;
if (x == NULL || !zslValueLteMax(x->score,range))
return 0;
return 1;
}
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
zslFirstInRange
函数在跳跃表中查找第一个被包含在指定范围内的节点,如果没找到返回 NULL。
zskiplistNode *zslFirstInRange(zskiplist *zsl, zrangespec *range) {
zskiplistNode *x;
int i;
/* 如果给定的分值范围不在跳跃表分值范围之内,直接返回 */
if (!zslIsInRange(zsl,range)) return NULL;
x = zsl->header; // 表头节点
for (i = zsl->level-1; i >= 0; i--) {
/* Go forward while *OUT* of range. */
while (x->level[i].forward &&
!zslValueGteMin(x->level[i].forward->score,range))
x = x->level[i].forward;
}
/* This is an inner range, so the next node cannot be NULL. */
x = x->level[0].forward;
serverAssert(x != NULL);
/* 判断节点分值是否小于或等于给定范围range的上限 */
if (!zslValueLteMax(x->score,range)) return NULL;
return x;
}
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
zslLastInRange
函数在跳跃表中查找最后一个被包含在指定范围内的节点,如果没找到返回 NULL。
zskiplistNode *zslLastInRange(zskiplist *zsl, zrangespec *range) {
zskiplistNode *x;
int i;
/* If everything is out of range, return early. */
if (!zslIsInRange(zsl,range)) return NULL;
x = zsl->header;
for (i = zsl->level-1; i >= 0; i--) {
/* Go forward while *IN* range. */
while (x->level[i].forward &&
zslValueLteMax(x->level[i].forward->score,range))
x = x->level[i].forward;
}
/* This is an inner range, so this node cannot be NULL. */
serverAssert(x != NULL);
/* 判断节点分值是否大于或等于给定范围range的下限 */
if (!zslValueGteMin(x->score,range)) return NULL;
return x;
}
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22