Redis持久化
Redis是内存数据库,如果不保存到硬盘当中,那么一单服务器断电,数据就会丢失,所以Redis提供了持久化功能
RDB(Redis DataBase)
什么是RDB
RDB是Redis用来进行持久化的一种方式,是把当前内存中的数据集快照写入磁盘,也就是Snapshot快照,恢复时是将快照文件直接读到内存里
Redis会单创建(fork)一个子进程来进行持久化,会先将数据写入到一个临时文件中,待持久化过程就结束了,再用这个临时文件替换上次持久化好的文件。整个过程中,主进程是不进行任何IO操作。
这就确保了极高的性能。如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那RDB方式要比AOF方式更加的高效。RDB的缺点是最后一次持久化后的数据可能丢失,我们默认使用的就是RDB,一般情况下不需要修改这个配置。
有时候在生产换门会将这个文件进行备份
rdb保存的是dump.rdb 都是在配置文件中写的
触发机制
1、save 的规则满足的情况下,会自动触发rdb规则
2、执行flushall命令,也会触发我们的rdb规则
3、退出redis,也会产生rdb文件
save规则: 例如 :save 900 1 这个的意思是900秒内修改了一次 就会触发rdb操作,当然我们可以根据业务的需求去自己定义
rdb文件的文件名称和位置可以在redis.conf中查看和设置
恢复数据
1、只需要将rdb文件放在我们redis启动目录就可以,redis启动的时候会自动检查dump.rdb恢复其中的数据。
优点:
1、适合大规模的数据恢复
2、对数据的完整性要求不高
缺点:
1、需要一定的时间间隔进行操作,如果redis意外宕机了,最后一次修改的数据就没有了
2、fork进程的时候。就会占用一定的内存空间
AOF(Append Only File)
简单来说类似于日志,将我们所有的命令都记录下来,恢复的时候就把这个文件全部执行一遍
AOF是什么
以日志的来记录每个写操作,将Redis执行过的命令记录下来(读操作不记录),只许追加文件,但是不可以改写文件,redis启动之初会读取该文件重新构建数据,换言之,redis重启的话就根据日志文件的内容将写执行从前到后执行一次以完成数据的恢复工作
AOF保存的是appendonly.aof文件
append
查看Redis的配置文件
我们可以看到默认是不开启的,我们需要手动进行配置,我们只需要将appendonly改为yes就开启了aof
然后重启,redis就生效了
如果aof文件出现错误,这个时候redis是启动不了的,我们需要修复这个文件,redis给我们提供了一个修复工具redis-check-aof --fix
重写规则
aof默认就是文件的无线追加,文件会越来越大
在上图中也看到aof文件如果大于64mb,redis就会fork一个新的进程来将我们的文件进行重写
优点:
1、每一次修改都同步,文件的完整会更好
2、美妙同步一次,可能会丢失一秒的数据
3、从不同步,效率高
缺点:
1、相对于数据文件来说,aof远远大于rdb,修复的速度也比rdb慢
2、AOF运行效率也比rdb慢,所以我们redis默认的配置就是rdb持久化
扩展
1、RDB持久化方式能够指定的时间间隔内对你的数据进行快照存储
2、AOF持久化方式记录每次对服务器的写操作,当数据库重启的时候会重新执行这些命令来恢复原始的数据,AOF命令以Redis协议追加保存每次写的操作到文件末尾,Redis还能对AOF文件进行后台重写,使得AOF文件的体积不至于过大
3、如果你只希望你的数据在服务器运行的时候存在,你可以不适用任何持久化
4、可以同时开启两种持久化方式
- 在这种情况下,当redis重启的时候会优先载入AOF来恢复原始的数据,因为在通常的情况下AOF文件保存的数据集要比RDB文件保存的数据集要完整。
- RDB的数据不实时,同时使用两者时服务器重启也会只找AOF文件,那要不要只使用AOF呢,redis作者建议不要,因为RDB更适合用于备份数据库(AOF在不断变化不好备份),快速重启,而且不会有AOF可能潜在的BUG,留着作为一个万一的手段
5、性能建议
- 因为RDB文件作用做后备用途,建议只在Slave上持久化RDB文件,而且只要15分钟备份有一次就够了,只保留save 900 1 这条规则。
- 如果Enable AOF,好处是在最恶劣情况下也只会丢失不超过两秒数据,启动脚本较简单值load自己的AOF文件就可以了,代价:一是带来了持续的IO,二是AOF rewrite的最后将rewrite过程中产生的新数据写到新文件造成的阻塞几乎是不可避免的。只要硬盘许可,应该尽量减少AOF rewrite的频率,AOF重写的基础大小默认值64M太小了,可以设置到5G以上,默认超过原大小的100% 重写可以改到适当的数值
- 如果不Enable AOF,仅靠Master-Slave Repllcation实现高可用性也可以,能省掉一大笔IO,也减少了rewrite时带来的系统波动。代价是如果Matser/Slave同时宕掉,会丢失十几分钟的数据,启动脚本也要比较两个Master/Slave中得RDB文件,载入较新的那个,例如:微博