Redis速度为什么快

2023-05-31 08:47:52 redis 速度

Redis是一种基于键值对(Key-Value)的NoSQL数据库，Redis的Value可以由String，hash，list，set，zset，Bitmaps，HyperLogLog等多种数据结构和算法组成。Redis具备多项功能，如键过期、发布订阅、事务、Lua脚本、哨兵、Cluster等。

根据官方提供的性能数据，Redis能够以非常快的速度执行命令，其QPS可以达到10万以上。那么本文主要介绍到底Redis快在哪里，主要有以下几点：

一、开发语言

现在我们都用高级语言来编程，比如Java、python等。也许你会觉得C语言很古老，但是它真的很有用，毕竟unix系统就是用C实现的，所以C语言是非常贴近操作系统的语言。Redis就是用C语言开发的，所以执行会比较快。

再补充一点，学生们应该专注于学习C语言，因为它有助于更好地理解计算机操作系统。别觉得学了高级语言就可以不用关注底层，欠的债总归要还的。此处推荐一本比较难啃的书《深入理解计算系统》。

二、纯内存访问

Redis使用内存存储所有数据，因此在正常运行过程中不需要从磁盘读取数据来进行非数据同步，因此IO次数为0。内存响应时间大约为100纳秒，这是Redis速度快的重要基础。先看看CPU的速度：

以我的电脑为例，它的主频是3.1G，意味着它可以每秒执行31亿条指令。CPU的世界观处理速度非常缓慢，相比之下，内存较其慢100倍，磁盘更慢1000000倍，你认为这算快吗？

借了一张《深入理解计算机系统》的图，展示了一个典型的存储器层次结构，在L0层，CPU可以在一个时钟周期访问到，基于SRAM的高速缓存春续期，可以在几个CPU时钟周期访问到，然后是基于DRAM的主存，可以在几十到几百个时钟周期访问到他们。

三、单线程

单线程可以简化算法的实现，但是实现并发的数据结构不仅困难而且测试也很麻烦。在服务端开发中，锁和线程切换通常是性能杀手，使用单线程可以避免它们带来的消耗。当然了，单线程也会有它的缺点，也是Redis的噩梦：阻塞。如果执行一个命令过长，那么会造成其他命令的阻塞，对于Redis是十分致命的，所以Redis是面向快速执行场景的数据库。

除了Redis之外，Node.js也是单线程，Nginx也是单线程，但他们都是服务器高性能的典范。

四、非阻塞多路I/O复用机制

在这之前先要说一下传统的阻塞I/O是如何工作的：当使用read或者write对某一文件描述符（File Descriptor FD）进行读写的时候，如果数据没有收到，那么该线程会被挂起，直到收到数据。

阻塞模型虽然易于理解，但是在需要处理多个客户端任务的时候，不会使用阻塞模型。

I/O多路复用实际上是指多个连接的管理可以在同一进程。多路是指网络连接，复用只是同一个线程。在网络服务中，I/O多路复用起的作用是一次性把多个连接的事件通知业务代码处理，处理的方式由业务代码来决定。

在I/O多路复用模型中，最重要的函数调用就是I/O 多路复用函数，该方法能同时监控多个文件描述符（fd）的读写情况，当其中的某些fd可读/写时，该方法就会返回可读/写的fd个数。

Redis使用epoll作为I/O多路复用技术的实现，再加上Redis自身的事件处理模型将epoll的read、write、close等都转换成事件，不在网络I/O上浪费过多的时间。实现对多个FD读写的监控，提高性能。

举个形象的例子吧。比如一个tcp服务器处理20个客户端socket。

A方案：顺序处理，如果第一个socket因为网卡读数据处理慢了，一阻塞后面都玩蛋去。

B方案：每个socket请求都创建一个分身子进程来处理，不说每个进程消耗大量系统资源，光是进程切换就够操作系统累的了。

C方案（I/O复用模型，epoll）：将用户socket对应的fd注册进epoll（实际上服务器和操作系统之间传递的不是socket的fd而是fd_set的数据结构），然后epoll只告诉哪些需要读/写的socket，只需要处理那些活跃的、有变化的socket fd的就好了。

这样，整个过程只在调用epoll的时候才会阻塞，收发客户消息是不会阻塞的。

相关文章