系统城装机大师 - 固镇县祥瑞电脑科技销售部宣传站!

当前位置:首页 > 数据库 > Mysql > 详细页面

MySQL Buffer Pool如何提高页的访问速度

时间:2023-03-06来源:系统城装机大师作者:佚名

如何提高SQL执行速度?

当我们想更新某条数据的时候,难道是从磁盘中加载出来这条数据,更新后再持久化到磁盘中吗?

如果这样搞的话,那一条sql的执行过程可太慢了,因为对一个大磁盘文件的读写操作是要耗费几百万毫秒的

真实的执行过程是,当我们想更新或者读取某条数据的时候,会把对应的页加载到Buffer Pool缓冲池中(Buffer Pool本质上就是一块连续的内存空间)

默认为128m,当然为了提高系统的并发度,你可以把这个值设大一点

之所以加载页到Buffer Pool中,是考虑到当你使用这个页的数据时,这个页的其他数据使用到的概率页很大,随机IO的耗时很长,所以多加载一点数据到Buffer Pool

Buffer Pool的数据结构是怎样的?

Buffer Pool中主要分为2部分,缓存页和描述数据,MySQL从磁盘加载的数据页会放入缓存页中

对于每个缓存页都有对应的描述信息,比如数据页所属于表空间,数据页的编号等

Buffer Pool中的描述数据大概相当于缓存页大小的5%左右,这部分内存是不包含在Buffer Pool中的

当更新数据的时候,如果对应的页在Buffer Pool中,则直接更新Buffer Pool中的页即可,对应的页不在Buffer Pool中时,才会从磁盘加载对应的页到Buffer Pool,然后再更新,此时Buffer Pool中的页和磁盘中的页数据是不一致的,被称为脏页。这些脏页是要被刷回到磁盘中的

这些脏页是多会刷回到磁盘中的? 有如下几个时机

Buffer Pool不够用了,要给新加载的页腾位置了,所以会利用改进的后的LRU算法,将一些脏页刷回磁盘后台线程会在MySQL不繁忙的时候,将脏页刷到磁盘中redolog写满时(redolog的作用后面会提到)数据库关闭时会将所有脏页刷回到磁盘

这样搞,效率是不是高很多了?

当需要更新的数据所在的页已经在Buffer Pool中时,只需要操作内存即可,效率不是一般的高

我们怎么知道哪些缓存页是空闲的?

MySQL为Buffer Pool设计了一个free链表,它是一个双向链表,每个节点就是一个空闲缓存页的描述数据

我们如何知道缓存页是否被加载到内存了?

很简单啊,建立一个哈希表不就行了,key为表空间号+页号,value为对应的缓存页

当把数据页读取到缓存页的时候,对应的描述数据会从free链表放到flush链表

当不停的把磁盘上的数据页加载到缓存页,free链表不停的移除空闲缓存页,当free链表上没有空闲缓存页,当你还要加载数据页到缓存页时,该怎么办呢?

如果要淘汰一些数据,该淘汰谁呢?

引入LRU链表来判断哪些缓存页是不常用的?

缓存淘汰策略在很多中间件中会被用到,其中用的最多的就是LRU算法,当每访问一个缓存页的时候就把缓存页移到链表的头部

我们只需要把链表尾部的缓存页刷到内存中,然后加载新的数据页即可。

这样的方式看似很完美,但是在实际运行过程中会存在巨大的隐患

首先就是mysql的预读,

哪些情况会触发MySQL的预读

当发生全表扫描的时候(比如 select * from users),会导致表里的数据页都加载到 Buffer Pool 中去。这样有可能导致LRU链表前面一大串数据页都是全表扫描加载进来的数据页,但是如果这次全表扫描过后后续几乎没用到这个表里面的数据呢?

这样就会导致经常被扫描的缓存页被淘汰了,留下的都是全表扫描加载进来的缓存页

为了解决这个问题,LRU链表改进了一下,采用了冷热分离的思想。

即LRU链表会被拆分为2部分,一部分是冷数据,一部分是热数据

改进后的链表是如何工作的?

当数据页第一次被加载到缓存的时候,缓存页会被放到冷数据区域的链表头部。

那么冷数据区的缓存页多会放到热数据区呢?

你可能会想,当冷数据区的缓存页再次被访问时,就放到热数据区可以不?

1
2
3
4
5
6
7
mysql> SHOW VARIABLES LIKE 'innodb_old_blocks_pct';
+-----------------------+-------+
| Variable_name         | Value |
+-----------------------+-------+
| innodb_old_blocks_pct | 37    |
+-----------------------+-------+
1 row in set (0.02 sec)

当多线程访问Buffer Pool中的各种链表时,需要加锁保证线程安全,影响请求的处理速度,此时我们就可以将Buffer Pool分为多个,多线程访问事不会互相影响,提高了请求的处理速度

在MySQL 5.7.5之前,Buffer Pool不能动态扩展,动态扩展。为了增加动态扩展就增加了chunk机制,有兴趣的小伙伴可以看看其他资料,就不多做分析了

Buffer Pool的相关参数

学习了这么多理论知识,那么Buffer Pool应该调多大呢?

执行如下命令可以得到Buffer Pool的大小,名字,以及chunk的大小

1 SHOW VARIABLES LIKE '%innodb_buffer%'

innodb_buffer_pool_size的单位是字节,我们转成MB来看一下,默认是128M

1
2
-- 128m
SELECT @@innodb_buffer_pool_size / 1024 / 1024

执行如下命令可以得到buffer_pool的当前使用状态

1 SHOW STATUS LIKE '%buffer_pool%';

我们挑一些重要的参数来分析一下

  • Innodb_buffer_pool_read_requests:读的请求次数
  • Innodb_buffer_pool_reads:从物理磁盘中读取数据的次数
  • Innodb_buffer_pool_pages_data:有数据的缓存页
  • Innodb_buffer_pool_pages_free:空闲缓存页
  • Innodb_buffer_pool_pages_total:总共的缓存页

Buffer Pool 读缓存命中率:

(Innodb_buffer_pool_read_requests - Innodb_buffer_pool_reads) / (Innodb_buffer_pool_read_requests) *100%

Buffer Pool 脏页比率:

Innodb_buffer_pool_pages_dirty / (Innodb_buffer_pool_pages_data)*100%

Buffer Pool 使用率:

innodb_buffer_pool_pages_data / ( innodb_buffer_pool_pages_data + innodb_buffer_pool_pages_free ) * 100%

缓存命中率比较低可以增大Buffer Pool的大小

使用率比较高时可以增大Buffer Pool的大小

你也可以执行如下命令获取一些关于Buffer Pool的其他参数,本篇文章就不多做介绍了

1 show engine innodb status;

参考博客

[1]https://www.cnblogs.com/FengGeBlog/p/10283095.html
[2]https://m.starcto.com/mysql/128.html

到此这篇关于MySQL Buffer Pool如何提高页的访问速度的文章就介绍到这了

分享到:

相关信息

系统教程栏目

栏目热门教程

人气教程排行

站长推荐

热门系统下载