MySQL InnoDB Buffer Pool LRU链表冷热数据淘汰策略

当数据库处理查询请求时，频繁地从磁盘读取数据会极大拖慢速度。Buffer Pool 就像一个高速缓存区，把经常用到的数据页（Page）暂存到内存中。问题随之而来：内存有限，如何决定哪些数据留下，哪些被淘汰？InnoDB 存储引擎使用了一个经过改良的 LRU 链表来管理这些数据页，其核心在于区分数据的“冷”与“热”。

第一部分：理解基础：经典LRU与它的问题

回顾经典LRU算法：最简单的“最近最少使用”算法会维护一个链表。当访问一个数据页时，就把该页移动到链表头部。当需要淘汰时，直接移除链表尾部的页即可。
识别经典LRU的缺陷：这个简单的策略在数据库场景下会失效。例如：
- 全表扫描污染：当执行 SELECT * FROM large_table 时，会一次性加载大量数据页到 Buffer Pool。这些页在短时间内被访问后，很可能再也不会被用到，但它们却因为“最近使用”而占据了链表头部，挤掉了真正频繁使用的热点数据。
- 预读污染：InnoDB 的预读机制也可能提前加载一些当前并不需要的数据页。

第二部分：核心机制：Midpoint Insertion策略

为了应对上述问题，InnoDB 对LRU链表进行了关键改造，引入了“中点插入”策略。

将LRU链表分为两个区域：整个链表被划分为两个部分：
- Young 区域：也称为“热数据”区或“新”链表。存放最近被访问过的、非常活跃的数据页。位于链表的头部。
- Old 区域：也称为“冷数据”区或“旧”链表。存放最近未被访问或刚被加载的数据页。位于链表的尾部。
理解“中点”的含义：两个区域的分界点被称为 midpoint。新读入的页，不会直接插入到链表头部（Young区），而是先插入到 midpoint 的位置（Old区的头部）。
执行一次数据访问的完整流程：
- 访问一个已在Buffer Pool中的页：
  - 如果该页在 Young 区域，则将其移动到链表最头部。这是正常LRU行为。
  - 如果该页在 Old 区域，则不会立即移动。InnoDB 会记录下这次访问，并启动一个计时器（由 innodb_old_blocks_time 参数控制，默认1000毫秒）。
  - 如果在计时器到期前，再次访问了这个Old区域的页，那么它才会被判定为“热点”并移动到 Young 区域的头部。这避免了全表扫描等偶发性访问污染热数据区。
- 访问一个不在Buffer Pool中的页（需要从磁盘加载）：
  - 新加载的页会被插入到 Old 区域的头部（即 midpoint 位置）。
  - 同样，它不会立即晋升到Young区，也需要等待并经历上述的二次访问验证。
执行淘汰时的逻辑：当 Buffer Pool 空间不足需要淘汰页面时，InnoDB 会直接从 Old 区域的尾部开始移除。因为Young区域的数据被判定为热数据，优先保留。

第三部分：关键参数：如何配置与调优

该策略的行为完全由配置参数控制。你可以通过修改MySQL的配置文件（如 my.cnf 或 my.ini）来调整它们。

# 查看当前配置
SHOW GLOBAL VARIABLES LIKE 'innodb_old_blocks_pct';
SHOW GLOBAL VARIABLES LIKE 'innodb_old_blocks_time';

innodb_old_blocks_pct：控制Old区域占整个LRU链表的比例。
- 默认值：37（表示Old区域占据链表长度的37%，Young区域占63%）。
- 调优思路：
  - 如果你的服务器内存充裕，且工作负载偏向OLTP（大量短小、随机的查询），可以适当增大此值（如 50），让热数据区（Young区）更大，容纳更多热点数据。
  - 如果你的工作负载经常包含大型顺序扫描（如数据仓库查询），可以适当减小此值（如 20），让Old区更小，从而更快地将不受欢迎的扫描数据淘汰出去。
- 修改 my.cnf 配置文件，在 [mysqld] 段下添加或修改：
```
innodb_old_blocks_pct = 40
```
- 修改后需重启MySQL服务生效，或在线使用 SET GLOBAL innodb_old_blocks_pct = 40;（重启后失效）。
innodb_old_blocks_time：决定一个页面在Old区域停留多久后，下次访问才会被提升到Young区域。
- 默认值：1000（毫秒）。
- 调优思路：
  - 这个参数是防止全表扫描污染的关键。默认1000毫秒意味着，对于一个因全表扫描进入Old区的页，如果它在1秒内没有被再次访问，那么它就会一直待在Old区直至被淘汰。
  - 如果你的系统经常遭遇意外的全表扫描，可以适当增大此值（如 3000），给这些页面更长的“冷静期”。
  - 如果你的系统极少出现全表扫描，且希望数据更快地被识别为热点，可以稍微减小此值。
- 修改 my.cnf 配置文件：
```
innodb_old_blocks_time = 2000
```
- 同样支持在线全局修改：SET GLOBAL innodb_old_blocks_time = 2000;。

第四部分：监控与验证：确认策略是否生效

配置之后，你需要监控和验证。

查看Buffer Pool状态：
```
SHOW ENGINE INNODB STATUS\G
```
在输出的 BUFFER POOL AND MEMORY 部分，关注 youngs/s 和 non-youngs/s 两个指标：
- youngs/s：每秒从Old区域移动到Young区域的页面数。这个值高，说明有大量Old区域的页面被判定为热点。
- non-youngs/s：每秒在Old区域但未被移动到Young区域的页面数（可能因为访问间隔超过 innodb_old_blocks_time）。如果这个值持续很高，可能意味着你的Old区域过小，或者存在很多非热点扫描。

查看性能模式（Performance Schema）：

SELECT
    PAGE_TYPE,
    COUNT(*) AS PAGES,
    FORMAT_BYTES(SUM(DATA_SIZE)) AS DATA_SIZE
FROM sys.innodb_buffer_stats_by_schema
GROUP BY PAGE_TYPE
ORDER BY PAGES DESC;

这个查询可以帮助你了解 Buffer Pool 中当前缓存的数据类型分布。

第五部分：实用建议

OLTP密集型系统：通常将 innodb_old_blocks_pct 设置在 33 到 40 之间是一个不错的起点。innodb_old_blocks_time 保持默认 1000 或适当调大。
混合型或OLAP型系统：如果包含复杂报表或扫描查询，应考虑减小 innodb_old_blocks_pct（如 20-30），并显著增大 innodb_old_blocks_time（如 3000 或更高），以严格保护热数据不被冲刷。
观察与迭代：调整参数后，务必使用 SHOW ENGINE INNODB STATUS 和性能模式工具观察 youngs/s 等指标的变化，并结合业务查询的响应时间进行综合判断，进行迭代调优。最佳配置永远是基于实际监控数据的。

文章目录

MySQL InnoDB Buffer Pool LRU链表冷热数据淘汰策略

MySQL InnoDB Buffer Pool LRU链表冷热数据淘汰策略

第一部分：理解基础：经典LRU与它的问题

第二部分：核心机制：Midpoint Insertion策略

第三部分：关键参数：如何配置与调优

第四部分：监控与验证：确认策略是否生效

第五部分：实用建议

评论 (0)

文章目录

MySQL InnoDB Buffer Pool LRU链表冷热数据淘汰策略

MySQL InnoDB Buffer Pool LRU链表冷热数据淘汰策略

第一部分：理解基础：经典LRU与它的问题

第二部分：核心机制：Midpoint Insertion策略

第三部分：关键参数：如何配置与调优

第四部分：监控与验证：确认策略是否生效

第五部分：实用建议

评论 (0)

扫一扫，手机查看