优秀的编程知识分享平台

网站首页 > 技术文章 正文

MySQL技术内幕2:从架构五视图角度来看MySQL结构

nanyue 2025-07-23 16:54:14 技术文章 6 ℃

0.简介

本文通过对MySQL的逻辑架构、开发架构、运行架构、物理架构以及数据架构的分析来建立一个对应MySQL架构整体的认识。

1.逻辑架构

逻辑架构考虑功能需求,主要从行为和职责来划分。MySQL的逻辑架构采用经典的三层模型:

1.连接层:处理客户端连接,负责认证和权限验证。

2.SQL处理层:包括查询解析、优化、执行等核心功能。

3.存储引擎层:负责数据存储和检索,支持插件式架构。

这种分层设计实现了关注点分离,使得各层可以独立优化和扩展。例如,可以更换存储引擎而不影响SQL处理层的功能(这得益于其底层的插件式管理,依赖于高度的抽象)。从上图看其结构较为简单,但其每层其实存在很多的小模块,更为具体些的可以见下图:

2.开发架构

此处关注软件模块的组织形式和开发的质量属性,此处主要关注主要的模块和代码文件的组织形式,作为后续源码分析的基础。

目录

说明

include

公共头文件,包含像客户端头文件,sql层头文件和psi相关头文件等。

sql

MySQL的核心目录,包含SQL的解析,优化,执行等。

storage

存储引擎的实现代码,像innoDB,MyISAM源码等。

plugin

插件系统的实现源码,像认证插件,审计日志插件等。

client

客户端工具,像mysql命令行工具,mysqladmin等。

components

MySQL组件目录,其比插件具有更好的灵活性,其内置插件包含像日志,密码校验等。

extra

存放依赖库,如curl,protobuf等

libbinlogevents

用于解析Binlog的lib服务

libbinlogstandalone

提供一个独立于 MySQL 服务器的二进制日志解析工具,使得开发者可以在不依赖 MySQL 服务器的情况下解析和处理 Binlog 文件。

libchangestreams

用于处理变更数据捕获(CDC,Change Data Capture)。它允许你捕获数据库中的变更(如插入、更新、删除操作),并将这些变更以流的形式输出,供其他系统使用。

libmysql

MySQL客户端库,用于和MySQL交互。

sql-common

SQL层的公共工具函数。

mysys

包含系统相关的工具函数,像文件操作、内存分配等。

scripts

包含MySQL初始化,安装和测试脚本。

tests

包含MySQL测试代码和测试用例。

unittest

包含MySQL单元测试用例。

router

包含 MySQL Router 的源码,用于实现数据库的路由和负载均衡。

vio

包含虚拟 I/O 系统的实现,用于抽象网络和文件 I/O 操作。

strings

包含字符串处理函数的实现。

可以从目录拆分看到MySQL的模块化和插件化设计,以及通过多种测试手段保证可测试性进而保证质量。

3.运行架构

运行架构主要关注运行期的属性(性能,可伸缩性,持续可用性,安全性等),MySQL和PG不同,采用的是多线程模型而非多进程模型,所以此处主要关注程序的线程模型(以InnoDB为例),分析各部分的作用。

可以看到,主要线程分为五类:

1)主线程(Main Thread): 负责 MySQL 服务器的初始化和关闭。负责调度其他各线程,用于定时刷脏页(新版本使用Page Cleaner ),回收undo log,。

2)连接线程(Connection Threads):处理客户端连接和请求,每个客户端连接对应一个独立的线程。

3)后台线程(Background Threads):执行后台任务,如刷新脏页、写入日志等。包括 InnoDB 的 I/O 线程、Purge 线程等。

InnoDB I/O 线程:包括读写线程,分别用于从磁盘读取数据页和脏页写入磁盘。

Purge 线程:当事务提交后就不再需要一些undo页,该线程就是用于回收这些不需要的页面。

Page Cleaner 线程:用于刷脏页调度。

4)复制线程(Replication Threads):负责主从复制的数据同步。

内存中主要对象则包括缓冲池,其内有数据页(undo page),索引页(index page),插入缓冲(insert buffer page),自适应哈希索引(adaptive hash index),数据字典(data dictionary);另外还有重做日志缓存(redo log buffer),额外内存池(innodb addational mem pool)。

4.物理架构

物理架构关注如何安装部署,和分析原理关系不大,不再描述。

5.数据架构

数据架构主要考虑数据需求,关注持久化数据的存储方案,存储格式(还是以innodb引擎库表存储为例)。此处主要关注逻辑存储和物理存储,了解储存部分的层级关系,详细的存储方式,目录结构会在存储章节介绍。

和其他数据库逻辑结构层级一致,如下:

其表文件物理实际存储结构如下(当然其磁盘上还有日志文件,其对应结构后面文章会详细描述):

(1) 表空间(Tablespace)

表空间是存储表和索引数据的物理文件。

InnoDB 存储引擎使用表空间来管理数据。

表空间可以分为:

系统表空间: 存储系统元数据和共享表数据。

独立表空间: 每个表有独立的表空间文件(.ibd 文件),MySQL 8默认开启。

(2) 数据文件

MySQL 的数据文件包括:

.frm 文件: 存储表结构定义(MySQL 8.0 后不再使用)。

.ibd 文件: InnoDB 表的独立表空间文件。

.MYD.MYI 文件: MyISAM 表的数据文件和索引文件。

(3) 日志文件

MySQL 使用多种日志文件来确保数据的一致性和持久性:

Redo Log(重做日志): 记录事务的修改操作,用于崩溃恢复。

Undo Log(回滚日志): 记录事务的旧值,用于回滚和 MVCC。

Binlog(二进制日志): 记录所有数据更改操作,用于复制和恢复。

Error Log(错误日志): 记录 MySQL 服务器的错误信息。

(5) 数据字典

MySQL 8.0 引入了数据字典,用于存储数据库对象的元数据。

数据字典存储在 InnoDB 表中,取代了之前的 .frm 文件。



最近发表
标签列表