网站首页 > 技术文章 正文
导语:
“同事的批量写入脚本跑 2 小时,我的代码只需 12 分钟!” 本文揭秘京东、美团都在用的 MySQL 写入优化方案,文末送【批量写入压测脚本】,关注+转发抽奖送《MySQL 内核优化手册》!
痛点共鸣
"INSERT 语句写满 3 屏,跑批任务等到天荒地老?"
先看触目惊心的数据对比(真实压测):优化前:10万条数据写入耗时 182 秒
优化后:同数据量仅需 9.7 秒
核心优化方案(附代码)
1. 一箭三雕:事务+批处理+参数调优(80% 场景适用)
java
// 错误示范:逐条提交
for (User user : userList) {
stmt.executeUpdate("INSERT INTO users VALUES (...)");
}
// 正确姿势:批处理+事务
Connection conn = dataSource.getConnection();
conn.setAutoCommit(false); // 关闭自动提交
PreparedStatement ps = conn.prepareStatement("INSERT ...");
for (int i=0; i<100000; i++) {
ps.setString(1, "name"+i);
ps.addBatch();
if (i % 5000 == 0) { // 每5000条提交一次
ps.executeBatch();
conn.commit();
ps.clearBatch();
}
}
参数调优:
sql
innodb_buffer_pool_size = 80%内存 # 缓冲池
innodb_flush_log_at_trx_commit = 2 # 事务提交策略
bulk_insert_buffer_size = 256M # 批量插入缓存
2. 核弹级提速:LOAD DATA INFILE(提速 10 倍+)
sql
-- 将CSV导入MySQL(秒级完成百万数据)
LOAD DATA INFILE '/tmp/users.csv'
INTO TABLE users
FIELDS TERMINATED BY ','
LINES TERMINATED BY '\n';
性能对比:
方式 | 10万条耗时 | 100万条耗时 |
逐条INSERT | 182s | 1800s+ |
LOAD DATA | 4.2s | 38s |
高阶技巧
3. 空间换时间:内存磁盘混合架构
sql
-- 使用内存临时表中转
CREATE TEMPORARY TABLE tmp_users (...) ENGINE=MEMORY;
-- 批量插入临时表
INSERT INTO tmp_users ...;
-- 一次性导入主表
INSERT INTO users SELECT * FROM tmp_users;
4. 并行写入黑科技(Python示例)
python
from concurrent.futures import ThreadPoolExecutor
def batch_insert(chunk):
# 每个线程处理1万条数据
with connection.cursor() as cursor:
cursor.executemany(sql, chunk)
with ThreadPoolExecutor(max_workers=8) as executor:
# 将10万数据拆分为10个chunk
executor.map(batch_insert, [chunk1, chunk2,...])
避坑指南
- 索引陷阱:写入前禁用非必要索引,完成后重建
ALTER TABLE users DISABLE KEYS; ... ENABLE KEYS; - 日志深渊:关闭binlog(SET sql_log_bin=0)或使用ROW模式
- 连接池误区:HikariCP 配置不当引发雪崩(附配置模板)
实战压测报告
使用 sysbench 对比不同方案的 TPS(Transactions/sec):
方案 | TPS | 资源消耗 |
逐条写入 | 62 | CPU 8% |
批量+事务 | 5400 | CPU 31% |
LOAD DATA | 21000 | CPU 68% |
猜你喜欢
- 2025-07-27 MySql:DML数据操作语句盘点(数据库操作dml语句)
- 2025-07-27 MySQL消息系统铁三角:去重保序+死信队列破解重复消费与消息黑洞
- 2025-07-27 吃透3大Binlog模式,MySQL数据零丢失
- 2025-07-27 告别繁琐!MySQL数据搬家,这几招让你轻松搞定!
- 2025-07-27 create index a on t(ct DESC)mysql8索引可以指定排序方式提高性能
- 2025-07-27 MySQL基础篇:DQL数据查询操作(mysql查询教程)
- 2025-07-27 MySQL 生产流程监控咋选库?这俩常用工具手把手教你
- 2025-07-27 MySQL--多表连接查询(mysql多表连接查询时的关键字)
- 2025-07-27 MySQL--索引(mysql索引是什么)
- 2025-07-27 MySql:DQL 数据查询语句盘点(mysql查询语句菜鸟教程)
- 10-02基于深度学习的铸件缺陷检测_如何控制和检测铸件缺陷?有缺陷铸件如何处置?
- 10-02Linux Mint 22.1 Cinnamon Edition 搭建深度学习环境
- 10-02AWD-LSTM语言模型是如何实现的_lstm语言模型
- 10-02NVIDIA Jetson Nano 2GB 系列文章(53):TAO模型训练工具简介
- 10-02使用ONNX和Torchscript加快推理速度的测试
- 10-02tensorflow GPU环境安装踩坑日记_tensorflow配置gpu环境
- 10-02Keye-VL-1.5-8B 快手 Keye-VL— 腾讯云两卡 32GB GPU保姆级部署指南
- 10-02Gateway_gateways
- 最近发表
-
- 基于深度学习的铸件缺陷检测_如何控制和检测铸件缺陷?有缺陷铸件如何处置?
- Linux Mint 22.1 Cinnamon Edition 搭建深度学习环境
- AWD-LSTM语言模型是如何实现的_lstm语言模型
- NVIDIA Jetson Nano 2GB 系列文章(53):TAO模型训练工具简介
- 使用ONNX和Torchscript加快推理速度的测试
- tensorflow GPU环境安装踩坑日记_tensorflow配置gpu环境
- Keye-VL-1.5-8B 快手 Keye-VL— 腾讯云两卡 32GB GPU保姆级部署指南
- Gateway_gateways
- Coze开源本地部署教程_开源canopen
- 扣子开源本地部署教程 丨Coze智能体小白喂饭级指南
- 标签列表
-
- cmd/c (90)
- c++中::是什么意思 (84)
- 标签用于 (71)
- 主键只能有一个吗 (77)
- c#console.writeline不显示 (95)
- pythoncase语句 (88)
- es6includes (74)
- sqlset (76)
- apt-getinstall-y (100)
- node_modules怎么生成 (87)
- chromepost (71)
- flexdirection (73)
- c++int转char (80)
- mysqlany_value (79)
- static函数和普通函数 (84)
- el-date-picker开始日期早于结束日期 (76)
- js判断是否是json字符串 (75)
- c语言min函数头文件 (77)
- asynccallback (87)
- localstorage.removeitem (74)
- vector线程安全吗 (70)
- java (73)
- js数组插入 (83)
- mac安装java (72)
- 无效的列索引 (74)