网站首页 > 技术文章 正文
技术背景
在数据库操作中,经常会遇到需要从每组数据中检索出最后一条记录的需求。例如,在一个消息表中,可能需要获取每个用户的最后一条消息。在MySQL中,直接使用GROUP BY语句默认返回每组的第一条记录,无法满足获取最后一条记录的需求,因此需要采用其他方法来实现。
实现步骤
1. 使用窗口函数(MySQL 8.0及以上)
从MySQL 8.0开始支持窗口函数,可使用ROW_NUMBER()函数为每组记录编号,然后筛选出编号为1的记录。
WITH ranked_messages AS (
SELECT m.*, ROW_NUMBER() OVER (PARTITION BY name ORDER BY id DESC) AS rn
FROM messages AS m
)
SELECT * FROM ranked_messages WHERE rn = 1;
2. 使用LEFT JOIN
通过LEFT JOIN将表自身连接,筛选出没有更大id的记录,即为每组的最后一条记录。
SELECT m1.*
FROM messages m1 LEFT JOIN messages m2
ON (m1.name = m2.name AND m1.id < m2.id)
WHERE m2.id IS NULL;
3. 使用子查询和MAX()函数
先通过子查询找出每组的最大id,然后从原表中筛选出这些id对应的记录。
SELECT id, name, other_columns
FROM messages
WHERE id IN (
SELECT MAX(id)
FROM messages
GROUP BY name
);
4. 使用INNER JOIN和子查询
通过子查询找出每组的最大id,然后使用INNER JOIN连接原表和子查询结果。
select
a.*
from
messages a
inner join
(select name, max(id) as maxid from messages group by name) as b on
a.id = b.maxid
核心代码
以下是几种常见方法的核心代码示例:
窗口函数法
WITH ranked_messages AS (
SELECT m.*, ROW_NUMBER() OVER (PARTITION BY name ORDER BY id DESC) AS rn
FROM messages AS m
)
SELECT * FROM ranked_messages WHERE rn = 1;
LEFT JOIN法
SELECT m1.*
FROM messages m1 LEFT JOIN messages m2
ON (m1.name = m2.name AND m1.id < m2.id)
WHERE m2.id IS NULL;
子查询MAX()法
SELECT id, name, other_columns
FROM messages
WHERE id IN (
SELECT MAX(id)
FROM messages
GROUP BY name
);
最佳实践
- 选择合适的方法:不同的方法在不同的数据量和数据分布下性能表现不同。例如,窗口函数法在MySQL 8.0及以上版本中简单直观,但在旧版本中不可用;LEFT JOIN法在某些情况下性能较好,但在数据量较大时可能较慢。
- 创建合适的索引:为GROUP BY和ORDER BY涉及的列创建索引可以提高查询性能。例如,对于上述示例,可在name和id列上创建索引。
CREATE INDEX idx_name_id ON messages (name, id);
常见问题
1. 性能问题
某些方法在数据量较大时可能会导致性能下降。例如,使用IN子查询在处理大量数据时可能会比较慢,可考虑使用JOIN替代。
2. 版本兼容性问题
窗口函数等新特性只在MySQL 8.0及以上版本支持,如果使用旧版本MySQL,需要采用其他方法。
3. 结果不一致问题
在使用某些方法时,可能会出现结果不一致的情况。例如,使用SELECT *, MAX(id) FROM messages GROUP BY name可能会返回任意数据,而不是MAX(id)对应的记录。
猜你喜欢
- 2025-05-02 MySQL自增ID用完了怎么办?4种解决方案!
- 2025-05-02 MySQL批量插入性能对比:100、1000、10000行,谁更胜一筹?
- 2025-05-02 牛哇!MySQL中的日志“binlog”的三种格式这么好玩
- 2025-05-02 从B+树原理到实战:MySQL索引设计的22条军规
- 2025-05-02 mysql数据库基本增删改查操作总结
- 2025-05-02 MySQL索引效率太快,1亿数据查询不到1秒
- 2025-05-02 MySQL大数据表处理策略,原来一直都用错了……
- 2025-05-02 在MySQL命令行中获取用户账户列表的方法
- 2025-05-02 MySQL分库分表设计方案:大道至简,数据不乱
- 2025-05-02 从零到亿级数据:MySQL 分库分表实战避坑指南
- 最近发表
- 标签列表
-
- cmd/c (64)
- c++中::是什么意思 (83)
- 标签用于 (65)
- 主键只能有一个吗 (66)
- c#console.writeline不显示 (75)
- js判断是否空对象 (63)
- pythoncase语句 (81)
- es6includes (73)
- sqlset (64)
- phprequire_once (61)
- localstorage.removeitem (74)
- vector线程安全吗 (70)
- & (66)
- java (73)
- org.redisson (64)
- cannotinstantiatethetype (62)
- js数组插入 (83)
- gormwherein (64)
- linux删除一个文件夹 (65)
- mac安装java (72)
- outofmemoryerror是什么意思 (64)
- flask文件上传 (63)
- eacces (67)
- 查看mysql是否启动 (70)
- 无效的列索引 (74)