网站首页 > 技术文章 正文
sql中的case when的功能是实现单列或者多列的条件统计,其实Pandas也可以实现的,比如万能的apply方法,就是写起来复杂一些,没有sql case when那么直观。
apply方法可以对dataframe、series执行特定函数,其实很强大,因为python什么逻辑都可以写。
举个例子,一张考试成绩的表scores,有语文和数学的得分,现在给考生综合打分,两门都在90以上打A,都在80-90之间打B,其他则打C。
这里如果用sql来查询的话,使用case when就很简单明了。
SELECT *,
CASE
WHEN chinese_score >= 90AND math_score >= 90THEN'A'
WHEN chinese_score >= 80AND math_score >= 80THEN'B'
ELSE'C'
ENDAS score_type
FROM scores
如果用pandas apply方法来实现的话,需要自定义一个判断函数,用来对成绩进行分类。
然后用apply方法应用到dataframe上,以下是完整代码,可以放到本地电脑跑。
import pandas as pd
# 示例数据
data = {
'chinese_score': [90, 80, 79, 100, 89],
'math_score': [91, 95, 79, 99, 89],
}
df = pd.DataFrame(data)
# 定义条件判断函数
def check_conditions(row):
# 条件1:年龄>30,分数>80,性别为男性
result = 'A'if (row['chinese_score'] >= 90) and (row['math_score'] >= 90) \
else'B'if (row['chinese_score'] >= 80) and (row['math_score'] >= 80) \
else'C'
return result
# 应用apply生成标记列
score_type_1 = df.apply(check_conditions, axis=1)
score_type_1
逻辑也很简单,判断函数实现多列的判断条件,apply将该判断函数应用到数据集上,就能实现类似sql case when的功能。
apply的应用场景很多,远比你想象的多得多,比如一张学生成绩信息的表,它可以给每位学生通过deepseek制定个性化的提升建议。
除了pandas apply能实现case when的功能外,numpy的select方法也能搞定,而且更为通用、简洁,建议试试。
import numpy as np
import pandas as pd
# 示例数据
data = {
'chinese_score': [90, 80, 79, 100, 89],
'math_score': [91, 95, 79, 99, 89],
}
df = pd.DataFrame(data)
# 定义条件和对应的值
conditions = [
(df['chinese_score'] >= 90) & (df['math_score'] >= 90),
(df['chinese_score'] >= 80) & (df['math_score'] >= 80)
]
choices = ['A', 'B']
# select方法
score_type_1 = np.select(conditions, choices, default='C')
score_type_1
numpy select方法类似case when语法,通过一个多列条件判断,区分不同的分类。
除了这两种,其实pandas种还有不少能实现的途径,但没必要尝试,因为这两种相对通用便捷,且符合python哲学。
猜你喜欢
- 2025-07-27 Python 3.14 新特性盘点,更新了些什么?
- 2025-07-27 Python单元测试(pycharm单元测试教程)
- 2025-07-27 Python学不会来打我(8)字符串string类型深度解析
- 2025-07-27 Python 中 字符串处理的高效方法,不允许你还不知道
- 2025-07-27 Python-分支结构(python分支结构教学设计)
- 2025-07-27 python学习教程-第六节内容(python基础教学视频)
- 2025-07-27 Python自动化办公应用学习笔记16——分支结构
- 2025-05-05 python unittest 基本用法(python3 unittest)
- 2025-05-05 使用pytest进行单元测试(pytest详解)
- 2025-05-05 用扣子开发一个图灵测试游戏(用扣子开发一个图灵测试游戏的软件)
- 10-02基于深度学习的铸件缺陷检测_如何控制和检测铸件缺陷?有缺陷铸件如何处置?
- 10-02Linux Mint 22.1 Cinnamon Edition 搭建深度学习环境
- 10-02AWD-LSTM语言模型是如何实现的_lstm语言模型
- 10-02NVIDIA Jetson Nano 2GB 系列文章(53):TAO模型训练工具简介
- 10-02使用ONNX和Torchscript加快推理速度的测试
- 10-02tensorflow GPU环境安装踩坑日记_tensorflow配置gpu环境
- 10-02Keye-VL-1.5-8B 快手 Keye-VL— 腾讯云两卡 32GB GPU保姆级部署指南
- 10-02Gateway_gateways
- 最近发表
-
- 基于深度学习的铸件缺陷检测_如何控制和检测铸件缺陷?有缺陷铸件如何处置?
- Linux Mint 22.1 Cinnamon Edition 搭建深度学习环境
- AWD-LSTM语言模型是如何实现的_lstm语言模型
- NVIDIA Jetson Nano 2GB 系列文章(53):TAO模型训练工具简介
- 使用ONNX和Torchscript加快推理速度的测试
- tensorflow GPU环境安装踩坑日记_tensorflow配置gpu环境
- Keye-VL-1.5-8B 快手 Keye-VL— 腾讯云两卡 32GB GPU保姆级部署指南
- Gateway_gateways
- Coze开源本地部署教程_开源canopen
- 扣子开源本地部署教程 丨Coze智能体小白喂饭级指南
- 标签列表
-
- cmd/c (90)
- c++中::是什么意思 (84)
- 标签用于 (71)
- 主键只能有一个吗 (77)
- c#console.writeline不显示 (95)
- pythoncase语句 (88)
- es6includes (74)
- sqlset (76)
- apt-getinstall-y (100)
- node_modules怎么生成 (87)
- chromepost (71)
- flexdirection (73)
- c++int转char (80)
- mysqlany_value (79)
- static函数和普通函数 (84)
- el-date-picker开始日期早于结束日期 (76)
- js判断是否是json字符串 (75)
- c语言min函数头文件 (77)
- asynccallback (87)
- localstorage.removeitem (74)
- vector线程安全吗 (70)
- java (73)
- js数组插入 (83)
- mac安装java (72)
- 无效的列索引 (74)