网站首页 > 技术文章 正文
xgboost是目前最火热的模型之一
调参是机器学习的黑暗艺术,通常最优的模型参数依赖于场景,基本上没有一个普适的方法。xgboost是现阶段使用特别多的一个模型,这里只能一个简单的调参指引
理解偏置-方差的权衡
这个偏置-方差 权衡的概念是一般机器学习或者统计课程当中的基本概念。其基本思路就是如果我们允许模型变得更加复杂,例如加深gbdt的每棵树,模型就拥有更好的逼近能力,从而得到偏置更小的模型,但是我们需要更多的训练数据。大多数xgboost中的参数都是偏置-方差的权衡。最好的参数会权衡好最终模型的复杂程度和预测能力。这里将从过拟合控制和非平衡数据出发考虑参数
控制过拟合:
当我们观察到训练的时候准确率非常高,但是测试准确率很低的时候,就是模型过拟合的时候通常xgboost的使用中,我们有两个方法去控制过拟合现象
第一个方法是直接控制模型的复杂度
这里面包括max_depth,min_child_weight和gamma
第二种方法是在模型中添加随机性来提高鲁棒性
包括subsample和colsample_bytree参数
我们还可以降低步长eta,但是需要记得同时提高树的棵树
处理非平衡数据集
通常而言广告的点击率预估数据集都是非平衡的。这其实会影响最终xgboost学习得到的模型,通常我们有两个方法来改善
如果最终模型是为了提高预测的auc
调整scale_pos_weight平衡正负样本的权重
使用auc来做验证
如果最终模型看重预测的正确率
通过设置参数max_delta_step来帮助模型收敛
猜你喜欢
- 2024-10-08 一文了解RF,GBDT,XGBoost,lightGBM之间的异同
- 2024-10-08 Mars Remote API轻松分布式执行Python函数
- 2024-10-08 如何画XGBoost里面的决策树?(决策树 graphviz)
- 2024-10-08 AI算法机器学习常见面试题(四)(ai算法测试工程师面试)
- 2024-10-08 Python机器学习库Sklearn系列教程(21)-参数优化
- 2024-10-08 LightGBM的参数详解以及如何调优(lightgbm模型是什么)
- 2024-10-08 XGBoost在携程搜索排序中的应用(携程排名规则)
- 2024-10-08 94《风控炼丹炉模型调参-课程简介》(视频版)
- 2024-10-08 XGBoost介绍(xgboost中文名是什么)
- 2024-10-08 如何选择最佳模型:GBDT、LightGBM、XGBoost、AdaBoost 轻松上手
- 10-02基于深度学习的铸件缺陷检测_如何控制和检测铸件缺陷?有缺陷铸件如何处置?
- 10-02Linux Mint 22.1 Cinnamon Edition 搭建深度学习环境
- 10-02AWD-LSTM语言模型是如何实现的_lstm语言模型
- 10-02NVIDIA Jetson Nano 2GB 系列文章(53):TAO模型训练工具简介
- 10-02使用ONNX和Torchscript加快推理速度的测试
- 10-02tensorflow GPU环境安装踩坑日记_tensorflow配置gpu环境
- 10-02Keye-VL-1.5-8B 快手 Keye-VL— 腾讯云两卡 32GB GPU保姆级部署指南
- 10-02Gateway_gateways
- 最近发表
-
- 基于深度学习的铸件缺陷检测_如何控制和检测铸件缺陷?有缺陷铸件如何处置?
- Linux Mint 22.1 Cinnamon Edition 搭建深度学习环境
- AWD-LSTM语言模型是如何实现的_lstm语言模型
- NVIDIA Jetson Nano 2GB 系列文章(53):TAO模型训练工具简介
- 使用ONNX和Torchscript加快推理速度的测试
- tensorflow GPU环境安装踩坑日记_tensorflow配置gpu环境
- Keye-VL-1.5-8B 快手 Keye-VL— 腾讯云两卡 32GB GPU保姆级部署指南
- Gateway_gateways
- Coze开源本地部署教程_开源canopen
- 扣子开源本地部署教程 丨Coze智能体小白喂饭级指南
- 标签列表
-
- cmd/c (90)
- c++中::是什么意思 (84)
- 标签用于 (71)
- 主键只能有一个吗 (77)
- c#console.writeline不显示 (95)
- pythoncase语句 (88)
- es6includes (74)
- sqlset (76)
- apt-getinstall-y (100)
- node_modules怎么生成 (87)
- chromepost (71)
- flexdirection (73)
- c++int转char (80)
- mysqlany_value (79)
- static函数和普通函数 (84)
- el-date-picker开始日期早于结束日期 (76)
- js判断是否是json字符串 (75)
- c语言min函数头文件 (77)
- asynccallback (87)
- localstorage.removeitem (74)
- vector线程安全吗 (70)
- java (73)
- js数组插入 (83)
- mac安装java (72)
- 无效的列索引 (74)