优秀的编程知识分享平台

网站首页 > 技术文章 正文

94《风控炼丹炉模型调参-课程简介》(视频版)

nanyue 2024-10-08 05:40:47 技术文章 8 ℃

风控炼丹炉模型调参。

我们的主题是风控的炼丹炉模型调参。这个课的主要内容就是在构建风控的评分卡的时候会做很多的模型。在这个模型里面跟模型的性能相关的不仅仅只是特征本身,还有模型本身的一些参数,也对模型的最终结果有一个比较大的影响。

先回顾一下构造风控的评分卡的整体流程。不管在做a卡、b卡、c卡,首先得到的是用户相关的一些数据,它有特征部分还有标签部分。对它的特征进行加工,形成x的音谱,对标签有定义,得到了输出值和y。把x和y拿到手之后放到模型里面去。

在评分卡当中一般会使用几种模型,像逻辑回归或者是一些集成学习。大家常用的像extra booth、gbm还有tat booth都属于集成学习这类的模型。当然还有现在有一些在使用一些libfm、uh factorization、machine、uh neural network,像这一类的模型也都在尝试当中。

但目前来讲相对主流的模型算法还是以集成学习的这一类为主。这堂课主要的就是在讲基于集成学习方面的模型的参数有哪一些,模型的参数怎么进行调节。

首先对集成学习这一类的模型有一个简单的理论介绍,这样大家对这类的参数就会有一个认知,怎么去调参数,模型会往好的方向去发展。这样大家在挑战过程当中就知道参数怎么去影响到最终模型的结果。

介绍主要的目的是这一些,本次的介绍当中会有一些数学公式,大家也不用特别的担心,不需要百分之百理解这些公式,只需要在一些感性的认识上了解这些公式的一些方向性的作用,从而在参数进行调节的时候知道怎么去影响模型就可以了。

大家如果有任何的问题都可以在群里去说,在讲的过程当中会在群里面去看大家的一些问题,看到了就会及时的回复大家。本次课程的课件和数据还有代码部分大家都可以去自己使用一下,如果有问题都可以反馈给我。

这次分享主要分成几个部分。

·第一部分会简单的介绍一下gbdt这一类的模型的一些介绍。gbdt就是规定boost这一类的集成学习的一些方法,主要其实就是主流的三个hgboost、gbm和thatboost。在日常使用过程当中以like gbm来讲,最 popular的。这次课程的代码部分也会以这个来进行讲解。

·第二部分就是在介绍完模型之后介绍它的参数有哪一些,并且是怎么去影响模型的。

·第三部分就是参数调节的三种主流的方法。

→第一个是random search,也就是随机的去猜,这个是最简单粗暴的方式。

→第二个是great search,就是网格搜索,这个也是sk乐提供的比较好的接口,它有好的地方也有不好的地方,待会也会去介绍一下。

→第三个是bs优化,这个也是今天重点要介绍的方法,它也有好的地方而不好的地方,待会会比较一下在什么情况下应该用古语测试,在什么情况下应用。bs小平板这些一般简称叫做beyond。

·第六部分就是一些综合使用,在这些方法都有它的优点和缺点,要把它的优点发挥出来,尽量要避免它的一些缺陷,就要去进行一些综合的使用。

最后再给大家演示一个实操的案例。

Tags:

最近发表
标签列表