程序问答   发布时间:2022-06-02  发布网站:大佬教程  code.js-code.com
大佬教程收集整理的这篇文章主要介绍了LightGBM 无法预测验证集 (R)大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。

如何解决LightGBM 无法预测验证集 (R)?

开发过程中遇到LightGBM 无法预测验证集 (R)的问题如何解决?下面主要结合日常开发的经验,给出你关于LightGBM 无法预测验证集 (R)的解决方法建议,希望对你解决LightGBM 无法预测验证集 (R)有所启发或帮助;

我在极端不平衡的数据集(使用 R)上实施 lightGBM 时遇到了大麻烦

确实,我正在处理一个二元分类问题,目标变量的分布约为 1:800

(大约:0 类:110 000 第 1 类:140 )

我有近 300 个变量(它们是 12 个月内动态变量的汇总)和几个分类变量。

在以下所有内容中,我的评估是 F1 分数,我使用的指标是 二进制对数损失

我尝试了两种方法:一种使用重采样技术,一种不​​使用。

第一种方法

  1. 首先,我决定对我的分类变量进行 LabelEncode(因为 ADASYN 不虑分类变量作为输入)

  2. 我尝试了 SMOTE/ADAZYN 和 NearMiss/RandomUnderSampler 的不同组合来重新采样我的训练集

  3. 我标准化了我的数值变量

  4. 我在训练集上训练我的模型并在我的验证集上进行预测(没有为 lgb.Train 中的正类指定参数 scale_pos_weight)

  5. 我得到了一些非常糟糕的结果:
    在训练集上:F1-score=0.5
    在测试集上:F1-score=0.04

第二种方法

与第一个相同,但我没有在训练集上使用重采样技术。
在我的情况下,我只设置了 scale_pos_weight = count(negativE)/count(positivE) ~ 800

我尝试调整参数,但我觉得我错过了一些东西,因为验证集上的 F1 分数仍然在 0.02 左右..

你对我如何改进我的模型有什么想法吗?

非常感谢您的帮助!

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

大佬总结

以上是大佬教程为你收集整理的LightGBM 无法预测验证集 (R)全部内容,希望文章能够帮你解决LightGBM 无法预测验证集 (R)所遇到的程序开发问题。

如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。