adaboost有训练数据和测试数据之分吗,还是所有的数据都用作训练数据?

理由
举报 取消

最近研究AdaBoost,但是网上的讲解都是使用所有的数据训练用做最终分类器的训练,而没有测试过程。这样怎么检测它的泛化能力呢?如果有测试数据的话,对测试数据进行训练当然可以达到很高的分类真确率,但是不一定会有高的泛化能力啊,请大神们解答疑惑,谢谢!

2017年8月28日 4 条回复 1270 次浏览

发起人:冷槽君 管理大师

知之为知之

回复 ( 4 )

  1. Lillian Song
    理由
    举报 取消

    1. adaboosting可以很好的克服overfitting的问题。所以一般不需要validation set

    2. 模型的训练一般需要training validation testing三类数据集。但影响模型参数的只是前两类。

    3. 所有模型当然要有testing set作为参考来评估模型的效果。

  2. 张馨宇
    理由
    举报 取消

    adaboost多个啥,没有任何不区分训练数据和测试数据的算法。

    你看看做adaboost的论文,看看里面实验结论都咋写的。不写测试集上的效果能发表吗?

    不要看到一部分『教程』怎样就怎样了,这是overfitting^_^

  3. Cao Jingjia
    理由
    举报 取消

    谢邀。

    要。

    参考资料-《机器学习实战》第一版,p127。

  4. 匿名用户
    理由
    举报 取消

    什么鬼教程啊

    1. 必须用测试集来评估模型准确性

    2. boosting相对单一模型必定能提高泛化能力

我来回答

Captcha 点击图片更换验证码