用神经网络解决二分类问题时,由于正类训练样本过少,导致所有的预测结果全是负的。我该怎么办?

理由
举报 取消

我用的是一个3层的NN,网络结构是(28, 50, 2 ) 正负样本的比例大概是1:1000(我没办法收集到更多的正样本了)

2017年7月4日 3 条回复 1278 次浏览

回复 ( 3 )

  1. 张馨宇
    理由
    举报 取消

    首先你要回答两个问题:你的样本总量多大,总体的实际正负样本比例。

  2. wang ryan
    理由
    举报 取消

    unbalanced data说实话要sampling也是非常困难的,比例是一方面,要求样本量足够大,小样本的话貌似有一些svm的专门研究这方面的

  3. 点滴又天明
    理由
    举报 取消

    最近也遇到类似问题,不过我不是专用神经网络。

    我所知道的一个很常用的方法,就是sampling,来产生“新”的数据,或者丢弃“多余”的数据。具体又有很多不同的算法操作

    下面这篇文章讨论的比较详细,可以参考一下:

我来回答

Captcha 点击图片更换验证码