用神经网络解决二分类问题时,由于正类训练样本过少,导致所有的预测结果全是负的。我该怎么办? 举报 理由 举报 取消 我用的是一个3层的NN,网络结构是(28, 50, 2 ) 正负样本的比例大概是1:1000(我没办法收集到更多的正样本了) 2017年7月4日 3 条回复 1304 次浏览 Deep,Learning,学习,数据,深度,神经网络
回复 ( 3 )
首先你要回答两个问题:你的样本总量多大,总体的实际正负样本比例。
unbalanced data说实话要sampling也是非常困难的,比例是一方面,要求样本量足够大,小样本的话貌似有一些svm的专门研究这方面的
最近也遇到类似问题,不过我不是专用神经网络。
我所知道的一个很常用的方法,就是sampling,来产生“新”的数据,或者丢弃“多余”的数据。具体又有很多不同的算法操作
下面这篇文章讨论的比较详细,可以参考一下: