随机森林样本选择的个数是多少? 举报 理由 举报 取消 如果原始数据集N个样本点,我建K棵树,需要K个样本集,每个样本集的样本点个数是多少?也是用bootstrap无放回抽样选N个吗? 2017年5月25日 1 条回复 640 次浏览 学习,数据挖掘,机器
回复 ( 1 )
随机森林关键是让每一棵树随机地得到一部分样本的一部分特征来构建这棵树。每一棵树都无法得到样本集的所有信息。
我通常是有放回地抽样,一棵树抽一个比例的样本出来。特征也按一个比例随机选择。这两个比例设为多少就看你的实际情况了,跟数据有关。我通常从25%、25%开始试。