用户名*
邮箱*
密码*
确认密码*
验证码* 点击图片更换验证码
找回密码
忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。
来,咱们从头开始推一遍不就明白了吗?
由书上192页习题8.1,我们知道,这里令为分类器正确预测的概率,假设每个基分类器的正确预测概率相同。
对,有Hoeffding不等式,则当向下取整时(因为打不出来向下取整只能用文字描述),,因为,所以。
因为这也就表示只有在的时候这个式子才会有意义,也就是说当时不能用这个式子估计。
在用简单的多数投票方法做集成的时候,单个分类器的错误率不能大于0.5,否则(8.3)那个bound是不成立的。
前一页中说了分类器应该“好而不同”,在多数投票的时候,“好”就是至少得比随机猜($\epsilon=0.5$)好。
对,你理解的没错,只不过基分类器错误率越大,需要的数量越大,毕竟里面那项是带平方的!然后还乘2……
然后周老师写得很清楚啊,这是个理想条件下的公式,也就是说只能定性分析一下,现实中,这个bound没卵用。
理想条件,就是不能满足的条件,然后我不觉得有什么好方法能定量推算与『各个分类器错误率独立』这理想条件间的差距。
基分类器数目一定,错误率0.99和错误率0.01的效果是一样的,错误率是0.5时集成错误率是上限是1,也就是说基分类器不能表现的不能太中庸的意思嘛,我实在理解不了错误率0.99分类器组合起来也可以很强大:
P(f(x) != H(x)) = ∑C(T, i)*0.01^i *0.99^(T-i) =很小 (应该很大才对啊),i从0到T/2
求解惑
昵称*
E-Mail*
回复内容*
回复 ( 4 )
来,咱们从头开始推一遍不就明白了吗?
由书上192页习题8.1,我们知道,这里令为分类器正确预测的概率,假设每个基分类器的正确预测概率相同。
对,有Hoeffding不等式,则当向下取整时(因为打不出来向下取整只能用文字描述),,因为,所以。
因为这也就表示只有在的时候这个式子才会有意义,也就是说当时不能用这个式子估计。
在用简单的多数投票方法做集成的时候,单个分类器的错误率不能大于0.5,否则(8.3)那个bound是不成立的。
前一页中说了分类器应该“好而不同”,在多数投票的时候,“好”就是至少得比随机猜($\epsilon=0.5$)好。
对,你理解的没错,只不过基分类器错误率越大,需要的数量越大,毕竟里面那项是带平方的!然后还乘2……
然后周老师写得很清楚啊,这是个理想条件下的公式,也就是说只能定性分析一下,现实中,这个bound没卵用。
理想条件,就是不能满足的条件,然后我不觉得有什么好方法能定量推算与『各个分类器错误率独立』这理想条件间的差距。
基分类器数目一定,错误率0.99和错误率0.01的效果是一样的,错误率是0.5时集成错误率是上限是1,也就是说基分类器不能表现的不能太中庸的意思嘛,我实在理解不了错误率0.99分类器组合起来也可以很强大:
P(f(x) != H(x)) = ∑C(T, i)*0.01^i *0.99^(T-i) =很小 (应该很大才对啊),i从0到T/2
求解惑