没有标注正负样本的情况下如何评估分类结果?

理由
举报 取消

评估分类结果的好坏时,一般用准确率和召回率,但是这个方法的前提是我有标注的正负样本。如果我没有正负样本的情况下,怎么知道我的分类结果好不好?一定要通过标注正负样本,然后计算F-Score来评估吗?比如:我在新浪微博随机抓取了1000万用户,我通过一些特征或规则,可以判断这些用户的性别,是否已婚,是否单身等等,那么我的这些规则可以看成是一个分类模型。在这种情况下,有什么办法可以评估我这个分类模型是否合理,或者如何评估我的这个分类模型的好坏呢?有没有比较通用的方法?

2018年1月23日 1 条回复 1270 次浏览

发起人:Blue01 初入职场

回复 ( 1 )

  1. 杨超
    理由
    举报 取消

    除了标注,你也可以有另一个在这个数据上效果已知分类器,或者某些关于数据的分布知识(比如特征和label的联合分布,这也可以看作是一个分类器了),可以帮助你做评估。但如果你对数据没有任何这些先验信息,你的评估是做不到的,不然人工智能问题就解决了一大半了。

    所以自己标注一点数据 然后在上面评估吧

我来回答

Captcha 点击图片更换验证码