数据集构造都有哪些节省人力成本的tricks? 举报 理由 举报 取消 最近在做一些机器学习相关的task,但是数据集太难构造了(文本的,主要是人工标注太辛苦,自己标了大概有1000多条文本),因此在数据集构造上有点随意,导致数据集噪声偏大,交叉验证的结果和测试集上的表现完全不一样,但是1w多条都要自己标的话会很辛苦。因此在此想问下大家遇到这个问题都是怎么做的? 2017年9月18日 1 条回复 1088 次浏览 分析,学习,数据,数据挖掘,机器,自然语言
回复 ( 1 )
花钱雇人标