数据集构造都有哪些节省人力成本的tricks?

理由
举报 取消

最近在做一些机器学习相关的task,但是数据集太难构造了(文本的,主要是人工标注太辛苦,自己标了大概有1000多条文本),因此在数据集构造上有点随意,导致数据集噪声偏大,交叉验证的结果和测试集上的表现完全不一样,但是1w多条都要自己标的话会很辛苦。因此在此想问下大家遇到这个问题都是怎么做的?

2017年9月18日 1 条回复 1078 次浏览

回复 ( 1 )

我来回答

Captcha 点击图片更换验证码