帐户注册

登录

找回密码

忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。

利用大数据能识别淫秽视频吗?

最近快播案炒的沸沸扬扬,作为一个技术人员,从技术的角度考虑大数据能否识别淫秽视频!本人才疏学浅,了解十分有限,求大神分析从大数据聚类和机器学习两个领域来做这件事的可行性

查看全文

训练集合中,标签大量缺失,是否有比较成熟的处理方式?

注意:是标签缺失,并不是数据缺失拒绝推断问题问题是0、1分类有分类器A,分类器A(也是用于同一分类,暂且认为这个分类器是有效的,好于随机但也不够理想)判断为1以后,才可以知道样本的真实标签,换句话说,样本有两个标签,真实标签和是否通过分类器A。如果没有通过分类器A,那么也没有真实标签。问:现在需要训练分类器B取代分类器A,但可以用的有真实标签的样本是已经通过了分类器A的。现在分类器A已经没有了,而且不可知。如果只用知道样本的真实标签的数据进行训练比如会出现偏差(因为分类器A已经过滤了一部分)。怎么处理这个问题?或者说怎么将原本没有通过A的样本的标签表示出来?

查看全文