短文本分类的解决方案? 举报 理由 举报 取消 刚开始看短文本分类(就是对于短信微博等进行分类),之前是用CHI(自己做了些修改)+TFIDF+NB(后两步是使用的spark完成的),现在刚开始看短文本分类,发现找到的短文分类的资料好像有点五花八门,之前在知乎上看到有人推荐使用LDA,现在自己看了看LDA,发现数学原理实在是太多了,请问大家能不能提供点思路,看的头疼 2017年12月8日 2 条回复 1226 次浏览 分类,数据,文本
回复 ( 2 )
我用CNN做了一个文本分类(多个class label),代码在这里:jiegzhan/multi-class-text-classification-cnn
用的是Word Embeddings
很快就可以上手去Train
目前想着基于twitterLDA做,但是还不知道这个算法怎么和短文本分类结合,有人用过吗,这个算法效果怎么样