短文本分类的解决方案?

理由
举报 取消

刚开始看短文本分类(就是对于短信微博等进行分类),之前是用CHI(自己做了些修改)+TFIDF+NB(后两步是使用的spark完成的),现在刚开始看短文本分类,发现找到的短文分类的资料好像有点五花八门,之前在知乎上看到有人推荐使用LDA,现在自己看了看LDA,发现数学原理实在是太多了,请问大家能不能提供点思路,看的头疼

2017年12月8日 2 条回复 1246 次浏览

发起人:张勇 初入职场

张勇

回复 ( 2 )

  1. 张杰
    理由
    举报 取消

    我用CNN做了一个文本分类(多个class label),代码在这里:jiegzhan/multi-class-text-classification-cnn

    用的是Word Embeddings

    很快就可以上手去Train

  2. 张勇
    理由
    举报 取消

    目前想着基于twitterLDA做,但是还不知道这个算法怎么和短文本分类结合,有人用过吗,这个算法效果怎么样

我来回答

Captcha 点击图片更换验证码