挖掘同义词有哪些比较好的方法呢?

理由
举报 取消

挖掘同义词有哪些比较好的方法呢?比如优劣和好坏就是一对同义词。或者有小伙伴用word2vec来挖掘过吗?效果怎么样,具体有什么方法呢?

2017年11月2日 3 条回复 1112 次浏览

发起人:波波桑 初入职场

假若她日相逢,我将何以贺你?以沉默,以眼泪。

回复 ( 3 )

  1. 张馨宇
    理由
    举报 取消

    word2vec区分不出来同义和同位,举个栗子,『北京』和『上海』,在word2vec里可能很近。

    我不认为无监督的东西能很好的挖出同义词,至少需要类似于『点击日志』的用户行为带来的弱标注数据,才能挖得比较好。

    所以建议结合自己的应用场景,从用户行为里面挖。如果实在没有用户行为,那就找本近义词典、辞海、英汉词典之类的算了。

  2. 王医生
    理由
    举报 取消

    nltk中有同义词包,你可以查查看看

  3. 匿名用户
    理由
    举报 取消

    distributional semantics

我来回答

Captcha 点击图片更换验证码