挖掘同义词有哪些比较好的方法呢? 举报 理由 举报 取消 挖掘同义词有哪些比较好的方法呢?比如优劣和好坏就是一对同义词。或者有小伙伴用word2vec来挖掘过吗?效果怎么样,具体有什么方法呢? 2017年11月2日 3 条回复 1127 次浏览 word2vec,数据挖掘,计算机
回复 ( 3 )
word2vec区分不出来同义和同位,举个栗子,『北京』和『上海』,在word2vec里可能很近。
我不认为无监督的东西能很好的挖出同义词,至少需要类似于『点击日志』的用户行为带来的弱标注数据,才能挖得比较好。
所以建议结合自己的应用场景,从用户行为里面挖。如果实在没有用户行为,那就找本近义词典、辞海、英汉词典之类的算了。
nltk中有同义词包,你可以查查看看
distributional semantics