jieba中文分析怎么导入自己的数据集啊? 举报 理由 举报 取消 网上很多都是自带的数据集,这个数据集应该是什么格式啊? 2017年12月26日 2 条回复 1502 次浏览 Python,中文,分词,数据挖掘,编程,自然语言
回复 ( 2 )
@Phil Chow 的回答已经很好了,一般来说词频和词性(尤其是词频)很难把握,所以我在使用时经常省略掉,因为调不好的很影响分词效果,还不如不设.
恰巧之前做项目用了jieba分词,也算是第一次正经答题。
使用语言:python
载入字典: