发起人:Robot 管理大师

回复 ( 2 )

  1. CristianoJason
    理由
    举报 取消

    @Phil Chow 的回答已经很好了,一般来说词频和词性(尤其是词频)很难把握,所以我在使用时经常省略掉,因为调不好的很影响分词效果,还不如不设.

    import jieba
    jieba.load_userdict(your_word_dict)
    input_file_object = open(your_CWS_filename, encoding='utf8')
    for line in input_file_object:
        seg_list = jieba.cut(line)
    input_file_object.close()
    
  2. Phil Chow
    理由
    举报 取消

    恰巧之前做项目用了jieba分词,也算是第一次正经答题。

    使用语言:python

    载入字典:

    jieba.load_userdict(file_name)  # file_name 为文件类对象或自定义词典的路径
    

我来回答

Captcha 点击图片更换验证码