word2vec Out of dictionary word!为什么呢?

理由
举报 取消

在虚拟机win 8下运用Xshell连接到linux服务器运行这个word2vec,各项工作都已做好,为什么运行distance vectors.bin的时候出现了Out of dictionary word!。另外,我没用distance vectors.bin命令,直接用java代码来解决bin文件,结果eclipse崩了补充一句:语料是我自己分好词的UTF8文本,再者我在文本里直接写入几个词来运行都不行啊。请各位大神解答一下,多谢。

2017年12月23日 7 条回复 1315 次浏览

回复 ( 7 )

  1. 呼广跃
    理由
    举报 取消

    这个问题很好解决,distance命令的输入必须是二进制文件

  2. 匡海波
    理由
    举报 取消

    直接说吧,问题在于你生成的vectors.bin可能不是二进制文件,建议你重新生成一下vectors.bin,并注意demo-word.sh文件中-binary后面必须跟着1 。

  3. 朱龙霞
    理由
    举报 取消

    不知道有人现在解决没?我也遇到这个问题了

  4. kele lvcha
    理由
    举报 取消

    看一下你的训练文本格式,我之前遇到过,后来改为utf-8格式就正确了

  5. 吴先
    理由
    举报 取消

    请补充问题:

    1.运行word2vec时的命令行参数是什么

    2.word2vec是在哪里下载的哪个版本

    3.linux服务器的环境是什么样的

    4.处理vectors.bin的java代码是什么

  6. 植觉
    理由
    举报 取消

    我也遇到这类问题,输入数字可以,但输入具体term就 out of dictionary

  7. 杨小猫
    理由
    举报 取消

    请问楼主解决这个问题了吗,我也遇到这样的问题吖吖,求助!

我来回答

Captcha 点击图片更换验证码