word2vec Out of dictionary word!为什么呢? 举报 理由 举报 取消 在虚拟机win 8下运用Xshell连接到linux服务器运行这个word2vec,各项工作都已做好,为什么运行distance vectors.bin的时候出现了Out of dictionary word!。另外,我没用distance vectors.bin命令,直接用java代码来解决bin文件,结果eclipse崩了补充一句:语料是我自己分好词的UTF8文本,再者我在文本里直接写入几个词来运行都不行啊。请各位大神解答一下,多谢。 2017年12月23日 7 条回复 1302 次浏览 word2vec,数据挖掘,自然语言
回复 ( 7 )
这个问题很好解决,distance命令的输入必须是二进制文件
直接说吧,问题在于你生成的vectors.bin可能不是二进制文件,建议你重新生成一下vectors.bin,并注意demo-word.sh文件中-binary后面必须跟着1 。
不知道有人现在解决没?我也遇到这个问题了
看一下你的训练文本格式,我之前遇到过,后来改为utf-8格式就正确了
请补充问题:
1.运行word2vec时的命令行参数是什么
2.word2vec是在哪里下载的哪个版本
3.linux服务器的环境是什么样的
4.处理vectors.bin的java代码是什么
我也遇到这类问题,输入数字可以,但输入具体term就 out of dictionary
请问楼主解决这个问题了吗,我也遇到这样的问题吖吖,求助!