挖掘 - 12Reads管理问答

可以通过对招聘网站登出的不同岗位数量进行采集挖掘来判断行业趋势吗？技术上怎么做最容易实现？

sailor 2018-02-04 1493 次浏览

查看全文

求问如何保证文本的特征向量维数一样大？

乐呵呵 2018-01-01 940 次浏览

问题：目前在做微博聚类，对微博分词之后，采用Google开源的Word2Vec进行词向量的训练，每个词对应一个1*N维的向量，然后对微博进行关键词提取，由于微博的长度不一致导致会产生每个微博提取出来的关键词个数不同，怎么才能保证每条微博由关键词词向量构成的特征向量维数一样呢？除了将每个词向量加起来求平均还没有有其他方法？

查看全文

文本聚类目前的研究现状是什么样的？如果想从事相关研究有哪些好的研究方向吗？

蓁蓁尔 2017-12-23 951 次浏览

查看全文

本人刚接触文本数据的学习，目前想得到有关论文数据集的几个相似矩阵，论文数据信息（已经筛选，剔除了信息不完整的论文）已插入数据库（mysql）中，总共含有26篇论文数据。存储信息如下：id是插入数据库时形成的id；paper是论文题目；name是文章的所有作者；date是出版时间；journal是出版机构；indexx是论文在整个论文数据集中的索引；qoutee是该论文的引用；（是被引用论文在数据集中索引，因一篇论文有多篇引用，故以#%分隔开，）abstra是论文的摘要；需求：现在想得到论文之间的互相引用情况，形成一个26万X26万的矩阵，如果论文A引用B，等同于B被A引用，则矩阵中P[A][B]=1,同时P[B][A]=-1，如果A […]

查看全文

r语言读取文本文件乱码？

aiyaya 2017-12-14 1174 次浏览

文本挖掘，用r语言读取txt文件时news

查看全文

R下怎么加载本地的zip包？

Robot 2017-11-28 1509 次浏览

在做文本挖掘时，rwordseg包加载不了，搜索解决办法中有人建议下载在本地，再用R加载本地的zip包即可，但是要怎么加载呢？望知之者能回答一下，万分感谢！

查看全文

spss modeler支持中文的文本挖掘吗？效果如何？

Dill Zheng 2017-11-13 1198 次浏览

spss modeler14.1开始有文本挖掘的出现，不知道对中文方面支不支持？如果支持，效果如何？（话说熟悉其英文文本挖掘的大神也可以介绍介绍，对modeler在文本挖掘方面不是很了解）

查看全文

文本分类中是把一个文档作为一个文件然后对其处理？

Sundays Zhang 2017-10-13 872 次浏览

1.文本分类中，对其进行分词句法标注等等操作的时候是把一个文本当作一个文件处理嘛？3.文本分类的分类符号（1，0）在哪里标注，也写到那个文本文件里嘛？2.那对于句子分类，是不是就要把一个句子当作一个文件处理呢？

查看全文

R语言做文本挖掘，用deleteWords（"第位"）没用怎么回事。具体是分词的时候56行那个第位？

aiyaya 2017-10-09 1254 次浏览

查看全文

python(x,y)在linux系统怎么安装？

空城旧眸 2017-09-25 827 次浏览

做词向量分析，在本地Windows系统已经实现了，但是本地内存4G，训练词向量时经常出现MemoryError。想在虚拟机上安装python(x,y)，然后安装gensim，做词向量分析，但虚拟机是linux系统。所以想请教下，如何在linux系统上安装python(x,y)，是不是有专门的linux版本，有的话，提供给我。谢谢啦。

查看全文

1 2

找回密码

可以通过对招聘网站登出的不同岗位数量进行采集挖掘来判断行业趋势吗？技术上怎么做最容易实现？

求问如何保证文本的特征向量维数一样大？

文本聚类目前的研究现状是什么样的？如果想从事相关研究有哪些好的研究方向吗？

基于引文的论文推荐系统的相似矩阵如何有效的形成？

r语言读取文本文件乱码？

R下怎么加载本地的zip包？

spss modeler支持中文的文本挖掘吗？效果如何？

文本分类中是把一个文档作为一个文件然后对其处理？

R语言做文本挖掘，用deleteWords（"第位"）没用怎么回事。具体是分词的时候56行那个第位？

python(x,y)在linux系统怎么安装？

帐户注册

登录

找回密码