刚开始用R处理文本挖掘方面的问题,想请教一下怎样用R算一组词的jaccard相似度。并且设置一个常数,根据相似度与这个常数的比较对词聚类,并用字符少的词语替换字符多的词语。谢谢。
查看全文SQL server 2012能做哪些商业智能分析和哪些数据挖掘与分析?
SQL server 2012能做哪些商业智能分析和哪些数据挖掘与分析?我没有计算机专业背景,SQL server 2012 对我的用途大吗 我主要做商业分析 而且我用它还为了想和excel联动办公
查看全文如何自动提取论文中的作者单位名称?
比如说我有一系列研究者的工作单位信息:作者A:High Performance Network Laboratory, Institute of Acoustics, Chinese Academy of Sciences, Beijing, China 100190作者B:Mohammed V Agdal University, Rabat and High School of Technology, Sale作者C:Department of Computer Science, University of Waterloo, Waterloo, Ontario, Canada; University of Indonesia, […]
查看全文如何看待「编诗姬」机器人写诗?
今天看到朋友圈分享的一个机器人自动作诗软件。可以填词作诗也可以随机生成。附上链接:帮你写诗的编诗姬你对这个机器人作诗软件怎么看?机器人创作是否会在未来取代人类创作?相比于人工作诗,机器人作诗的局限在哪里?有哪些算法实现一个作诗系统?需要考虑哪些特征?做一个写故事的机器人又有多难?
查看全文文本分析中的词性标注后,如何返回词性的名称?
我使用的ansj开源的java分词库,使用词性标注后,得到的都是标注符号,例如:n,v之类的,我如何获得对应的词性中文名词?比如名词、动词等等
查看全文