如何优雅地找到一个学校或公司的所有名称? 举报 理由 举报 取消 有些学校或者公司,会不止有一个名称或缩写,例如University of Science and Technology of China, USTC;Beihang university, BUAA; 再比如UC Berkeley, University of California,Berkeley, Berkeley, UCB;像一些研究所Agency for Science, A*STAR;怎么才能优雅的找到一个给定机构的所有合理名称呢? 2017年12月19日 3 条回复 1272 次浏览 信息检索,数据库,数据挖掘
回复 ( 3 )
先膜强爷。。@李强
我猜应该是上wikipedia爬吧…
Wikipedia 两大定律
1、假设Wikipedia 是全的
2、如果某条Wikipedia 不全,那么帮它补全。。。
google
谢邀。只看题目时以为是在谈关于实体识别的问题,最近工作就在头疼这方面的工作,去从网页信息中识别企业机构名称,同时判别网页中哪些词是一个产品词,来建立与企业机构的关系,有相关经验的朋友欢迎交流。
回归本题,给这种比较正规知名的学校、公司找全称时,首选就是wiki这种百科类工具了吧,科普性地对介绍和说明,信息比较全。需要考虑的是关注度稍低的机构可能并没有太完善的百科信息,也就只能依赖搜索引擎找到官网来看看自己用的名称了。似乎没有特别好的手段来比较精确说明。
讨论这个问题想提一提与此类似的实体识别问题,即同一实体,具有全称、简称、别称等多种称呼时如何识别。这方面的操作性上,就需要搞些机器学习和模型建立的工作了。暂时留待编辑。