如何优雅地找到一个学校或公司的所有名称?

理由
举报 取消

有些学校或者公司,会不止有一个名称或缩写,例如University of Science and Technology of China, USTC;Beihang university, BUAA; 再比如UC Berkeley, University of California,Berkeley, Berkeley, UCB;像一些研究所Agency for Science, A*STAR;怎么才能优雅的找到一个给定机构的所有合理名称呢?

2017年12月19日 3 条回复 1272 次浏览

发起人:李强 初入职场

比较关注经济,比较擅长写商业方面的文章

回复 ( 3 )

  1. 蝙蝠果
    理由
    举报 取消

    先膜强爷。。@李强

    我猜应该是上wikipedia爬吧…

    Wikipedia 两大定律

    1、假设Wikipedia 是全的

    2、如果某条Wikipedia 不全,那么帮它补全。。。

  2. 陈维尧
    理由
    举报 取消

    谢邀。只看题目时以为是在谈关于实体识别的问题,最近工作就在头疼这方面的工作,去从网页信息中识别企业机构名称,同时判别网页中哪些词是一个产品词,来建立与企业机构的关系,有相关经验的朋友欢迎交流。

    回归本题,给这种比较正规知名的学校、公司找全称时,首选就是wiki这种百科类工具了吧,科普性地对介绍和说明,信息比较全。需要考虑的是关注度稍低的机构可能并没有太完善的百科信息,也就只能依赖搜索引擎找到官网来看看自己用的名称了。似乎没有特别好的手段来比较精确说明。

    讨论这个问题想提一提与此类似的实体识别问题,即同一实体,具有全称、简称、别称等多种称呼时如何识别。这方面的操作性上,就需要搞些机器学习和模型建立的工作了。暂时留待编辑。

我来回答

Captcha 点击图片更换验证码