发起人:石杰 初入职场

回复 ( 3 )

  1. sighingsnail
    理由
    举报 取消

    看题主要的“模糊”需要实现到什么程度了

    如果只是要实现mysql里的like级别的“模糊”,那么就按单字切割、建立倒排索引、用检索词的多条拉链取交即可

    如果更复杂一些,还要实现同义词的“模糊”,例如查找“中科大”,可以将“中国科技大学-小明教授”这个用户检索出来,那就要搞个词库、切词后用与或树得到结果

    如果还要将大量结果按相关性排好序,那还要实现一套计算相关性的算法。。。

  2. 陆之秀
    理由
    举报 取消

    楼上匿名是对的,比较合理的做法是遍历一遍整个数据库,对其包涵的每一个字建立一个目录,代码的例子就是map>. 花–>, 梨–>,校–>.这里的set推荐用hashset.这样只需要遍历数据库创建这样一个目录系统。以后每次找直接相应的词语的目录就好了,这里同样可以把关键词存在一个哈希表里。预处理真是提高效率的神器。

  3. 匿名用户
    理由
    举报 取消

    把这个字段单独拉出来,建索引,昵称分类,就啪啦啪啦的出来了

我来回答

Captcha 点击图片更换验证码