零基础如何实现推荐系统?

理由
举报 取消

接到个任务,要三个星期内实现一个推荐系统。具体是基于用户的浏览记录推荐用户可能喜欢的。通过查阅后,想到将浏览数据导入hbase,基于hadoop平台 + spark mllib 来实现(不知道对不对)。现在过了一个星期,遇到问题如下:1. 将mysql数据导入hbase,借助sqoop工具,总是失败,不知道是不是版本不兼容问题。2. 该怎么将已有的数据转化成相应的模型,最后用mllib中的算法生成推荐的数据集。对hadoop和spark都不了解,急求大神指导!最好推荐一些书籍资料,备日后学习!诚心求教,不胜感激!

2017年11月17日 5 条回复 734 次浏览

发起人:Scharfsinnig 初入职场

I am a slow walker, but I never walk backwards.

回复 ( 5 )

  1. Stark Einstein
    理由
    举报 取消

    数据多大,有没有必要上分布式?

    推荐算法会不会?起码最基础的协同过滤要掌握。

  2. 猪头二
    理由
    举报 取消

    推荐系统 和技术其实没有太大的关系,真心的。。

    推荐系统主要是你起码要有比较全的用户方面的使用信息,然后根据这些使用信息进行:

    1.分类

    2.权重刚刚分完的类

    3.给出TOP N

    能做到这三点就算实现了简单的推荐系统了。而这三类的实现,每一种都有很多范畴。 所以层主可以根据这个思路 写出符合自己现阶段的代码。

    而XX导出数据报错这种。。。建议你还是谷歌百度,因为这种类似问题,其他人根本帮不了你,那就像走路,那些硬路你不走,你总不能插个翅膀上天吧。。 开玩笑~

  3. 匿名用户
    理由
    举报 取消

    谢邀,我不是很专业。

    1,我看到你要用hadoop+spark,不知道是否有这样的平台,据我所知,搭建hadoop+spark也是有点费事的;

    2,你是否查过spark mllib的算法API文档,MLlib – Spark 1.6.0 Documentation。目前这个库只实现了一个ALS CF,你若是要用其他算法,估计还得自己实现。

    3,没看明白你的这个系统里,“用户浏览历史”指的是什么历史?网页?商品?电影?当然,最简单的推荐就是统计每个用户最多浏览的东西。

  4. 张三
    理由
    举报 取消

    我觉得重点是算法设计,技术上的东西,都是小事

我来回答

Captcha 点击图片更换验证码