大数据环境下档案迁移问题的研究?

理由
举报 取消

最近老师出的题目,感觉不知道该从什么方面下手,上网查了很多有关大数据的,但是总感觉这需要一个迁移系统,无奈论迁移系统做不到啊。所以请大家帮帮忙有木有好的切入点理论上的,然后写一篇毕业论文。急求,救命

2017年7月15日 2 条回复 1132 次浏览

发起人:团团 初入职场

回复 ( 2 )

  1. 桂能
    理由
    举报 取消

    其实有好多东西可以考虑,但是都是实战的,理论的东西提取起来比较麻烦,可以看看sqoop跟flume。一个是有schema的一个是文本的,但是这些可以写的理论的东西不多。

    如果单纯是迁移的话,一般现在用kafka做的很多,这个是个分布式队列问题,如果用队列作为理论的话,可以写的东西就很多了,比如数据切分,你是不是可以自定义数据切分,比如failover,比如保顺序,你只要随便找一个搞分布式队列的理论文章来就可以了。

  2. 单仁
    理由
    举报 取消

    中国的人事档案属于那个时代数据信息最全的材料,是一种整合一定资源辅助于户籍信息的材料。考虑到历史人口迁移和城镇化进程等历史大事件,选择好分析模型也许会对你有帮助……好了我编不下去ˊ_>ˋ

我来回答

Captcha 点击图片更换验证码