大数据环境下档案迁移问题的研究? 举报 理由 举报 取消 最近老师出的题目,感觉不知道该从什么方面下手,上网查了很多有关大数据的,但是总感觉这需要一个迁移系统,无奈论迁移系统做不到啊。所以请大家帮帮忙有木有好的切入点理论上的,然后写一篇毕业论文。急求,救命 2017年7月15日 2 条回复 1114 次浏览 专业,信息,数据,档案,档案管理
回复 ( 2 )
其实有好多东西可以考虑,但是都是实战的,理论的东西提取起来比较麻烦,可以看看sqoop跟flume。一个是有schema的一个是文本的,但是这些可以写的理论的东西不多。
如果单纯是迁移的话,一般现在用kafka做的很多,这个是个分布式队列问题,如果用队列作为理论的话,可以写的东西就很多了,比如数据切分,你是不是可以自定义数据切分,比如failover,比如保顺序,你只要随便找一个搞分布式队列的理论文章来就可以了。
中国的人事档案属于那个时代数据信息最全的材料,是一种整合一定资源辅助于户籍信息的材料。考虑到历史人口迁移和城镇化进程等历史大事件,选择好分析模型也许会对你有帮助……好了我编不下去ˊ_>ˋ