我刚读研一,自己对大数据的处理分析比较感兴趣,导师让我看深度学习方面的论文和deeplearning4j方面的算法源代码,但是自己不知道如何把spark和深度学习结合起来,以后还是想出来工作的不做研究,我该怎么做呢,对了,学习spark需要hadoop基础,我现在没有这方面基础,只有java基础。
查看全文关于matlab下的libsvm使用?
就是选取一系列样本作为列,然后选一系列特征值作为行,成为instance矩阵,然后再把每一个样本的class标出来,写成一个向量的形式,用svmtrain并选用核函数得到model,然后用svmpredict和model预测testinstance矩阵中例子的class,是这样吗?
查看全文如何准确的统计用户流失率?
我们需要对一个智能电视平台做用户流失率的分析,维度为日、月、季度、年用户流失率,形成趋势图。如过界定超过30天未使用产品,就算作流失用户的话,那么如何统计用户流失率。例如统计月度的流失用户率,那么这个月的流失用户是否是每天流失用户相加,分母是否是的总用户数,还是这个月内的使用用户呢?
查看全文数据库开发和ETL以后的发展方向是什么?
现在的工作是做oracle开发,会做ETL数据抽取。那么这种工作性质以后是往哪个方向发展,是数据分析还是数据仓库还是什么,那需要接着学习哪些方面的知识来增加技术能力?应该是大数据方向吧,但是没有接触过hadoop
查看全文数据分析师可以创造什么价值?
题主想从事数据分析师,但是对于此岗位了解甚少,希望大牛能解答:1数据分析师的作用(直白点就是能干什么),2数据分析师的薪资水平,3未来特别是互联网行业非常需要数据分析师吗。
查看全文传统BI业务用Hadoop家族产品完全重做,应该怎样选型?
公司从事医疗保险行业BI已经十余年,近期在考虑试水转移到Hadoop,应该搭建怎样的一个结构?数据量并不是很大,最大的项目不超过4T。比较关心的是ETL能否转移到Hadoop,转移后效率能否变高?OLAP部分应该怎样去替换?想用WebService做OLAP结果输出到以前的UI,这个需要用什么做?
查看全文如果我要统计一个贴吧的各类数据,应该学习些什么?
比如我想知道这个贴吧每天的关注数发帖数的变化,以及发帖高低峰是什么时间段?每天的访客数和点击数以及高低峰时间段?访问页面平均时长?当天什么话题内容提及最多讨论最多?我的目的是想做一个学校贴吧的数据分析报告,要用的就是上述数据,那么我应该使用什么工具呢?如果要学习的话我该从哪方面下手?请多指教,谢谢!
查看全文大数据交易在行业内尚未形成规模、交易细则尚未制定的情况下,应该如何定价?
现在各省都在积极组建大数据交易中心、交易所,可是,在这些数据进行交易的过程中,都是如何来定价的。据我了解,目前政府可以公开的数据基本都是免费的,如果放至交易平台,是否会收费?个人企业这一块,是完全由卖方来定价么?有没有哪些大数据交易平台已经开始在制定这些交易规则的
查看全文