帐户注册

登录

找回密码

忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。

请各位大拿帮忙分析一下,使用ELK做日志数据挖掘的优缺点?

本人之前是做业务的日志分析,主要通过mysql或者python写脚本进行离线分析,项目会根据数据量大小使用java或者hadoop做实时分析。最近开始接触日至分析,这边主要基于ELK开发,个人有几个疑问,可能跟我接触的比较浅有关:1、elk带的kibana平台提供的图表类型比echart少太多,而且图表展示很不好看;2、对ES解析后的字段,通过kibana做分析,不能做多表join、字符串split、某个字段内like等自己通过脚本的二次分析(或者是我不熟ES的语法)3、后期我们打算对结构化的日志进行多维分析、建模分析,ELK能满足吗?

查看全文

大学公寓区开个小超市,需要注意什么?卖什么好?

1. 在某大学城某大学公寓区后门,公寓内有一万左右的学生。平时学生上课走正门,但是去大学城逛街、坐公交(主要通行工具)等,都走后门,经过超市。详情附图。2. 超市原来是个零食店,正在转让,面积很小20平米左右,年租金2.8W左右。3. 初步打算,以饮料、零食、烟酒等及其他需求大、消耗快的日用品为主,其他一些大超市有的电器、床上用品等卖的少的就不做了。

查看全文

接触哪些数据后让你感觉这个社会个人资料泄露太恐怖了?

最近工作中接触了大批量的用户资料,涉及住户名字、身份证号、手机号、子女配偶姓名、家庭住址(精确到房间号)等等!由于数据量比较凌乱,我自己整理了下,从中分析出了此人的消费层级、收入情况、简单社会地位等等信息!分析得到的结果太过令人惊恐,这个社会真是太恐怖了,大数据用好是好事,用不好。。。

查看全文

因某组数据存在缺失项,如何用其他几组数据来替代?

C1至C4是反映某现象的4个指标,每个指标有各自的权重,最终的指数C = Ci * 该指标权重。现在由于C2、C3指标在2013年、2014年数据缺失,因此在计算2013年、2014年的指数C时,准备将C2、C3的权重赋予C1、C4,以此得到妥协的、调整后的2013年、2014年的指数C。至少这样还能勉强得到指数C从2008年—2014年的变化情况。现在的问题是:如何用C1、C4的组合分别表示C2、C3,即如何构造两个回归函数?是回归函数么?。。。这块真的不是很懂,请大家帮忙一看~!函数一:C2 = f(C1,C4)函数二:C3 = f(C1,C4)具体数据和在Excel中绘制的散点图如下,准备用SPSS构造回归函数。P.S. C1 […]

查看全文

如何成为一个年薪50万+ 的数据分析师?

跳入了挖掘机这一大坑一段时间,本来是想往机器学习方向走的,但是我偏金融学的背景时候不被机器学习方向的岗位欢迎,所以往偏业务方向发展。感觉这一起薪还可以,但是看到身边做互联网和金融销售的同学发展的不错,月收入毕业几个月就到7000+的不少,所以想问问一个什么样的数据分析师能够达到50万年薪+

查看全文