SpoutConfig(BrokerHosts hosts, String topic, String zkRoot, String id) 参数id指的是啥意思
查看全文关于storm的topology启动时间过长(端口占用)如何解决?
storm版本是0.9.4 ,当storm集群上任务比较多的时候,启动一个topology,要过5-10分钟或者更久才能启动起来。worker log报错如下: 2016-03-21T09:58:31.217+0800 b.s.m.n.Client [ERROR] connection attempt 4 to Netty-Client-sslave6 failed: java.lang.RuntimeException: Returned channel was actually not established
查看全文怎么实现spark中不同的分组对应不同处理函数?
现在在处理机器监控的数据,包括内存、网络、CPU等数据,是一个实时流数据,使用spark streaming作为处理平台。在实际的使用中,需要根据监控的内容分组做时间序列,然后根据不同的监控内容需要使用不同的分析函数,这时就出现了一个问题,处理内存、网络和CPU的判断标准完全不一样,请问应该如何解决?
查看全文如何看待Google向Apache基金会提交的Beam(Dataflow)提案?
https://wiki.apache.org/incubator/BeamProposal你如何看待此提议,该项目前景如何?
查看全文未来想成为一名大数据架构师,可是不知如何在hadoop spark Storm中纠结?
因为本人刚刚大学,而且是在自学大数据,就业方面也是在几年后,可是初学总是不知道如何学习,很多人说学习hadoop还有的说spark都学什么的,我也不太能理解大数据架构这个概念,因为还年轻希望能接触有挑战性的技术。
查看全文怎么样用storm中写一个RollingTopWords的例子,有人写过吗?
大家有关于滑动窗口(最好是storm实现)的应用的视频资料或程序吗?本人刚开始接触,非常想学
查看全文哪里有流处理系统的数据?
最近正在学习Strom和Spark Streaming,不知道哪里能提供有效的测试数据呢?就像图计算有wikipedia和dblp,流数据有哪些呢?
查看全文