Spark - 12Reads管理问答 - 第6页

帐户注册

用户名*

邮箱*

密码*

确认密码*

头像

浏览

验证码* 点击图片更换验证码

登录

找回密码

忘记密码了？输入你的注册邮箱，并点击重置，稍后，你将会收到一封密码重置邮件。

spark 运行pagerank 内存溢出？但是内存已经设置很大了？

她叫郭芙 2017-06-10 1570 次浏览

查看全文

如何评价spark的机器学习框架和 tensorflow的机器学习系统？

郭同jet 2017-06-04 1538 次浏览

Spark ML 和 Tensorflow / DMTK有什么区别和优劣？

查看全文

如何在 Spark 机器学习中应用 scikit

SlowMover 2017-06-04 1901 次浏览

最近在写spark下的机器学习程序，用RDD编程模型。spark自带的机器学习算法API局限太多。想请问各路大侠，能不能再spark的编程模型下引用scikit-learn？

查看全文

Spark目前的瓶颈在哪里，还有希望解决么？

顺顺 2017-06-01 959 次浏览

Spark当前很火哈，有木有行家来回答一下~~抛砖引玉，比如jvm方面的限制内存浪费任务调度方面拓展性等等。

查看全文

现在(2015年)Spark如日中天，和它功能类似的Hadoop系统还有必要深入研究吗？

Robot 2017-05-25 815 次浏览

查看全文

数据挖掘过程疑问？

dl liu 2017-05-17 1338 次浏览

数据挖掘没人带，自己琢磨现在有一个数据集和spark集群关于分词1、在单机分词，生成分词后的数据集，然后在spark上进行挖掘2、直接在spark集群进行分词，挖掘哪种方案合适？如果是1的话，单机执行效率会不会很慢如果是2的话，如何在分词时加载自定义词库，好多分词工具好像都不支持从hdfs中获取词典吧，那如何保证在集群中每个节点可以加载自定义词典，难道每个节点都要存放一份关于算法选择和验证如果数据量很大，跑一次要很久，那么如何选择合适的算法和验证1、使用spark集群抽样，使用部分数据来选择2、取一部分数据，使用scikit-learn来选择，验证完成后在使用spark集群哪种方案比较合适？

查看全文

为什么Spark的项目管理用的maven不是sbt？

wintfru 2017-04-22 1392 次浏览

查看全文

1 … 5 6