python和hadoop有什么联系? 举报 理由 举报 取消 我是做java的,我老板让我去学hadoop和python,这两种技术能在一起做项目么?hadoop是java开发的啊,按理来说java是无缝对接的,和python扯上什么关系? 2017年12月27日 4 条回复 1491 次浏览 Hadoop,Java,Python,数据
回复 ( 4 )
hadoop 是 java 开发的,但并不是说开发 hadoop 就一定要使用 java.
例如:Writing An Hadoop MapReduce Program In Python
我觉得他是让你学python,写爬虫,收集数据
之后再写hadoop的应用去分析你收集的数据
一个是编程语言,一个是大数据实现,这完全是两个不同领域的概念。我能想到的关系是这样的:如果Hadoop提供对Python的接口的话,就可以用Python调用Hadoop实现大数据的一些功能
虽然说Hadoop是java, Spark是scala,但是大数据领域用python的还是很多,一来有诸如numpy/scikit-learn/pandas甚至tensorflow这样的统计/ML framework,二来很多ETL的framework也是用Python写的比如luigi/airflow。