www.fltk.net > 学习hADoop,spArk需要学习spring等吗

学习hADoop,spArk需要学习spring等吗

不需要,你学习使用Git的时候也没让你会用SVN,甚至学习的比有SVN基础的更快!

不一定,如果你不用Hadoop的HDFS和YARN,完全可以在学习Spark的时候从本地载入数据,部署用standlone模式。Spark替代的是Hadoop中的MapReduce编程范式,不包括存储和资源管理模块。 Spark的算子很多,写程序来看比Hadoop MapReduce要灵活很多,...

当然,起码hadoop框架内的mapreduce(分布式计算模块)和HDFS(分布式文件存储系统)你要学习,MR能够帮助你深入理解分布式的计算思维,HDFS则是大数据领域内最为常用,最为常见的文件存储系统,Spark也同样要依托于HDFS进行很多的计算,另外还...

不一定,如果你不用Hadoop的HDFS和YARN,完全可以在学习Spark的时候从本地载入数据,部署用standlone模式。 Spark替代的是Hadoop中的MapReduce编程范式,不包括存储和资源管理模块。

hdfs一定要, 然后mapreduce的思想, 主要是学习分布式的思想。

理论上来讲,学习spark和storm是不需要学习hadoop的。spark和storm都是独立的开源项目,在完整性上是self-constrained的,完全可以独立学习。从循序渐进的角度,还是可以了解一下hadoop的,以spark为例,理解了hadoop的mapreduce,知道它的缺陷...

如果只是应用Hadoop/Spark进行数据分析,那么JavaSE只需要基本了解就行了,重点在于深入理解Hadoop/Spark各自的计算模型和实现原理,以及常见的数据分析方法和分布式算法。实际的分析工作,甚至可以不使用java,使用各自的streaming接口用任意语...

一般都是要学的,像spark其实它只是替代了hadoop生态系统中的mapreduce功能,hadoop的其他的部分,spark都没有替代,所以要学hadoop;而storm是实时计算框架,比如说业务需要记录用户的足迹等信息,你肯定得需要一个存储的方式吧,最有可能的就...

Storm是一个开源的分布式实时计算系统,它可以简单、可靠地处理大量的数据流。Storm有很多应用场景,如实时分析、在线机器学习、持续计算、分布式RPC、ETL,等等。 Storm支持水平扩展,具有高容错性,保证每个消息都会得到处理,而且处理速度很...

不需要,Hadoop有hdfs,mapreduce,yarn三部分,spark相当于mapreduce是分布式计算框架,mapreduce需要自己编写map和reduce很麻烦,所以有了spark,不用自己编写。

网站地图

All rights reserved Powered by www.fltk.net

copyright ©right 2010-2021。
www.fltk.net内容来自网络,如有侵犯请联系客服。zhit325@qq.com