怎样系统学习hadoop等大数据行业知识( 二 )



■网友的回复
http://hadoop.aura.cn
■网友的回复
hadoop是云技术的一种实现,有很多模块组成。建议你系统性的看一下Map-Reduce原理 Hive Hbase HDFS文件系统。可以参考炼数成金的网站列表介绍
■网友的回复
Hadoop等这些是一个生态中的技术框架,技术是用来解决问题的,所以开始学习一个技术框架时,需要明确:
1.为什么会出现,演变过程是什么?
2.解决了什么问题,使用场景是什么?
3.该技术框架的使用人员是什么?
4.该框架处于数据处理流程中的哪个环节,该环节还有没有类似的框架?

搞清楚上面几个问题之后,再寻找大数据行业的技术体系框架,选择切入点着手学习。

■网友的回复
建议从实践开始,比如处理word count类似的程序,然后渐渐入门。
可以先写一些hadoop的java程序,用intellij的软件,是可以做到本地跑hadoop程序的(只有一台机器就是了)
然后逐行debug看内部的原理。
【怎样系统学习hadoop等大数据行业知识】 如果以上过程太过晦涩,也可以读一下hadoop的书,比如hadoop definite guide,了解一下基本原理再下手

■网友的回复
求问,到底是要走例如Python、R还是Hadoop方向的路线,这个有什么参考标准的吗?