推荐Java工程师必看,12个Hadoop领域的上手项目

?对代码、编程感兴趣的可以关注「老K玩代码」公众号和我交流! 分享代码、经验、项目和资讯
Hadoop是一个由Apache基金会所开发的分布式系统基础架构 。 用户可以在不了解分布式底层细节的情况下 , 开发分布式程序 。 充分利用集群的威力进行高速运算和存储 。
国内对Hadoop工程师的需求是相当多 , 很多小伙伴也立志成为hadoop工程师 。这里 , 老K为这些小伙伴准备了一些Hadoop的练习项目 , 快一起看看吧 。
推荐Java工程师必看,12个Hadoop领域的上手项目文章插图
1. Hadoop 分析武侠小说词频地址: http s:// www.shiyanlou.com/courses/40
学习人数: 2.1k
关注人数: 302
本课程是 Hadoop 的一个非常基础的应用项目 , 利用实验楼提供的 Hadoop 环境 , 对一本武侠小说的文集进行简单的 WordCount 词频统计 , 从而得到该书中出现频次最高的人名 。 需要一定的 Hadoop 和 MapReduce 基础 。 本课程难度为简单 , 属于入门级别课程 , 适合对 Hadoop 刚刚入门的用户 , 甚至没有接触过 Hadoop 的用户也可以按照步骤一步步做出来 。
推荐Java工程师必看,12个Hadoop领域的上手项目文章插图
2. HBase 基础入门地址: http s:// www.shiyanlou.com/courses/37
学习人数: 5.1k
关注人数: 529
HBase 是一个开源的非关系型分布式数据库 , 是 Hadoop 项目的一部分 , 运行于 HDFS 文件系统之上 , 为 Hadoop 提供类似于 BigTable 规模的服务 。
推荐Java工程师必看,12个Hadoop领域的上手项目文章插图
3. 大数据基础入门地址: http s:// www.shiyanlou.com/courses/2324
学习人数: 162
关注人数: 5
课程涵盖了大数据领域常见的组件 , 如 Hadoop、Mapreduce、HBase、Mahout、Pig、Hive、Sqoop 等 。 我们将从理论出发 , 搭建环境并学习相应实践案例 。
推荐Java工程师必看,12个Hadoop领域的上手项目文章插图
4. 《Hadoop权威指南》配套实验地址: http s:// www.shiyanlou.com/courses/222
学习人数: 1.6k
关注人数: 285
本书通过丰富的案例学习来解释Hadoop的幕后机理 , 阐述了Hadoop如何解决现实生活中的具体问题 。 本课程内容为清华大学出版社授权发布的前三章 。 如学习整本书 , 需购买书籍 。
推荐Java工程师必看,12个Hadoop领域的上手项目文章插图
5. Python mrjob 操作 Hadoop地址: http s:// www.shiyanlou.com/courses/1167
学习人数: 1.2k
关注人数: 62
Python是做数据分析最好的语言 。 大数据当然也离不开Hadoop , Hadoop由JAVA写成 , 但Python也可以很好地操控它 。 本课程介绍了Python中MRjob模块 , 通过该模块 , 可以让开发者非常简单的通过Python来使用Hadoop进行数据分析 。
推荐Java工程师必看,12个Hadoop领域的上手项目文章插图
6. Hadoop Flume 收集数据实战地址: http s:// www.shiyanlou.com/courses/801
学习人数: 2.3k
关注人数: 126
Flume 可以从多个数据源获取数据 , 把这些数据传给远程主机(可能是一对多或流水线模型
中的多个目标) , 再把它们传给多个目的端 。 尽管 Flume 提供了开发自定义数据源和数据目的端的编程 API , 但它原本就支持许多常见的场景 。 本课程源自图灵教育的《Hadoop基础教程》第10章 , 感谢图灵教育授权实验楼发布 。
推荐Java工程师必看,12个Hadoop领域的上手项目文章插图