Apache Hadoop的重要组成
作者:chain_xx_wdm
来源:
Hadoop = HDFS(分布式文件系统) + MapReduce(分布式计算框架) + Yarn(资源协调框架) + Common模块
HDFSHadoop Distribute File System 一个高可靠, 高吞量的分布式文件系统
"分而治之"
文章插图
- NameNode (nn): 存储文件的 元数据 . 比如文件名, 文件目录结构, 文件属性(生成时间, 副本数, 文件权限), 以及每个文件的块列表和块所在的DataNode等
- SecondaryNameNode (2nn): 辅助NameNode更好地工作, 用来 监控HDFS状态 的辅助后台程序, 每隔一段时间 获取HDFS元数据快照
- DataNode (dn): 在本地文件系统 存储 文件块数据, 以及块数据的 校验
Map阶段就是 分 的阶段, 并行处理输入数据
Reduce阶段就是 合 的阶段, 对Map阶段结果进行汇总
文章插图
Yarn
作业调度与集群资源管理的框架
文章插图
- ResourceManager (rm): 处理客户端请求 , 启动/监控ApplicationMaster , 监控NodeManager , 资源分配与调度
- NodeManager (nm): 单个节点 上的资源管理, 处理来自ResourceManager的命令, 处理来自ApplicationMaster的命令
- ApplicationMaster (am): 数据切分 , 为应用程序 申请资源并分配 给内部任务, 任务监控 与 容错
- Container : 对任务运行环境的抽象, 封装了CPU, 内存等多维资源以及环境变量, 启动命令等 任务运行相关的信息
文章插图
作者:chain_xx_wdm
【Apache Hadoop的重要组成】来源:
- 智能手机市场|华为再拿第一!27%的份额领跑全行业,苹果8%排在第四名!
- 会员|美容院使用会员管理软件给顾客更好的消费体验!
- 行业|现在行业内客服托管费用是怎么算的
- 人民币|天猫国际新增“服务大类”,知舟集团提醒入驻这些类目的要注意
- 国外|坐拥77件专利,打破国外的垄断,造出中国最先进的家电芯片
- 技术|做“视频”绿厂是专业的,这项技术获人民日报评论点赞
- 面临|“熟悉的陌生人”不该被边缘化
- 中国|浅谈5G移动通信技术的前世和今生
- 页面|如何简单、快速制作流程图?上班族的画图技巧get
- 桌面|日常使用的软件及网站分享 篇一:几个动态壁纸软件和静态壁纸网站:助你美化你的桌面