hadoop集群搭建

3 篇文章 0 订阅
订阅专栏

计划搭建一套自己的数据集群平台,顺便整理下hadoop的知识,做个总结,全当是笔记

一、hadoop简介

Hadoop是一个由Apache基金会所开发的分布式系统基础架构, 是存储系统计算框架的软件框架, 主要解决海量数据存储计算的问题,用于大数据技术中。

二、hadoop作用

1、海量数据存储

       由n台运行着DataNode的机器组成和1台运行NameNode进程一起构成。每个DataNode 管理一部分数据,然后NameNode负责管理整个HDFS 集群的信息(存储元数据)。

2、资源管理,调度和分配

  • YARN是一种新的 Hadoop 资源管理器,它是一个通用资源管理系统和调度平台,
  • 为上层应用提供统 一的资源管理和调度,极大提高了集群在利用率、资源统一管理和数据共享等方面益处。

三、hadoop结构

1、HDFS存储

  • HDFS是Hadoop核心项目的子项目,是 分布式计算中数据存储管理的基础,具有高容错性、可扩展性,适合大数据量处理和流式批处理,可运行于廉价的服务器上。
  • HDFS架构采用master/slave架构,一个HDFS集群是由一个Namenode和一定数目的Datanodes组成。

 hdfs结构图,查询多篇结构图,比较中意的一张,感谢 躁动的青年博主

NameNode:
一个中心服务器,是这个集群的管理者,负责管理HDFS的命名空间(NameSpace)、
配置副本策略和数据块(Block)映射信息,同时也会处理客户端读写请求。

DataNode:
执行NameNode下达命令,DataNode执行实际的操作。
集群中的DataNode负责管理所在节点上的存储,实际的数据块和执行数据块的读/写操作。

Client:

命令来管理及访问HDFS,与NameNode交互,获取文件的位置信息,
与DataNode交互,读取或者写入数据,将文件切分成一个一个的Block,然后进行存储。

Secondary NameNode:
并非NameNode的热备。当NameNode挂掉的时候,
它并不能马上替换NameNode并提供服务只是辅助NameNode,分担其工作量。
定期合并fsimage和fsedits,并推送给NameNode。在紧急情况下,可辅助恢复NameNode

*HDFS中的数据块Block是逻辑概念,默认块为64MB,block是HDFS分布式文件系统中的文件存储的逻辑单元

2、MapReduce计算

  • Hadoop MapReduce是google MapReduce 克隆版。
  • MapReduce是一种计算模型,用以进行大数据量的计算。
  • Map对数据集上的独立元素进行指定的操作,生成键-值对形式中间结果。
  • Reduce对中间结果中相同“键”的所有“值”进行规约,以得到最终结果。

MapReduce框架

由每个集群节点的一个单一主控JobTracker和一个从属TaskTracker构成。

主控JobTracker

负责资源管理,跟踪资源消耗/可用性,调度从属TaskTracker上的作业组件任务,监控这些任务,并重新运行失败任务。

从属TaskTracker

按照主控JobTracker的指示执行任务,并定期向主控JobTracker提供任务状态信息。

3、YARN管理

YARN 主要包含三大模块:

  • Resource Manager(RM):负责所有资源的监控、分配和管理
  • Node Manager(NM): 负责每一个节点的维护
  • Application Master(AM):负责每一个具体应用程序的调度和协调;

RM 拥有绝对的控制权和对资源的分配权。 AM 则会和 RM 协商资源,同时和 NM通信来执行和监控 task。

四、hadoop安装

tar.gz是已经编译好的了,解压改改配置文件就能用;而src.tar.gz是源码,要编译才能用

五、hadoop使用

六、hadoop生态

七、hadoop集群

八、hadoop优劣

九、hadoop前景

十、hadoop参考 

分布式文件系统HDFS架构解析_solihawk的博客

hadoop部分架构图_躁动的青年的博客-CSDN博客_hadoop架构图

Hadoop整体框架_爱吃串串的瘦子的博客

Hadoop是做什么的,hadoop集群搭建作用
大数据基础框架学习教程汇集
01-30 6029
目的 本文描述了如何安装、配置和管理有实际意义的Hadoop集群,其规模可从几个节点的小集群到几千个节点的超大集群。 如果你希望在单机上安装Hadoop玩玩,从这里能找到相关细节。 更多精彩内容 精彩内容点我学 先决条件 确保在你集群中的每个节点上都安装了所有必需软件。 获取Hadoop软件包。 安装 安装Hadoop集群通常要将安装软件解压到集群内的所有机器上。 通常...
1.Hadoop简介——为什么要使用Hadoop?什么是HadoopHadoop有什么作用?
m0_63953077的博客
03-02 1571
为什么要使用Hadoop?什么是HadoopHadoop有什么作用?
hadoop集群作用
qq_61604164的博客
08-29 559
Hadoop主要解决海量数据存储与计算的问题,是大数据技术中的基石。Hadoop以一种可靠、高效、可伸缩的方式进行数据处理。2、资源管理,调度和分配;
[Hadoop集群篇]Hadoop集群配置,入门搭建
最新发布
w3474271593的博客
06-12 1557
Hadoop集群架构主要包括HDFS(Hadoop Distributed File System)和YARN(Yet Another Resource Negotiator)两大组件。HDFS是Hadoop中的分布式文件系统,用于存储海量数据;YARN则负责资源管理,为Hadoop应用提供计算资源。
什么是Hadoop以及Hadoop集群
m0_67402970的博客
04-28 3115
一、简单理解 Hadoop是一个大象: 一个hadoop集群主要包含三个主要的模块:Mapreduce,hdfs,yarn。mapreduce是一个分离在合并的计算框架,注意他不是一个集群,而是一个编程框架。hdfs是一个分布式文件系统,是一个分布式集群,用于存放数据。yarn集群是负责集群任务调度和运算资源管理的分布式集群。 后面还会说到HBASE,这里先不提及。后面在来理解。 二、HDFS集群 比如一个很大的文件需要拆分成多个小的文件,然后每个小文件存放在不同的节点上,而这些小文件和大文件之间的映射
Hadoop架构中各个集群在开发中的作用
SunnyRivers
04-30 2728
学习大数据,如果只是零零散散地学习各个模块,就会深陷其中,很难深入了解hadoop架构中各个集群的作用。那么在实际开发中,究竟是怎样的一个流程呢?先看下面一张流程图:接下来就用一些大白话,来讲解每个模块的实际应用。大数据工程师应该从哪里收集用户的访问数据呢?一般可以从两个地方可以取,一个是客户端,一个是服务端。如果从服务器取数据,比如服务器每天在晚上8点到9点之间用户访问量非常多,而如果我们也从服...
hadoop集群搭建(超级详细)
10-11
在大数据领域,Hadoop是一个广泛使用的开源框架,用于存储和处理海量数据。本文将详细讲解如何搭建一个...这个超详细的教程覆盖了从零开始到集群搭建完成的全过程,按照步骤执行,可以轻松掌握Hadoop集群搭建技术。
hadoop集群搭建文档资料
11-15
以上内容是Hadoop集群搭建的基础步骤和关键知识点,具体的实施过程中可能需要根据实际环境进行调整。提供的文档资料应详细记录了每一步的操作,帮助读者理解和实践Hadoop集群的搭建。通过这份文档,你可以学习到...
hadoop集群搭建教程
03-07
在虚拟机上面搭建hdfs 集群亲测可用 记得 修改ip地址就行
Hadoop集群搭建详细简明教程
05-16
本教程“Hadoop集群搭建详细简明教程”将带你逐步走进Hadoop的世界,了解并掌握如何构建一个高效稳定的Hadoop集群。 Hadoop是由Apache基金会开发的一个开源项目,其核心包括两个主要组件:Hadoop Distributed File ...
hadoop集群搭建步骤
01-10
该文档提供了linux环境中搭建hadoop集群(大数据)的步骤,个人认为比较详细,供大家学习
Hadoop集群搭建超详细步骤及注意点
01-10
Hadoop集群搭建的详细步骤,涉及Linux:Centos6.5基础环境配置,Hadoop集群离线部署方式。
基于centos的大数据hadoop集群搭建说明文档
10-30
【标题】:基于CentOS的大数据Hadoop集群搭建详解 【描述】:本教程专为初学者设计,详细阐述了如何手动搭建Hadoop集群,步骤详尽,易于理解。 【标签】:Hadoop集群搭建 【正文】: Hadoop是一个开源的分布式...
Hadoop集群搭建
07-22
Hadoop集群搭建详细的描述了hadoop集群的搭建过程,值得大家去学习。
3.基于hadoop集群搭建hbase
06-17
基于haodoop 集群搭建hbase集群。(2台机器的情况。)
Hadoop-集群搭建
weixin_52972575的博客
07-19 910
Hadoop集群搭建
Hadoop分布式集群的搭建
theVicTory的博客
04-18 3038
大数据相关概念,Hadoop3搭建分布式集群。
Hadoop介绍及群集搭建
小叮当的博客
07-20 1019
Hadoop介绍及安装部署

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
写文章

热门文章

  • Pandas中 DataFrame中添加一行/一列 56446
  • Pandas行数和列数获取 24951
  • 内网和外网的区别是什么? 21731
  • docker 配置环境变量 21388
  • cron表达式详解 18559

分类专栏

  • 量化交易 16篇
  • 机器学习 7篇
  • 数据结构 4篇
  • 算法 6篇
  • Anaconda 3篇
  • 大数据 3篇
  • 数据处理 18篇
  • pandas系列 24篇
  • numpy系列 3篇
  • matplotlib系列 3篇
  • 数据库 9篇
  • mysql 20篇
  • mongo 3篇
  • es 4篇
  • neo4j 1篇
  • bcolz 1篇
  • redis 3篇
  • 运维环境 11篇
  • linux环境 8篇
  • docker 14篇
  • wsgi协议 3篇
  • git 4篇
  • 网络 7篇
  • python 80篇
  • spider 4篇
  • flask 3篇
  • django 19篇
  • go 7篇
  • beego
  • go基础 3篇
  • C 12篇
  • 消息队列 9篇
  • 后端 2篇
  • 前端 14篇
  • 随笔 3篇
  • 笔记 21篇

最新评论

  • Kibana详细入门教程

    Lollipop ²⁰¹⁹: 写点啥 dp

  • Matplotlib图形绘制

    RebelYoung: 请问,如何去掉边框的同时将数学意义上的y=0这条x轴显示且加刻度?

  • pip与apt-get的区别

    a_789_: udo ubuntu-drivers install No drivers found for installation.

  • pip与apt-get的区别

    a_789_: Usage: ubuntu-drivers [OPTIONS] COMMAND [ARGS]... Try "ubuntu-drivers -h" for help. Error: No such command "autionstall".

  • pip与apt-get的区别

    a_789_: $ lspci | grep -i nvidia 0001:00:00.0 PCI bridge: NVIDIA Corporation Device 229e (rev a1)

最新文章

  • Numpy 如何让 argsort 两个相等的值排序
  • Python导出mysql 表ORM模型
  • DataFrame转换为字典
2024年2篇
2023年11篇
2022年129篇
2021年53篇
2020年16篇
2019年39篇
2018年22篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

**星光*

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或 充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

PHP网站源码布吉企业网站改版坂田网站推广龙岗网站设计民治网站搭建坑梓百度网站优化布吉网站搜索优化塘坑网站优化按天收费坪山网站推广工具福田网站优化按天扣费永湖关键词按天收费福永网站搭建双龙网络广告推广深圳百姓网标王推广民治网站制作丹竹头网站推广深圳网站开发南山高端网站设计荷坳百度竞价石岩网站搜索优化南联seo网站推广石岩网站开发松岗网站优化排名大运网络推广沙井模板推广同乐推广网站双龙seo排名大鹏网站优化推广爱联网站优化排名西乡标王罗湖网站设计模板歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

PHP网站源码 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化