Hadoop的联邦怎么创建-成都创新互联网站建设

关于创新互联

多方位宣传企业产品与服务 突出企业形象

公司简介 公司的服务 荣誉资质 新闻动态 联系我们

Hadoop的联邦怎么创建

这篇文章主要介绍“Hadoop的联邦怎么创建”,在日常操作中,相信很多人在Hadoop的联邦怎么创建问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Hadoop的联邦怎么创建”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

公司主营业务:网站设计、成都做网站、移动网站开发等业务。帮助企业客户真正实现互联网宣传,提高企业的竞争能力。创新互联是一支青春激扬、勤奋敬业、活力青春激扬、勤奋敬业、活力澎湃、和谐高效的团队。公司秉承以“开放、自由、严谨、自律”为核心的企业文化,感谢他们对我们的高要求,感谢他们从不同领域给我们带来的挑战,让我们激情的团队有机会用头脑与智慧不断的给客户带来惊喜。创新互联推出都匀免费做网站回馈大家。

一、为什么会出现联邦?

Hadoop 的 NN 所使用的资源受所在服务的物理限制,不能满足实际生产需求。

二、联邦的实现

采用多台 NN 组成联邦。NN 是独立的,NN 之间不需要相互调用。NN 是联合的,同属于一个联邦,所管理的 DN 作为 block 的公共存储。block pool 的概念,每一个 namespace 都有一个 pool,datanodes 会存储集群中所有的 pool,block pool 之间的管理是独立的,一个 namespace 生成一个 blockid 时不需要跟其它 namespace 协调,一个 namenode 的失败也不会影响到 datanode对其它 namenodes 的服务。一个 namespace 和它的 block pool 作为一个管理单元,删除后,对应于datanodes 中的 pool 也会被删除。集群升级时,这个管理单元也独立升级。这里引入 clusterID 来标示集群所有节点。当一个 namenode format 之后,这个 id 生成,集群中其它 namenode 的 format 也用这个 id。

三、主要优点:

命名空间可伸缩性——联合添加命名空间水平扩展。DN 也随着 NN 的加入而得到拓展。

性能——文件系统吞吐量不是受单个Namenode 限制。添加更多的Namenode集群扩展文件系统读/写吞吐量。

隔离——隔离不同类型的程序,一定程度上控制资源的分配

四、配置:

联邦的配置是向后兼容的,允许在不改变任何配置的情况下让当前运行的单节点环境转换成联邦环境。新的配置方案确保了在集群环境中的所有节点的配置文件都是相同的。这里引入了 NameServiceID 概念,作为 namenodes 们的后缀。第一步:配置属性 dfs.nameservices,用于 datanodes 们识别 namenodes。第二步:为每个 namenode 加入这个后缀。

五、操作:

# 创建联邦,不指定 ID 会自动生成

$HADOOP_HOME/bin/hdfs namenode -format [-clusterId ]

# 升级 Hadoop 为集群

$HADOOP_HOME/bin/hdfs start namenode --config $HADOOP_CONF_DIR

-upgrade -clusterId

# 扩展已有联邦

$HADOOP_HOME/bin/hdfs dfsadmin -refreshNamenodes

# 退出联邦

$HADOOP_HOME/sbin/distribute-exclude.sh

$HADOOP_HOME/sbin/refresh-namenodes.sh

什么是 CDH 下载地址 : http://archive.cloudera.com/cdh6/cdh/5/ CDH (Cloudera's Distribution, including Apache Hadoop),是 Hadoop众多分支中的一种,由 Cloudera 维护,基于稳定版本的 Apache Hadoop 构建,并集成了很多补丁, 可直接用于生产环境。

CDH 的优点: 版本划分清晰

版本更新速度快

支持 Kerberos 安全认证文档清晰

支持多种安装方式(Cloudera Manager、YUM、RPM、Tarball) 什么是 CM Cloudera Manager? 是为了便于在集群中进行 Hadoop

等大数据处理相关的服务安装和监控管理的组件,对集群中主机、Hadoop、Hive、Spark 等服务的安装配置管理做了极大简化。
Cloudera Manager 有四大功能:

(1)管理:对集群进行管理,如添加、删除节点等操作。

(2)监控:监控集群的健康情况,对设置的各种指标和系统运行情况进行全面监控。

(3)诊断:对集群出现的问题进行诊断,对出现的问题给出建议解决方案。

(4)集成:对 hadoop 的多组件进行整合。

到此,关于“Hadoop的联邦怎么创建”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注创新互联网站,小编会继续努力为大家带来更多实用的文章!


网页题目:Hadoop的联邦怎么创建
本文路径:http://kswsj.cn/article/iiches.html

其他资讯