当前位置:首页 > > 充电吧
[导读]hadoop-2.7.2集群的搭建过程 安装环境: 3节点集群,1个Master,2个Slave。 3个节点的局域网ip分别是10.30.30.128、10.30.30.129、10.30.30.1

hadoop-2.7.2集群的搭建过程

安装环境:

3节点集群,1个Master,2个Slave。

3个节点的局域网ip分别是10.30.30.128、10.30.30.129、10.30.30.130。

 

0. 准备工作:

在Master节点上安装好hadoop-2.7.2伪分布模式。

接下来主要对Slave节点进行安装配置。

 

1. Slave节点基本环境的安装和配置

首先需要在Slave节点上进行一些基本环境的安装和配置,步骤均与伪分布模式相同。

1)  创建hadoop用户

2)  安装ssh

3)  安装Java环境

 

2. 配置网络连接

将主节点的hostname改为Master,两个从节点分别改为Slave1和Slave2。

sudo nano /etc/hostname

将所有节点的hosts文件都改为如下内容:

127.0.0.1 localhost

10.30.30.128 Master

10.30.30.129 Slave1

10.30.30.130 Slave2

 

3. 配置节点间ssh无密码登录

删除Slave节点.ssh目录中的所有文件(若存在文件):

rm ~/.ssh/*

进入Master节点的~/.ssh文件夹,将id_rsa 和id_rsa.pub两个文件复制到Slave节点对应的目录下:

scp ~/.ssh/id* hadoop@Slave1:/home/hadoop/.ssh/

然后在Slave节点上执行命令:

cat ./id_rsa.pub >> ./authorized_keys

将公钥加入授权,即可实现节点间无密码登录。

 

4. Slave节点hadoop的安装

    将Master节点中hadoop的安装目录打包,发送给各Slave节点,注意必须先打包再发送,否则该目录下的link文件将失效。

cd /usr/lib

sudo tar –cvf hadoop.tar hadoop/

scp hadoop.tar hadoop@Slave1:/home/hadoop/

登录Slave节点,将文件解压到对应的路径:

sudo tar xvf hadoop.tar /usr/local

设置文件夹权限:

sudo chown -R hadoop:hadoop /usr/local/hadoop

在Slave节点中配置hadoop环境变量,请参照Master节点。

 

5. 修改配置文件

一共需要修改5个配置文件,分别是hadoop/etc/hadoop目录下的core-site.xml, hdfs-site.xml, mapred-site.xml, yarn-site.xml和slaves文件,注意,所有节点均需修改。


core-site.xml:


  
    hadoop.tmp.dir
    file:/usr/local/hadoop/tmp
    Abasefor other temporary directories.
  
  
    fs.defaultFS
    hdfs://Master:9000
  


hdfs-site.xml:


  
    dfs.replication
    1
  
  
    dfs.namenode.name.dir
    file:/tmp/hadoop/dfs/name
  
  
    dfs.datanode.data.dir
    file:/tmp/hadoop/dfs/data
  
  
    dfs.namenode.secondary.http-address
    Master:50090
  


mapred-site.xml:


  
    mapreduce.framework.name
    yarn
  
  
    mapreduce.jobhistory.address
    Master:10020
  
  
    mapreduce.jobhistory.webapp.address
    Master:19888
  

yarn-site.xml:


  
    yarn.nodemanager.aux-services
    mapreduce_shuffle
  
  
    yarn.resourcemanager.hostname
  cit128
  


slaves:

Slave1
Slave2

 

6. 启动Hadoop集群

登录Master节点,启动hadoop守护进程和yarn进程:

start-dfs.sh

start-yarn.sh

或者使用start-all.sh命令代替二者也行。

启动历史服务进程:

mr-jobhistory-daemon.sh start historyserver

启动后,Master节点上运行的进程有:

NameNode

SecondaryNameNode

JobHistoryServer

ResourceManager

Slave节点上运行的进程有:

DataNode

NodeManager

 

7. 运行hadoop分布式实例

创建用户目录:

hdfs dfs -mkdir -p /user/hadoop

创建输入目录和输入文件:

hdfs dfs -mkdir input

hdfs dfs -put /usr/local/hadoop/etc/hadoop/*.xml input

运行mapreduce作业:

hadoop jar /usr/local/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar wordcount input output

等待mapreduce作业运行结束,查看运行结果:

hdfs dfs -cat output/*

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: 驱动电源

在工业自动化蓬勃发展的当下,工业电机作为核心动力设备,其驱动电源的性能直接关系到整个系统的稳定性和可靠性。其中,反电动势抑制与过流保护是驱动电源设计中至关重要的两个环节,集成化方案的设计成为提升电机驱动性能的关键。

关键字: 工业电机 驱动电源

LED 驱动电源作为 LED 照明系统的 “心脏”,其稳定性直接决定了整个照明设备的使用寿命。然而,在实际应用中,LED 驱动电源易损坏的问题却十分常见,不仅增加了维护成本,还影响了用户体验。要解决这一问题,需从设计、生...

关键字: 驱动电源 照明系统 散热

根据LED驱动电源的公式,电感内电流波动大小和电感值成反比,输出纹波和输出电容值成反比。所以加大电感值和输出电容值可以减小纹波。

关键字: LED 设计 驱动电源

电动汽车(EV)作为新能源汽车的重要代表,正逐渐成为全球汽车产业的重要发展方向。电动汽车的核心技术之一是电机驱动控制系统,而绝缘栅双极型晶体管(IGBT)作为电机驱动系统中的关键元件,其性能直接影响到电动汽车的动力性能和...

关键字: 电动汽车 新能源 驱动电源

在现代城市建设中,街道及停车场照明作为基础设施的重要组成部分,其质量和效率直接关系到城市的公共安全、居民生活质量和能源利用效率。随着科技的进步,高亮度白光发光二极管(LED)因其独特的优势逐渐取代传统光源,成为大功率区域...

关键字: 发光二极管 驱动电源 LED

LED通用照明设计工程师会遇到许多挑战,如功率密度、功率因数校正(PFC)、空间受限和可靠性等。

关键字: LED 驱动电源 功率因数校正

在LED照明技术日益普及的今天,LED驱动电源的电磁干扰(EMI)问题成为了一个不可忽视的挑战。电磁干扰不仅会影响LED灯具的正常工作,还可能对周围电子设备造成不利影响,甚至引发系统故障。因此,采取有效的硬件措施来解决L...

关键字: LED照明技术 电磁干扰 驱动电源

开关电源具有效率高的特性,而且开关电源的变压器体积比串联稳压型电源的要小得多,电源电路比较整洁,整机重量也有所下降,所以,现在的LED驱动电源

关键字: LED 驱动电源 开关电源

LED驱动电源是把电源供应转换为特定的电压电流以驱动LED发光的电压转换器,通常情况下:LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: LED 隧道灯 驱动电源
关闭