hadoop 分布式环境搭建处理-天翼云

hadoop 分布式环境搭建处理

2024-09-25 10:15:32 阅读次数：89

一: 环境配置

1.1系统软件要求：

  系统：CentOS 6.4 X64
  软件：Hadoop-2.5.2.tar.gz 
      native-2.5.2.tar.gz
      jdk-7u67-linux-x64.tar.gz

将所有软件安装上传到/home/hadoop/yangyang/ 下面

主机名配置：

192.168.3.1  
192.168.3.2  
192.168.3.3

角色分配处理

二：系统环境的初始化

2.1 三台虚拟机配置NTP 时间同步处理

  以  配置 作为NTP SERVER，  NTP 配置：
去网上同步时间

hadoop 分布式环境搭建处理 #加入开机自启动

 #echo “ntpdate –u 202.112.10.36 ” >> /etc/rc.d/rc.local
 #vim /etc/ntp.conf

hadoop 分布式环境搭建处理

 #取消下面两行的#

hadoop 分布式环境搭建处理

 #vim /etc/sysconfig/ntpd
 增加：

hadoop 分布式环境搭建处理

 #service ntpd restart
 #chkconfig ntpd on

hadoop 分布式环境搭建处理

与 配置计划任务处理将从 同步时间
crontab –e

*/10 * * * * /usr/sbin/ntpdate

hadoop 分布式环境搭建处理

2.2 三台虚拟机配置jdk环境

 安装jdk 
 tar -zxvf jdk-7u67-linux-x64.tar.gz
 mv jdk-7u67-linux-x64 jdk
 环境变量配置
 #vim .bash_profile
 到最后加上：
export JAVA_HOME=/home/hadoop/yangyang/jdk
export CLASSPATH=.:$JAVA_HOME/jre/lib:$JAVA_HOME/lib:$JAVA_HOME/lib/tools.jar
export HADOOP_HOME=/home/hadoop/yangyang/hadoop
PATH=$PATH:$HOME/bin:$JAVA_HOME/bin:/bin

等所有软件安装部署完毕在进行
source .bash_profile
 java –version

hadoop 分布式环境搭建处理

2.3：SSH 免密钥登陆：

 ssh-keygen-------一种按回车键即可生成。(三台服务器一样)

 slave1和slave2的配置

 cd .ssh

  scp id_rsa.pub hadoop

  scp id_rsa.pub hadoop

 maste的配置

 cat id_rsa.pub >> authorized_keys

 cat slave1.pub >> authorized_keys

 cat slave2.pub >> authorized_keys

 chmod  600  authorized_keys

 scp authorized_keys hadoop@:/home/hadoop/.ssh/

 scp authorized_keys hadoop:/home/hadoop/.ssh/

测试： hadoop 分布式环境搭建处理

三：安装hadoop与配置处理

3.1 安装hadoop 与配置文件处理

 tar -zxvf hadoop-2.5.2.tar.gz
 mv hadoop-2.5.2 hadoop
 cd /home/hadoop/yangyang/hadoop/etc/hadoop

3.2更换native 文件
rm  -rf  lib/native/*
tar –zxvf hadoop-native-2.5.2.tar.gz –C hadoop/lib/native
cd hadoop/lib/native/

hadoop 分布式环境搭建处理编辑core-site.xml 文件：

<configuration>
<property>
        <name>fs.defaultFS</name>
        <value>hdfs://:8020</value>
    </property>
   
       <name>hadoop.tmp.dir</name>
       <value>/home/hadoop/yangyang/hadoop/data</value>
       <description>hadoop_temp</description>
   </property>
</configuration>

编辑hdfs-site.xml 文件：

 <configuration>  
<property>
        <name>dfs.replication</name>
        <value>3</value>
    </property>
<property>
<name>dfs.namenode.http-address</name>
<value>:50070</value>
</property>
<property>
<name>dfs.namenode.secondary.http-address</name>
<value>:50090</value>
</property>
 </configuration>

编辑mapred-site.xml

<configuration>
  <property>
        <name></name>
        <value>yarn</value>
    </property>
<property>
<name>mapreduce.jobhistory.address</name>
<value>:10020</value>
</property>
    <property>
        <name>mapreduce.jobhistory.webapp.address</name>
        <value>:19888</value>
</property>
</configuration>

编辑yarn-site.xml

 <configuration>
<property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value></value>
    </property>
    <property>
        <name>yarn.log-aggregation-enable</name>
        <value>true</value>
    </property>
<property>
        <name>yarn.log-aggregation.retain-seconds</name>
        <value>604800</value>
    </property>
</configuration>

编辑hadoop-env.sh 文件：

export JAVA_HOME=/home/hadoop/yangyang/jdk
export HADOOP_PID_DIR=/home/hadoop/yangyang/hadoop/data/tmp
export HADOOP_SECURE_DN_PID_DIR=/home/hadoop/yangyang/hadoop/data/tmp

编辑mapred-env.sh 文件：

export JAVA_HOME=/home/hadoop/yangyang/jdk
export HADOOP_MAPRED_PID_DIR=/home/hadoop/yangyang/hadoop/data/tmp

编辑yarn-env.sh 文件： vim yarn-env.sh

export JAVA_HOME=/home/hadoop/yangyang/jdk

编辑slaves 文件 vim slaves

3.3 同步到所有节点slave1和slave2

cd /home/hadoop/yangyang/
tar –zcvf hadoop.tar.gz hadoop
scp hadoop.tar.gz hadoop@192.168.3.2:/home/hadoop/yangyang/
scp hadoop.tar.gz hadoop@192.168.3.3:/home/hadoop/yangyang/

3.4 格式化文件系统HDFS

 主机上执行：
cd hadoop/bin/
./hdfs namenode –format
3.5 启动hdfs 
 主机上执行：
cd hadoop/sbin/
./start-dfs.sh

hadoop 分布式环境搭建处理 3.6启动start-yarn.sh


cd hadoop/sbin/
./start-yarn.sh

hadoop 分布式环境搭建处理

3.7 启动日志功能：

  
   cd hadoop/sbin/
  ./mr-jobhistory-daemon.sh start historyserver

hadoop 分布式环境搭建处理

3.8 参照分配表处理

hadoop 分布式环境搭建处理

主机：

hadoop 分布式环境搭建处理

主机：

hadoop 分布式环境搭建处理

主机

hadoop 分布式环境搭建处理

###四：环境测试上面的HDFS

hadoop 分布式环境搭建处理

上的yarn

hadoop 分布式环境搭建处理

上面的jobhistory

hadoop 分布式环境搭建处理

hadoop 环境的测试与检查：创建，上传，运行wordcount 检测

hadoop 分布式环境搭建处理

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

hadoop 分布式环境搭建处理

hadoop 分布式环境搭建处理

一: 环境配置

二：系统环境的初始化

三：安装hadoop与配置处理

相关文章

启动hadoop集群时报错ERROR: Attempting to operate on hdfs namenode as root

【配置/认证】Authentication for Hadoop（3.3.1） HTTP web-consoles : Hadoop的simple认证 不是银弹

【基础-配置文件】：hadoop配置文件作用概述ing

通过sqoop将mysql数据导入到hive中进行计算示例

大数据ClickHouse进阶（十三）：ClickHouse的GROUP BY 子句

HDFS常用命令整理

flinkcdc+hudi0.10+hive(自动同步分区+压缩)

yarn安装MapReduce框架JAR上传的时候报错处理

sqoop 的安装与常用抽数操作

java api访问hive操作示例

作者介绍

最新文章

通过sqoop将mysql数据导入到hive中进行计算示例

hadoop伪分布式搭建

hive 安装配置部署与测试

Hive部署及常用命令

hive中如何计算字符串中表达式

Hadoop（4）-Python借助pyhdfs对Hadoop的HDFS分布式文件系统的全部操作详细实例演示

热门文章

Spark安装部署：Standalone模式

hadoop3.3.1 版本安装部署及常见问题

hive中如何计算字符串中表达式

NiFi FileFlow示例和NIFI模板示例

Hadoop（4）-Python借助pyhdfs对Hadoop的HDFS分布式文件系统的全部操作详细实例演示

hive 安装配置部署与测试

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

Hive部署及常用命令

hive中如何计算字符串中表达式

hive 安装配置部署与测试

Hadoop（4）-Python借助pyhdfs对Hadoop的HDFS分布式文件系统的全部操作详细实例演示

hadoop3.3.1 版本安装部署及常见问题

NiFi FileFlow示例和NIFI模板示例

【配置/认证】Authentication for Hadoop（3.3.1） HTTP web-consoles : Hadoop的simple认证不是银弹