如何搭建hadoop集群桥接

如题所述

推荐答案推荐于2016-04-26

本文通过在vmware workstation上建立三台虚拟机来搭建hadoop集群环境，其中一台作为namenode，两台作为datanode。
一、安装vmware workstation（10.0.0）（一路下一步即可）
二、创建3个虚拟机
每个虚拟机安装Ubuntu 桌面版（我用的11.10，但是有点老了，建议用12.04或更高版本）
namenode建议多给写内存，我的是namenode 1G内存，20G硬盘，datanode 800M内存，20G硬盘（我电脑内存8G，若内存不够可以少分点，但是可能有些卡）上网上式可设置为桥接方式：直接连接物理网络。
三、安装vmware tools（便于主机和虚拟机直接可以直接拖拽，复制粘贴）
点击vmware 上虚拟机-》安装VMware tools，自动打开一个包含vmware安装包的位置，可以拷贝到你有权限的地方，例如/usr/src下用 sudo tar zxvf 软件包名称解压，之后进入解压后的文件夹，执行
sudo ./vmware-install.sh来安装，过程中遇见yes或no一律enter键，安装后重启生效。
四、配置共享目录（让主机和虚拟机直接方便实时共享）
对每个虚拟机，点击vmware上虚拟机-》设置-》选项，选择共享文件夹，永久共享，添加一个本机的目录所为共享目录，并为这个共享起一个名字，例如叫share。这样在虚拟机上的 /mnt/hgfs下会自动生成share文件夹保持与主机上的目录实时一致。重启生效，有时生效较慢，多重启几次就行了，不知何故。
五，安装ssh，为了一会的免密码登陆
对每台虚拟机运行：sudo apt-get install openssh-server
若不成功，你可能需要更新一下资源列表了：sudo apt-get update
六、配置ssh无密码登录，方便namenode给datanode分配任务和汇总信息
说明：以下生成的秘钥默认保存在用户名空间，所以建议三台虚拟机建立同样的用户名，例如hadoop，也可以都用root用户。
在name node,和datanode都运行:
ssh-keygen –t dsa -P '' –f ~/.ssh/id_dsa （建议手打此命令，复制有时候不行，注意都是英文字符，-P的P是大写）
下面将三台虚拟机的公钥拷贝到共享目录中并重命名以供彼此配置使用
在name node:
scp ~/.ssh/id_dsa.pub /mnt/hgfs/share/ id_dsa0.pub
在data node 1:
scp ~/.ssh/id_dsa.pub /mnt/hgfs/share/ id_dsa1.pub
在data node 2:
scp ~/.ssh/id_dsa.pub /mnt/hgfs/share/ id_dsa2.pub

将共享目录中公钥分别添加到三台虚拟机的授权下，分别在name node，data node 1和data node 2执行:
cat /mnt/hgfs/share/id_dsa0.pub >> ~/.ssh/authorized_keys
cat /mnt/hgfs/share/id_dsa1.pub >> ~/.ssh/authorized_keys
cat /mnt/hgfs/share/id_dsa2.pub >> ~/.ssh/authorized_keys

测试：
ssh localhost
ssh 目标机器地址

七，安装jdk
对每个虚拟机：
下载jdk(jdk1.6.0)并解压，假定目录为/usr/src/jdk1.6.0（如果你的不是，也可以改成是，这样下面的命令直接复制就行了）
设置环境变量。
#vi /etc/profile
在最后面加入
#set java environment
export JAVA_HOME=/usr/src/jdk1.6.0
export CLASSPATH=.:$JAVA_HOME/lib.tools.jar
export PATH=$JAVA_HOME/bin:$PATH
保存退出。
要使JDK在所有的用户中使用，可以这样：
vi /etc/profile.d/java.sh
在新的java.sh中输入以下内容：
#set java environment
export JAVA_HOME=/usr/src/jdk1.6.0
export CLASSPATH=.:$JAVA_HOME/lib/tools.jar
export PATH=$JAVA_HOME/bin:$PATH
保存退出，然后给java.sh分配权限：chmod 755 /etc/profile.d/java.sh
重启虚拟机
八、安装hadoop
在usr/src目录解压： tar zxvf hadoop-0.20.2.tar.gz
把hadoop的安装路径添加到/etc/profile中：
export HADOOP_HOME=/usr/src/hadoop-0.20.2
export PATH=$HADOOP_HOME/bin:$PATH

九、配置hadoop
在hadoop-0.20.1/conf目录：
（1）对3个虚拟机，在conf/hadoop-env.sh中配置java环境
vi hadoop-env.sh
在hadoop-env.sh文件中添加
export JAVA_HOME=/usr/src/jdk1.6.0
(2) 用ifconfig命令查看ip地址，假定name node内部地址为192.168.204.157，data node 1和data node 2分别为192.168.204.162，192.168.204.173
对name node配置conf/masters和conf/slaves:
masters : 192.168.204.157
slaves : 192.168.204.162
192.168.204.173
(3)对name node, data node 1和data node2,配置conf/core-site.xml, conf/hdfs-site.xml及conf/mapred-site.xml，配置文件内的IP地址均配置为name node的IP地址（比如name node IP地址为192.168.204.157。
说明：因为三台上面这三个配置一样，所以配置一份，然后复制粘贴即可。
（又说明：下面之所以上图片是因为，新浪会把字符按html重新编译，无法正常显示，无奈啊）

十、运行hadoop
先把三台虚拟机的防火墙关了： sudo ufw disable
对name node：
进入hadoop-0.20.2/bin，首先格式化文件系统： hadoop namenode –format
对data node1 和data node 2：
进入hadoop-0.20.2/bin，执行： hadoop datanode –format

对name node：，在bin目录下执行：
start-all.sh
hadoop dfsadmin –safemode leave
hadoop dfsadmin –report, 查看节点情况，看到类似界面显示available的Datanodes 。

用jps命令查看进程，NameNode上的结果为：
26745 JobTracker
29398 jps
27664 NameNode

Data Node 1 的结果：
6718 TaskTracker
6042 DataNode
6750 jps

Data Node 2 的结果：
12173 TaskTracker
10760 DataNode
12700 jps
至此，安装成功。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://www.wendadaohang.com/zd/K313AGKGn1311d53W1.html

其他回答

第1个回答 2015-12-27

部署步骤序号操作 1 配置SSH无密码登陆 2 配置环境变量JAVA(必须),MAVEN,ANT 3 配置Hadoop环境变量 4 配置core-site.xml文件 5 配置hdfs-site.xml文件 6 配置mapred-site.xml文件 7 配置yarn-site.xml文件 8 配置slaves文件 9 分发到从机上 10...

相似回答

如何搭建50t的hadoop集群答：要配置Hadoop集群，你需要设置Hadoop守护进程的运行环境和Hadoop守护进程的运行参数。Hadoop守护进程指NameNode/DataNode 和JobTracker/TaskTracker。配置Hadoop守护进程的运行环境管理员可在conf/hadoop-env.sh脚本内对Hadoop守护进程的运行环境做特别指定。至少，你得设定JAVA_HOME使之在每一远端节点上都被...

linux搭建hadoop步骤linux搭建hadoop答：1.jdk安装与配置 2.host 3.ssh 4.文件目录B、Hadoop安装与配置1.下载hadoop软件2.环境变量3.hadoop配置C、运行Hadoop1.运行hdfs2.运行yarnD、测试hadoop，这是搭建集群的大题路径，详细的可以去看一下八斗学院的视频，第一部分是讲集群搭建的很详细 hadoop安装在什么系统上？windows下的hadoop的分布部...

简述hadoop大数据平台搭建的主要步骤答：在搭建Hadoop大数据平台之前，首先需要准备相应的硬件和软件环境。硬件环境通常包括多台服务器或者虚拟机，用于构建Hadoop的分布式集群。软件环境则包括操作系统、Java运行环境等。例如，可以选择CentOS或Ubuntu等Linux发行版作为操作系统，安装JDK（Java Development Kit）以提供Java运行环境。Hadoop安装与配置接...

如何构建最优化的Hadoop集群答：利用alternatives来管理链接•使用配置管理系统(Yum、Permission、sudoers等)•减少内核交换•撤销一般用户访问这些云计算机的权限•不要使用虚拟化•至少需要以下Linux命令：/etc/alternativesln、chmod、chown、chgrp、mount、umount、kill、rm、yum、mkdir硬件要求由于Hadoop集群中...

hadoop集群,怎么才能让两部电脑上的虚拟机ping通,谢谢答：回答：1)将虚拟机A1和B1的网络连接设置成桥接(估计你目前是NAT模式), 2)在A1下配置网络,配置可参考A(Win7),除IP不同,其它如子网掩码, 默认网关或者DNS服务器都相同, 在B1下配置网络,配置可参考B(Win7),除IP不同,其它如子网掩码, 默认网关或者DNS服务器都相同, 3)确认A1和B1下可以上网,可以...

如何用cloudera manager接管已有hadoop的cdh版本集群答：本文介绍如何搭建cloudera manager去接入已有hadoop组件（cdh），搜索国内资料并无整体介绍，没有任何参考文章可以借鉴；通过大数据qq交流群当中某老师提供的国外某篇cloudera cto的文章得到解决思路，经实验调试可以实现此功能。下面进入本文主题。一、下载必备文件：1.cloudera manager：大部分公司内大数据集群...

如何基于Docker快速搭建多节点Hadoop集群答：直接用机器搭建Hadoop集群是一个相当痛苦的过程，尤其对初学者来说。他们还没开始跑wordcount，可能就被这个问题折腾的体无完肤了。而且也不是每个人都有好几台机器对吧。你可以尝试用多个虚拟机搭建，前提是你有个性能杠杠的机器。我的目标是将Hadoop集群运行在Docker容器中，使Hadoop开发者能够快速便捷地...

如何基于Docker快速搭建多节点Hadoop集群答：另外,alvinhenrick/hadoop-mutinode项目增加节点时需要手动修改Hadoop配置文件然后重新构建hadoop- nn-dn 镜像,然后修改容器启动脚本,才能实现增加节点的功能。而我通过shell脚本实现自动话,不到1分钟可以重新构建hadoop-master镜像,然后立即运行!本项目默认启动3个节点的Hadoop集群,支持任意节点数的Hadoop集群。另外,启...

如何基于Docker快速搭建多节点Hadoop集群答：hdfs run-wordcount.sh serf_log start-hadoop.sh start-ssh-serf.sh start-hadoop.sh是开启hadoop的shell脚本，run-wordcount.sh是运行wordcount的shell脚本，可以测试镜像是否正常工作。5.测试容器是否正常启动(此时已进入master容器)查看hadoop集群成员：serf members 运行结果：master.kiwenlau.com 172.17...

大家正在搜

怎样搭建hadoop集群 hadoop集群快速搭建搭建hadoop集群的步骤 hadoop集群搭建完整教程 hadoop集群如何使用简述hadoop集群搭建步骤访问hadoop 集群 hadoop的搭建 hadoop怎么搭建的

如何搭建hadoop集群 桥接

如何搭建hadoop集群桥接