大数据：Hadoop多节点集群搭建指南-CDA数据分析师官网

热线电话：13121318867

登录

首页大数据时代大数据：Hadoop多节点集群搭建指南

大数据：Hadoop多节点集群搭建指南

2020-06-04

收藏

1、多节点集群架构设计

后续介绍的Hadoop多节点集群由三台计算机构成:一台主节点为master，两台从节点为slave1、slave2。

master节点上主要运行namenode、Resourcemanager 进程；slave节点上运行datanode、nodemanager进程。

由于大家一般只有一台计算机，因此我们使用虚拟机软件VMware workstation虚拟出三台计算机来分别运行master、slave1、slave2节点。因为是虚拟出的集群，所以跟实际的进群还是有差距的，不会体会到真正的并行计算与并行存储的优势。实际工作中整个集群会有十几个甚至上百个节点，可以批量处理以T为单位的数据。然而他们配置方法是大致相同的，运行过程也是一致的，区别只是在运行速度和存储数据量上会体现出来。

为了简化安装过程，我们将在之前的伪分布集群基础上通过修改配置文件等操作来创建master节点。

2、复制伪分布集群节点

首先需要复制之前安装配置过伪分布集群的虚拟机。具体操作步骤如下：

1）启动VMware Workstation，选择虚拟机->管理->克隆

单击下一步继续

克隆自选择虚拟机中的当前状态，然后单击下一步

克隆方法选择创建完整克隆

虚拟机名称设置为master，虚拟机位置根据电脑情况，请自定义。最后单击完成按钮完成克隆配置。

耐心等待，克隆过程时间长短取决于电脑磁盘读写性能。

出现如下图标表示克隆完成，单击关闭按钮结束克隆过程。

此时VMware自动弹出克隆后的虚拟机控制窗口。

3、虚拟机参数设置

用于分布式集群的虚拟机既要可以连接互联网又要可以连接其他虚拟机，在VMware软件中网卡类型选择NAT模式即可完成集群外部、内部通讯。如果是在virtualbox中则配置NAT网卡之外还需配置仅主机模式网卡一张，NAT与外部通讯，仅主机模式网卡用于集群内部通讯。

参照下图双击网络适配器

双击

网络连接选择NAT模式，内存建议2G，其他配置默认即可。

复制好master虚拟机之后还需对其进行多项配置，主要有hostname、配置固定IP，修改hadoop配置文件等，这些内容将在下篇介绍。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

虚拟机 Hadoop 分布式集群

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇上班前后的颜值，是否像极老板眼中你的报表和别人家的差距？

下一篇分布式集群参数master节点：DataNode、NameNode等相关配置

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

更多

Copyright © 2015-2021, www.cda.cn All Rights Reserved. CDA数据分析师(北京国富如荷网络科技有限公司) 版权所有京ICP备11001960号-9

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

OK

客服在线

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册