hadoop和hadoop有什么区别？

如题所述

举报该问题

推荐答案 2023-12-07

1、运行模式不同：

单机模式是Hadoop的默认模式。这种模式在一台单机上运行，没有分布式文件系统，而是直接读写本地操作系统的文件系统。

伪分布模式这种模式也是在一台单机上运行，但用不同的Java进程模仿分布式运行中的各类结点。

2、配置不同：

单机模式（standalone）首次解压Hadoop的源码包时，Hadoop无法了解硬件安装环境，便保守地选择了最小配置。在这种默认模式下所有3个XML文件均为空。当配置文件为空时，Hadoop会完全运行在本地。

伪分布模式在“单节点集群”上运行Hadoop，其中所有的守护进程都运行在同一台机器上。

3、节点交互不同：

单机模式因为不需要与其他节点交互，单机模式就不使用HDFS，也不加载任何Hadoop的守护进程。该模式主要用于开发调试MapReduce程序的应用逻辑。

伪分布模式在单机模式之上增加了代码调试功能，允许你检查内存使用情况，HDFS输入输出，以及其他的守护进程交互。

扩展资料：

核心架构:

1、HDFS：

HDFS对外部客户机而言，HDFS就像一个传统的分级文件系统。可以创建、删除、移动或重命名文件，等等。存储在 HDFS 中的文件被分成块，然后将这些块复制到多个计算机中（DataNode）。这与传统的 RAID 架构大不相同。块的大小和复制的块数量在创建文件时由客户机决定。

2、NameNode

NameNode 是一个通常在 HDFS 实例中的单独机器上运行的软件。它负责管理文件系统名称空间和控制外部客户机的访问。NameNode 决定是否将文件映射到 DataNode 上的复制块上。

3、DataNode

DataNode 也是在 HDFS实例中的单独机器上运行的软件。Hadoop 集群包含一个 NameNode 和大量 DataNode。DataNode 通常以机架的形式组织，机架通过一个交换机将所有系统连接起来。Hadoop 的一个假设是：机架内部节点之间的传输速度快于机架间节点的传输速度。

参考资料来源：百度百科-Hadoop

温馨提示：答案为网友推荐，仅供参考

当前网址：http://www.wendadaohang.com/zd/44nKW33W34A34AAWd1.html

相似回答

hadoop是什么 hadoop介绍答：1、Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统（Hadoop Distributed File System），...

hadoop和hadoop生态圈有什么区别答：1、Hadoop狭义是框架，广义是生态圈；2、Hadoop框架，java语言实现开源软件框架，是开发和运行处理大规模数据的软件平台；3、Hadoop生态圈，当下的Hadoop已经成长为一个庞大的体系，随着生态系统的成长，新出现的项目越来越多，...

Hadoop是什么?能不能给点具体的解释?怎么用?答：2、Hadoop是一个用于运行应用程序在大型集群的廉价硬件设备上的框架。Hadoop为应用程序透明的提供了一组稳定/可靠的接口和数据运动。3、Hadoop这个名字不是一个缩写，而是一个虚构的名字。该项目的创建者，DougCutting解释Hadoop...

hadoop 是什么意思?答：Hadoop是一个开源的分布式数据处理框架。它被用来处理大数据，为处理大规模数据的应用程序提供存储和处理服务。Hadoop核心由两个主要部分组成：Hadoop Distributed File System（HDFS）和MapReduce编程模型。HDFS是一个分布式文件系统...

Hadoop是什么答：Hadoop是什么?Hadoop是一个开发和运行处理大规模数据的软件平台,是Appach的一个用java语言实现开源软件框架，实现在大量计算机组成的集群中对海量数据进行分布式计算.Hadoop框架中最核心设计就是：HDFS和MapReduce.HDFS提供了海量...

hadoop是什么答：1、hadoop是一个由Apache基金会所开发的分布式系统基础架构。2、它可以使用户在不了解分布式底层细节的情况下，开发分布式程序，充分利用集群的威力进行高速运算和存储。3、hadoop的框架最核心的设计就是HDFS和MapReduce，HDFS为...

Hadoop 1.x与Hadoop 2.x的区别答：Hadoop1.x的HDFS架构的局限：（1）访问隔离现在大部分公司的集群都是共享的,每天有来自不同group的不同用户提交作业.单个namenode难以提供隔离性,即：某个用户提交的负载很大的job会减慢其他用户的job,单一的NameNode难以像...

Hadoop 是什么,有什么用?答：Hadoop是由Java语言编写的，在分布式服务器集群上存储海量数据并运行分布式分析应用的开源框架，其核心部件是HDFS与MapReduce HDFS是一个分布式文件系统，引入存放文件元数据信息的服务器Namenode和实际存放数据的服务器Datanode，对...

Hadoop,MapReduce,YARN和Spark的区别与联系答：实际上，当前Hadoop只有两个版本：Hadoop 1.0和Hadoop 2.0，其中，Hadoop 1.0由一个分布式文件系统HDFS和一个离线计算框架MapReduce组成，而Hadoop 2.0则包含一个支持NameNode横向扩展的HDFS，一个资源管理系统YARN和一个...

大家正在搜

ceph和hadoop的区别 cdh和hadoop区别 spark和hadoop区别 hadoop和oracle的区别 hadoop和dubbo区别 hadoop1和hadoop2 hadoop3和2的区别 kafka与hadoop的区别 hadoop和mysql区别