大数据基础--HDFS

Published on Oct 17, 2023 with 0 views and 0 comments

# 大数据

一、简介

HDFS（Hadoop Distributed File System）是Hadoop下的分布式文件系统具有高容错、高吞吐量等特性，可以部署在低成本的硬件上。

二、架构

HDFS架构如下所示，主要包含Namenode、client、datanode三个部分，一个HDFS系统，可以有多个client和datanode但是namenode只能有一个

client客户端包含HDFS的接口，用于访问HDFS的文件
namenode存储文件名，文件元数据，文件与数据块的对应关系
datanode是用于存储数据的节点

三、HDFS相关概念

3.1 block-块

HDFS默认一个块是128M，一个文件可以分为多个块
块的大小远远大于普通文件的大小，可以起到最小化寻址开销的作用
块的好处
- 支持大规模文件存储，将文件分成多个块，存储在不同节点上
- 简化系统设计，块的大小是固定的，可以快速查询有多少个块
- 适合数据备份

3.2 namenode和datanode

namenode	datanode
存储元数据	存储文件内容
数据保存在内存中	数据保存在磁盘中
保存文件、block，datanode之间的映射关系	维护block id与datanode本地文件的映射关系

HDFS只有一个namenode，简化了系统设计，但是会带来以下问题

命名空间的限制：namenode节点保存在内存中，namenode保存的数据量受内存空间大小限制
吞吐量：HDFS的吞吐量受限与namenode
隔离问题：集群中只有一个namenode，如果应用程序使用同一个集群，则无法对应用程序进行隔离
集群可用性：namenode故障则集群不可用

3.3 HDFS命名空间管理

HDFS命名空间包含目录文件和块
HDFS使用的文件分级体系与linux类似，支持创建、删除目录或文件
namenode维护文件系统命名空间，记录对名称空间或其属性的任何更改

3.4 通信协议

所有的HDFS通信协议都是构建在TCP/IP的基础上
客户端通过一个可以配置的端口向namenode发起TCP链接，并使用客户端协议与namenode进行交互
namenode和datanode之间使用数据节点协议进行交互
客户端与datanode之间的交互通过RPC(remote procedure call)来实现，namenode不会主动发起RPC，而是相应来自客户端和datanode的rpc请求

3.5 客户端

HDFS在部署时，都提供了客户端，HDFS客户端是一个库，包含HDFS文件系统接口
客户端支持打开、读取、写入等常规操作，并提供了类似shell的命令行方式来访问HDFS中的数据
HDFS提供了JAVA API作为应用程序访问文件系统的接口

四、关键特性

4.1 高可用性

如下图所示，为了解决hdfs单节点的问题，设置了两个namenode一个作为主节点，一个作为备份节点，并通过zookeeper监控namenode运行状况，节点之间通过EditLog日志或FSImage进行同步，namenode通过心跳监测监控datanode运行状况

4.2 元数据持久化

元素持久化通过secondaryNamenode(与stand by namenode不是一个组件)实现，secondaryNamenode通知namenode将ediglog和Fsimage发送给到secondaryNamenode时，namenode会在本地创建一个Editlog.new用于记录此时之后发生的元数据变更操作，secondaryNamenode利用接收到的editlog信息对Fsimage中的内容进行更新，得到一个新的Fsimage文件，然后上传到namenode，namenode节点根据新的Fsimage更新自己的Fsimage,然后将Editlog.new中的内容再更新到Fsimage

Fsimage存储文件系统数，文件夹、文件元素信息
Editlog中存储对元数据的修改信息

4.3 HDFS联邦（Federation）

HDFS有两个主要层如下图所示：

namespace
- 由文件和块组成
- 支持所有与命名空间相关的文件系统操作，如新增、删除文件或目录
块存储服务
- 块管理
  - 通过处理注册和周期性心跳来提供数据节点群集成员身份。
  - 处理块报告并维护块的位置。
  - 支持创建、删除、修改、获取区块位置等区块相关操作。
  - 管理副本放置、复制不足块的块复制，并删除过度复制的块。
- 存储 - 由数据节点通过在本地文件系统上存储块并允许读/写访问来提供

高密度纤维化层

一个HDFS集群只有一个Namenode会带来一些其他问题(详见3.2的描述)，HDFS联邦将多个HDFS集群合并为有多个namenode的集群，这样就可以解决系统的数据权限问题，系统找到自己的文件所在的namenode访问即可

HDFS联邦中，设计了多个命名空间；每个命名空间有一个namenode或一主一备两个namenode，使得HDFS的命名服务能够水平扩展
这些namenode分别进行各自命名空间namespace和块的管理，相互独立，不需要彼此协调
每个datanode要向集群中所有的namenode注册，并周期性的向所有namenode发送心跳信息和块信息，报告自己的状态
HDFS联邦每个相互独立的namenode对应一个独立的命名空间
每一个命名空间管理属于自己的一组块，这些属于同一命名空间的块对应一个“块池”的概念
每个datanode会为所有块池提供块的存储，块池中的各个块实际上是存储在不同datanode中的

4.4 数据副本机制

有一机房如下所示，有两个机架，每个机架有两台服务器，每台服务器都部署了一个datanode,，数据副本数量可以设置，集群环境默认三个

来自外部的客户端
- 第一个副本随机选择一台机器，如DN1
- 第二个副本随机选择一个跟DN1在同一个机架上的服务器，如DN2
- 第三个副本随机选择另一个机架下的服务器，如DN3
请求方来自内部的datanode服务器，如DN3
- 第一个副本就选择存放在DN3
- 第二个副本随机选择一个跟DN3同属一个机架的服务器，如DN4
- 第三个副本随机选择另一个机架下的服务器，如DN1