HDFS基础学习-五

DataNode

DataNode工作机制

1）一个数据块在DataNode上以文件形式存储在磁盘上，包括两个文件，一个是数据本身，一个是元数据包括数据块的长度，块数据的校验和，以及时间戳。
2）DataNode启动后向NameNode注册，通过后，周期性（1小时）的向NameNode上报所有的块信息。
3）心跳是每3秒一次，心跳返回结果带有NameNode给该DataNode的命令如复制块数据到另一台机器，或删除某个数据块。如果超过10分钟没有收到某个DataNode的心跳，则认为该节点不可用。
4）集群运行中可以安全加入和退出一些机器。

数据完整性

思考：如果电脑磁盘里面存储的数据是控制高铁信号灯的红灯信号（1）和绿灯信号（0），但是存储该数据的磁盘坏了，一直显示是绿灯，是否很危险？同理DataNode节点上的数据损坏了，却没有发现，是否也很危险，那么如何解决呢？

如下是DataNode节点保证数据完整性的方法。

1）当DataNode读取Block的时候，它会计算CheckSum。
2）如果计算后的CheckSum，与Block创建时值不一样，说明Block已经损坏。
3）Client读取其他DataNode上的Block。
4）DataNode在其文件创建后周期验证CheckSum

掉线时限参数设置

需要注意的是hdfs-site.xml 配置文件中的heartbeat.recheck.interval的单位为毫秒，dfs.heartbeat.interval的单位为秒。

服役新数据节点

数据量越来越大，原有的数据节点的容量已经不能满足存储数据的需求，需要在原有集群基础上动态添加新的数据节点。

环境准备

（1）在hadoop104主机上再克隆一台hadoop105主机
（2）修改IP地址和主机名称
（3）删除原来HDFS文件系统留存的文件（/opt/module/hadoop-2.7.2/data和log）
（4）source一下配置文件

服役新节点具体步骤

（1）直接启动DataNode，即可关联到集群

1 2	[root@hadoop105 hadoop-2.7.2]$ sbin/hadoop-daemon.sh start datanode [root@hadoop105 hadoop-2.7.2]$ sbin/yarn-daemon.sh start nodemanager

（2）在hadoop105上上传文件

1	[root@hadoop105 hadoop-2.7.2]$ hadoop fs -put /opt/module/hadoop-2.7.2/LICENSE.txt /

（3）如果数据不均衡，可以用命令实现集群的再平衡

1
2
3

[root@hadoop102 sbin]$ ./start-balancer.sh
starting balancer, logging to /opt/module/hadoop-2.7.2/logs/hadoop-root-balancer-hadoop102.out
Time Stamp               Iteration#  Bytes Already Moved  Bytes Left To Move  Bytes Being Moved

但是这样有一个问题，如果有一个黑客知道了你的namenode地址之类的，他自己配置一个节点，就直接可以加入到咱们的集群中，那岂不是很危险，咱们接下来可以看看黑白名单节点

退役旧数据节点

添加白名单

添加到白名单的主机节点，都允许访问NameNode，不在白名单的主机节点，都会被退出。

配置白名单的具体步骤如下：

（1）在NameNode的/opt/module/hadoop-2.7.2/etc/hadoop目录下创建dfs.hosts文件

[root@hadoop102 hadoop]$ pwd
/opt/module/hadoop-2.7.2/etc/hadoop
[root@hadoop102 hadoop]$ touch dfs.hosts
[root@hadoop102 hadoop]$ vi dfs.hosts

添加如下主机名称（不添加hadoop105）

1
2
3

hadoop102
hadoop103
hadoop104

（2）在NameNode的hdfs-site.xml配置文件中增加dfs.hosts属性（让hadoop集群知道白名单）

<property>
<name>dfs.hosts</name>
<value>/opt/module/hadoop-2.7.2/etc/hadoop/dfs.hosts</value>
</property>

（3）配置文件分发

1	[root@hadoop102 hadoop]$ xsync hdfs-site.xml

（4）刷新NameNode

1	[root@hadoop102 hadoop-2.7.2]$ hdfs dfsadmin -refreshNodes

（5）更新ResourceManager节点

1 2	[root@hadoop102 hadoop-2.7.2]$ yarn rmadmin -refreshNodes 17/06/24 14:17:11 INFO client.RMProxy: Connecting to ResourceManager at hadoop103/192.168.1.103:8033

（6）如果数据不均衡，可以用命令实现集群的再平衡

1	[root@hadoop102 sbin]$ ./start-balancer.sh

某个节点下线之后，它的负载会不均衡，所以可以让其再平衡

黑名单退役

首先咱们恢复现场，让其有四个节点，回复步骤如下

在黑名单上面的主机都会被强制退出。

1. 在NameNode的/opt/module/hadoop-2.7.2/etc/hadoop目录下创建dfs.hosts.exclude文件

[root@hadoop102 hadoop]$ pwd
/opt/module/hadoop-2.7.2/etc/hadoop
[atguigu@hadoop102 hadoop]$ touch dfs.hosts.exclude
[atguigu@hadoop102 hadoop]$ vi dfs.hosts.exclude

添加如下主机名称（要退役的节点）

hadoop105

2. 在NameNode的hdfs-site.xml配置文件中增加dfs.hosts.exclude属性

<property>
<name>dfs.hosts.exclude</name>
      <value>/opt/module/hadoop-2.7.2/etc/hadoop/dfs.hosts.exclude</value>
</property>

3. 刷新NameNode、刷新ResourceManager

[root@hadoop102 hadoop-2.7.2]$ hdfs dfsadmin -refreshNodes
Refresh nodes successful

[root@hadoop102 hadoop-2.7.2]$ yarn rmadmin -refreshNodes
17/06/24 14:55:56 INFO client.RMProxy: Connecting to ResourceManager at hadoop103/192.168.1.103:8033

4. 检查Web浏览器，退役节点的状态为decommission in progress（退役中），说明数据节点正在复制块到其他节点

5. 等待退役节点状态为decommissioned（所有块已经复制完成），停止该节点及节点资源管理器。注意：如果副本数是3，服役的节点小于等于3，是不能退役成功的，需要修改副本数后才能退役

1 2	[root@hadoop105 hadoop-2.7.2]$ sbin/hadoop-daemon.sh stop datanode [root@hadoop105 hadoop-2.7.2]$ sbin/yarn-daemon.sh stop nodemanager

6. 如果数据不均衡，可以用命令实现集群的再平衡

1	[root@hadoop102 hadoop-2.7.2]$ sbin/start-balancer.sh

注意：不允许白名单和黑名单中同时出现同一个主机名称。

DataNode多目录配置

DataNode也可以配置成多个目录，每个目录存储的数据不一样。即：数据不是副本
具体配置如下【hdfs-site.xml】

<property>
        <name>dfs.datanode.data.dir</name>
<value>file:///${hadoop.tmp.dir}/dfs/data1,file:///${hadoop.tmp.dir}/dfs/data2</value>
</property>

HDFS 2.x新特性

集群间数据拷贝

scp实现两个远程主机之间的文件复制

1
2
3

scp -r hello.txt root@hadoop103:/user/atguigu/hello.txt		// 推 push
scp -r root@hadoop103:/user/atguigu/hello.txt  hello.txt		// 拉 pull
scp -r root@hadoop103:/user/atguigu/hello.txt root@hadoop104:/user/atguigu   //是通过本地主机中转实现两个远程主机的文件复制；如果在两个远程主机之间ssh没有配置的情况下可以使用该方式。

采用distcp命令实现两个Hadoop集群之间的递归数据复制

1 2	[root@hadoop102 hadoop-2.7.2]$ bin/hadoop distcp hdfs://haoop102:9000/user/atguigu/hello.txt hdfs://hadoop103:9000/user/atguigu/hello.txt

小文件归档

3.案例实操

（1）需要启动YARN进程

1	[root@hadoop102 hadoop-2.7.2]$ start-yarn.sh

（2）归档文件

把/user/atyp/input目录里面的所有文件归档成一个叫input.har的归档文件，并把归档后文件存储到/user/atyp/output路径下。

1	[root@hadoop102 hadoop-2.7.2]$ bin/hadoop archive -archiveName input.har –p /user/atyp/input /user/atyp/output

（3）查看归档

1 2	[root@hadoop102 hadoop-2.7.2]$ hadoop fs -lsr /user/atyp/output/input.har [root@hadoop102 hadoop-2.7.2]$ hadoop fs -lsr har:///user/atyp/output/input.har

（4）解归档文件

1	[root@hadoop102 hadoop-2.7.2]$ hadoop fs -cp har:/// user/atyp/output/input.har/* /user/atguigu

回收站

开启回收站功能，可以将删除的文件在不超时的情况下，恢复原数据，起到防止误删除、备份等作用。

回收站参数设置及工作机制

启用回收站
修改core-site.xml，配置垃圾回收时间为1分钟。

<property>
   <name>fs.trash.interval</name>
<value>1</value>
</property>

修改core-site.xml访问垃圾回收站用户名称(进入垃圾回收站用户名称，默认是dr.who，修改为root用户)

<property>
  <name>hadoop.http.staticuser.user</name>
  <value>root</value>
</property>

查看回收站
回收站在集群中的路径：/user/atguigu/.Trash/….
通过程序删除的文件不会经过回收站，需要调用moveToTrash()才进入回收站

1 2	Trash trash = New Trash(conf); trash.moveToTrash(path);

恢复回收站数据

1 2	[root@hadoop102 hadoop-2.7.2]$ hadoop fs -mv /user/root/.Trash/Current/user/atguigu/input /user/root/input

清空回收站

1	[root@hadoop102 hadoop-2.7.2]$ hadoop fs -expunge

注意：清空回收站后，也是生成了一个时间戳文件来保存文件

快照管理

1
2
3

[root@hadoop102 hadoop-2.7.2]$ hdfs dfsadmin -allowSnapshot /user/atyp/input

[root@hadoop102 hadoop-2.7.2]$ hdfs dfsadmin -disallowSnapshot /user/atyp/input

1	[root@hadoop102 hadoop-2.7.2]$ hdfs dfs -createSnapshot /user/atyp/input

通过web访问hdfs://hadoop102:50070/user/atyp/input/.snapshot/s…..// 快照和源文件使用相同数据

1	[root@hadoop102 hadoop-2.7.2]$ hdfs dfs -lsr /user/atyp/input/.snapshot/

指定名称创建快照

1	[root@hadoop102 hadoop-2.7.2]$ hdfs dfs -createSnapshot /user/atyp/input miao170508

重命名快照

1	[root@hadoop102 hadoop-2.7.2]$ hdfs dfs -renameSnapshot /user/atyp/input/ miao170508 atyp170508

1	[root@hadoop102 hadoop-2.7.2]$ hdfs lsSnapshottableDir

1	[root@hadoop102 hadoop-2.7.2]$ hdfs snapshotDiff /user/atguigu/input/ . .snapshot/atguigu170508

恢复快照

1 2	[root@hadoop102 hadoop-2.7.2]$ hdfs dfs -cp /user/atyp/input/.snapshot/s20170708-134303.027 /user