Hadoop学习札记——Hadoop 读写文件过程剖析

Hadoop学习笔记——Hadoop 读写文件过程剖析

1. 首先客户端高速NameNode:”我要创建一个文件”。NameNode会进行一系列检查，比如文件是否存在。一旦通过检查，则创建一个文件。这时候客户端就可以写入数据了。（步骤1，2）

2. 客户端在开始写入数据时，会把数据分片，然后放入一个队列。然后NameNode会分配一个DataNode的列表给客户端来写入数据。上图中是三个，也就是数据冗余三份。数据冗余的复制是在DataNode之间完成的。（步骤3,4,5）

3. 当客户端收到全部写入成功的回执（ack packet）之后，这时会把队列中上一个Block的数据删掉。然后进行下一个Block的写入。