作者回复: 就是异或运算
所有数据的bit位,逐位进行异或,得到的就是校验位。
如果丢失部分数据,用校验数据和其余数据逐位进行异或运算,可到丢失部分数据。
举例,5块磁盘做RAID5,四块磁盘上的bit为:0 1 1 1 ,那么异或计算后,校验位为 1,如果丢失了第一块盘上的bit位0,那么校验位1和其他三块盘上的bit位进行异或运算,可以算出0
作者回复: 元数据节点NameNode只提供类似文件控制块的数据读写,数据量非常小,不会成为瓶颈。一个数据块Block大小64M,对应的NameNode控制块数据大概只有几十个字节。
作者回复: 32位指针只有4G寻址空间,应该是不够管理硬盘空间的。
作者回复: 收到,尽快修正,谢谢~
作者回复: d a t a表示需要写入RAID的数据,p q表示两种不同校验算法得到的校验数据。
作者回复: HDFS缺省的高可用策略是RAID0,数据会做多个备份,应用可以指定备份数,如果想要加快读的速度,可以增加备份个数。