hdfs-case-one

hdfs decommition 的时候同时开启balancer的问题

这次机房迁移发现 机器长久处于decommition in prograss 的状态:
hdfs-decommition-balancer-1.png

但是overview里面Number of Under-Replicated Blocks = 0。

老机房机器日志如下:
hdfs-decommition-balancer-2.png

新机房机器日志如下:
hdfs-decommition-balancer-3.png

搜了一些资料:
hdfs-decommition-balancer-4.jpg

结合balancer的日志:
hdfs-decommition-balancer-5.jps

判断是本机在decommissioning过程中只参考了本机的块是否复制成功,没有从全局去考虑(已经被balancer拷贝过了)。

估计也没人在decommisioning的过程中开启balancer的, 所以这些decommissioning in progress的机器上的datanode直接kill掉了,不影响使用,不丢失数据。