蚂蚁矿机-DHCP租期过长引起的机器无法获取IP
故障现象:
常见于机器上下架更换的时候,当在一个IP段大量更换机器后发现新上架的机器,始终无法通过扫描软件扫描到这些新上架的机器,但未下架的机器依然正常,电脑也能正常上网,恢复出厂设置也没用,且该IP段也没有超过250台机器,新上架机器在其他网段又能正常。
原因分析:
1. 了解矿机获取IP地址方式:
每台矿机出厂会自带一个MAC地址,矿机默认接入Network的过程是通过DHCP方式获取一个IP地址,这样在路由器mac地址表里会存在一张矿机MAC地址和IP地址对应表。
2. 了解地址租期是什么:
指MAC地址和IP地址绑定关系的有效期,如果地址租期为2天,将一台矿机下架,则需要再过48小时之后IP地址与MAC地址的绑定关系才会释放,该IP地址才可以给新的矿机使用。
一般来讲1个C类网段的可用地址大约有253个,也就是说路由器里面的MAC地址和IP地址对应表可以存放最多253,这个数量可以在路由器的DHCP配置界面进行配置。
如果在这个网段有250台机器,下架100台,再上架100台机器,下架的100台机器IP于MAC地址的绑定关系还没有释放,新上架的100台机器是无法获取到IP地址的。
3. 故障判断
扫描不到机器,且机器无法获取IP地址,可能是因为该网段IP地址的分配有问题。
排查思路:
1,检查路由器DHCP服务是否开启。
2,在路由器中检查该IP段的地址数量是否超过现有机器数量。
3,在电脑Network共享中心——本地连接——详细信息中,检查IP地址中的IP租期时间,如图中的IP地址需要到8月1号 1点才过期,也就表明这个IP地址需要在这个时间后才能使用。

4,如果该时间明显距离很长,需计算该IP段,未下架机器+已下架机器+新上架数量是否超过该IP段地址数量。如超过需重启路由器。
结果分析:
这种情况主要原因在与已下架的机器占用的IP地址,在DHCP服务器中无法释放这些IP,需要等到租约到期时间才能释放,导致新上架的机器无法获取到IP地址,重启路由器后,DHCP就会把之前的记录全部清除,已下架机器的IP地址就能释放出来。
后期改善建议:
一,在设置DHCP租期中设置为2小时,减少下架机器IP地址占用时间。
二,在单个IP段IP地址数量配置时,尽量远远大于实际机器数量,增加操作空间。