近期,有客户遇到vSAN异常,经排查为其中一台主机的一个磁盘组中的SSD缓存盘异常,从IDRAC中查看如下:
该SSD剩余额度写入耐久性为1%。之后经过更换SSD,vSAN集群正常。
注:Media Wearout Indicator
表示SSD上NAND的擦写次数的程度,初始值为100,随着擦写次数的增加,开始线性递减,递减速度按照擦写次数从0到最大的比例。一旦这个值降低到1,就不再降了,同时表示SSD上面已经有NAND的擦写次数到达了最大次数。这个时候建议需要备份数据,以及更换SSD。
下面主要介绍查询方法:
一、通过比如raid卡管理软件查看硬盘smart信息,比如DELL的IDRAC,如上图,就很直观的显示。
二、借助ESXi自带的esxcli命令查看磁盘的S.M.A.R.T属性。
SSD固态盘寿命可以通过S.M.A.R.T中的"Media Wearout Indicator"属性提供。
esxcli storage core device list #查看有哪些磁盘
esxcli storage core device smart get -d <disk> #查看磁盘信息
找到IS SSD:true对应的硬盘naa号码,查询后如上图,Media Wearout Indicator值为96,表明已经磨损4%。
但是,但是,有些环境下好像也无法正常显示,如下图,直接显示N/A,
那么可以尝试借助第三方工具smartctl了。
三、使用smartctl查看
1、下载smartctl的VIB程序包:http://pfoo.unscdf.org/esxi/smartctl-6.6-4433.x86_64.vib
有网友反馈版本老,下面来个高版本的。
2、安装vib,上传比较简单,就不详细介绍了。注意先把驱动包接受等级调为“支持社区”,安装时注意绝对路径。
esxcli software acceptance set --level=CommunitySupported
esxcli software vib install -v /vmfs/volumes/datastore/smartctl-6.6-4433.x86_64.vib
3、查询命令如下:
/opt/smartmontools/smartctl -d sat -a /dev/disk/<disk>
/opt/smartmontools/smartctl -d sat -a /vmfs/devices/disks/<disk>
如下图,我的vSAN测试环境中由于SSD盘不是使用直通,使用了RAID0模式,因此没有正常显示。后续有场景再另外截图。
注意: SmartMonTools在RAID中无法用于ESXi,需要使用JBOD直通模式。
2条评论