Просмотр S.M.A.R.T у hdd подключенных к LSI Megaraid
Есть HDD подключенные к SAS RAID контроллеру Dell Perc 5/i он же LSI MegaLogic 1068
Для просмотра подробного статуса состояния HDD можно восмользоваться пакетом smart
Устанавливаем:
apt-get install smartmontools |
Но так как они спрятаны за контроллером, то нужны драйвера ядра megaraid
lsmod | grep megaraid megaraid_sas 68571 4 scsi_mod 162321 6 megaraid_sas,libata,ses,sd_mod,sr_mod,sg |
После чего можно просмотреть состояние
smartctl -d megaraid,0 -a /dev/sda smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.10.0+2] (local build) Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net Vendor: FUJITSU Product: MBB2147RC Revision: D407 User Capacity: 146.815.733.760 bytes [146 GB] Logical block size: 512 bytes Logical Unit id: 0x500000e01c2aa230 Serial number: BS03P87051FW Device type: disk Transport protocol: SAS Local Time is: Thu Nov 13 11:18:53 2014 EET Device supports SMART and is Enabled Temperature Warning Disabled or Not Supported SMART Health Status: HARDWARE IMPENDING FAILURE DATA ERROR RATE TOO HIGH [asc=5d, ascq=12] Current Drive Temperature: 28 C Drive Trip Temperature: 65 C Manufactured in week 28 of year 2008 Specified cycle count over device lifetime: 50000 Accumulated start-stop cycles: 31 Elements in grown defect list: 2199 Error counter log: Errors Corrected by Total Correction Gigabytes Total ECC rereads/ errors algorithm processed uncorrected fast | delayed rewrites corrected invocations [10^9 bytes] errors read: 0 4688 5740 4688 216788 75460,621 1052 write: 0 0 0 0 0 3304,987 0 verify: 0 1120 1120 1120 63189 31420,090 0 Non-medium error count: 53 SMART Self-test log Num Test Status segment LifeTime LBA_first_err [SK ASC ASQ] Description number (hours) # 1 Background long Completed - 0 - [- - -] # 2 Background short Completed - 0 - [- - -] Long (extended) Self Test duration: 2001 seconds [33,4 minutes] |
В данном случае мы проверяем диск №0 (первый слот) и он оказался полумертвым 🙂
Следите за здоровьем своих hdd