Есть HDD подключенные к SAS RAID контроллеру Dell Perc 5/i он же LSI MegaLogic 1068
Для просмотра подробного статуса состояния HDD можно восмользоваться пакетом smart
Устанавливаем:
apt-get install smartmontools
Но так как они спрятаны за контроллером, то нужны драйвера ядра megaraid
lsmod | grep megaraid
megaraid_sas 68571 4
scsi_mod 162321 6 megaraid_sas,libata,ses,sd_mod,sr_mod,sg
После чего можно просмотреть состояние
smartctl -d megaraid,0 -a /dev/sda
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.10.0+2] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net
Vendor: FUJITSU
Product: MBB2147RC
Revision: D407
User Capacity: 146.815.733.760 bytes [146 GB]
Logical block size: 512 bytes
Logical Unit id: 0x500000e01c2aa230
Serial number: BS03P87051FW
Device type: disk
Transport protocol: SAS
Local Time is: Thu Nov 13 11:18:53 2014 EET
Device supports SMART and is Enabled
Temperature Warning Disabled or Not Supported
SMART Health Status: HARDWARE IMPENDING FAILURE DATA ERROR RATE TOO HIGH [asc=5d, ascq=12]
Current Drive Temperature: 28 C
Drive Trip Temperature: 65 C
Manufactured in week 28 of year 2008
Specified cycle count over device lifetime: 50000
Accumulated start-stop cycles: 31
Elements in grown defect list: 2199
Error counter log:
Errors Corrected by Total Correction Gigabytes Total
ECC rereads/ errors algorithm processed uncorrected
fast | delayed rewrites corrected invocations [10^9 bytes] errors
read: 0 4688 5740 4688 216788 75460,621 1052
write: 0 0 0 0 0 3304,987 0
verify: 0 1120 1120 1120 63189 31420,090 0
Non-medium error count: 53
SMART Self-test log
Num Test Status segment LifeTime LBA_first_err [SK ASC ASQ]
Description number (hours)
# 1 Background long Completed - 0 - [- - -]
# 2 Background short Completed - 0 - [- - -]
Long (extended) Self Test duration: 2001 seconds [33,4 minutes]
В данном случае мы проверяем диск №0 (первый слот) и он оказался полумертвым 🙂
Следите за здоровьем своих hdd