Просмотр S.M.A.R.T у hdd подключенных к LSI Megaraid

Есть HDD подключенные к SAS RAID контроллеру Dell Perc 5/i он же LSI MegaLogic 1068
Для просмотра подробного статуса состояния HDD можно восмользоваться пакетом smart
Устанавливаем:

apt-get install smartmontools

Но так как они спрятаны за контроллером, то нужны драйвера ядра megaraid

lsmod | grep megaraid
megaraid_sas           68571  4 
scsi_mod              162321  6 megaraid_sas,libata,ses,sd_mod,sr_mod,sg

После чего можно просмотреть состояние

smartctl -d megaraid,0 -a /dev/sda
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.10.0+2] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net
 
Vendor:               FUJITSU 
Product:              MBB2147RC       
Revision:             D407
User Capacity:        146.815.733.760 bytes [146 GB]
Logical block size:   512 bytes
Logical Unit id:      0x500000e01c2aa230
Serial number:        BS03P87051FW
Device type:          disk
Transport protocol:   SAS
Local Time is:        Thu Nov 13 11:18:53 2014 EET
Device supports SMART and is Enabled
Temperature Warning Disabled or Not Supported
SMART Health Status: HARDWARE IMPENDING FAILURE DATA ERROR RATE TOO HIGH [asc=5d, ascq=12]
 
Current Drive Temperature:     28 C
Drive Trip Temperature:        65 C
Manufactured in week 28 of year 2008
Specified cycle count over device lifetime:  50000
Accumulated start-stop cycles:  31
Elements in grown defect list: 2199
 
Error counter log:
           Errors Corrected by           Total   Correction     Gigabytes    Total
               ECC          rereads/    errors   algorithm      processed    uncorrected
           fast | delayed   rewrites  corrected  invocations   [10^9 bytes]  errors
read:          0     4688      5740      4688     216788      75460,621        1052
write:         0        0         0         0          0       3304,987           0
verify:        0     1120      1120      1120      63189      31420,090           0
 
Non-medium error count:       53
 
SMART Self-test log
Num  Test              Status                 segment  LifeTime  LBA_first_err [SK ASC ASQ]
     Description                              number   (hours)
# 1  Background long   Completed                   -       0                 - [-   -    -]
# 2  Background short  Completed                   -       0                 - [-   -    -]
 
Long (extended) Self Test duration: 2001 seconds [33,4 minutes]

В данном случае мы проверяем диск №0 (первый слот) и он оказался полумертвым 🙂
Следите за здоровьем своих hdd

Добавить комментарий