Monitorizar y reconstruir un hardware RAID (Linux)

Para servidores dedicados y servidores dedicados especiales adquiridos antes del 28.10.2018

En este artículo le mostramos cómo comprobar el estado de su hardware RAID, cómo reconocer un RAID defectuoso y cómo reconstruirlo.

En los servidores raíz de IONOS se utilizan controladores de hardware de 3ware, Areca, Adaptec, Broadcom o Dell.

Identificar el tipo de controlador de hardware

Con el comando lspci puede comprobar qué controlador de hardware está instalado en su servidor. Este comando lista todos los dispositivos del bus PCI.

Si está usando un sistema mínimo, debe instalar este programa manualmente. Para ello, introduzca el siguiente comando:

CentOS 7

yum install pciutils

Ubuntu 16.04 y Ubuntu 18.04 

sudo apt-get install pciutils

 

Para comprobar qué controlador de hardware se ha montado en su servidor, introduzca el siguiente comando:

lspci|grep RAID
Ejemplos:

[root@localhost ~]# lspci|grep RAID
01:00.0 RAID bus controller: Adaptec Series 6 - 6G SAS/PCIe 2 (rev 01)

 

[root@localhost ~]# lspci|grep RAID
02:00.0 RAID bus controller: Broadcom / LSI MegaRAID Tri-Mode SAS3408 (rev 01)

 

[root@localhost ~]# lspci|grep RAID
01:09.0 RAID bus controller: 3ware Inc 7xxx/8xxx-series PATA/SATA-RAID (rev 01)

 

[root@localhost ~]# lspci|grep RAID
02:0e.0 RAID bus controller: Areca Technology Corp. ARC-1110 4-Port PCI-X to SATA RAID Controller

Controladores del RAID: programas

Los programas de software que se encargan de la gestión de los controladores del RAID están instalados de manera predeterminada. Si lo necesita, puede descargar el software necesario para su controlador a continuación: 

Adaptec:

https://storage.microsemi.com/en-us/downloads/

Broadcom:

https://www.broadcom.com/support/download-search

Dell:

https://www.dell.com/support/home/de-de?app=products

3ware:

https://www.broadcom.com/support/knowledgebase/1211161499498/operating-systems-supported-for-the-lsi-3ware-and-megaraid-contr

Areca:

https://www.areca.com.tw/support/downloads.html

Mostrar los detalles del controlador de hardware RAID

Adaptec

El controlador de red de Adaptec se gestiona con la herramienta de línea de comandos arcconf. Los siguientes comandos hacen que se muestre infomación detallada acerca del controlador de RAID de Adaptec y de la configuración:

COMANDO EXPLICACIÓN
arcconf GETCONFIG 1 Con este comando se muestra información acerca del controlador del RAID, de la configuración, de las matrices del RAID, así como de los discos duros disponibles y su estado actual.
arcconf getconfig 1 PD Con este comando se muestra información acerca de los discos duros existentes.
arcconf getlogs controller-number device ¦ dead ¦ event [clear ¦ tabular] Con este comando se muestran las entradas de logs. Puede introducir los siguientes parámetros para especificar el tipo de entradas que se muestran:
Ejemplo: arcconf getlogs 1 device tabular DEVICE: Muestra todas las entradas de logs con errores que el controlador ha podido encontrar en los dispositivos vinculados.
  DEAD: Muestra todas las entradas de logs en los que se registró una avería de los dispositivos o discos duros.
  EVENT: Muestra todas las entradas de logs con información sobre acontecimientos especiales (p.ej. rebuilds, LDMs, etc.)
  También puede utilizar los siguientes parámetros:
  tabular: Muestra el log en formato tabla.
  clear: Elimina el protocolo del controlador asignado.
arcconf getlogs controller-number device ¦ dead ¦ event [clear ¦ tabular] > NOMBRE_DEL_ARCHIVO.log Con este comando se escriben las entradas de logs en un archivo.
Ejemplo: arcconf getlogs 1 device tabular > device.log  

Podrá encontrar más información al respecto aquí:

User's Guide ARCCONF Command Line Utility

Broadcom

El controlador de RAID de Broadcom se gestiona y controla con la herramienta de línea de comandos StorCLI. Con los siguientes comandos puede hacer que se muestre información detallada acerca del controlador de RAID Broadcom y de la configuración:

COMANDO EXPLICACIÓN
storcli64 /c0 show all Con este comando se muestra información acerca del controlador del RAID y de la configuración.
storcli64 /c0/eall/sall show Con este comando se muestra información acerca de los discos duros existentes.
storcli64 /c0/eALL/sALL show all Con este comando se muestra información acerca de los discos duros disponibles y su estado acutal (número de serie, temperatura, etc.).
storcli /cx show eventloginfo Con este comando se muestran las entradas de logs.

Podrá encontrar más información al respecto aquí:

12Gb/s MegaRAID Tri-Mode StorCLI User Guide

Dell

El controlador del RAID de Dell se gestiona con la interfaz de línea de comandos PERCCLI. Con los siguientes comandos puede hacer que se muestre información detallada acerca del controlador de RAID de Dell y de la configuración:

COMANDO EXPLICACIÓN
perccli64 /c0/e32/s0 show all Con este comando se muestra información del disco duro 0.
perccli64 /c0/e32/s1 show all Con este comando se muestra información del disco duro 1.
perccli64 /c0 show Con este comando se muestra información acerca de los discos duros existentes.
perccli /c0 show eventloginfo Con este comando se muestran las entradas de logs para el controlador 0.

Podrá encontrar más información al respecto aquí:

Dell EMC PowerEdge RAID Controller CLI Reference Guide

3ware

Para obtener información sobre el controlador de RAID 3ware, escriba el siguiente comando:

# dmesg|grep 3ware
3ware Storage Controller device driver for Linux v1.26.02.002.
scsi0 : 3ware Storage Controller
3w-xxxx: scsi0: Found a 3ware Storage Controller at 0xd800, IRQ: 18.
scsi 0:0:0:0: Direct-Access 3ware Logical Disk 0 1.2 PQ: 0 ANSI: 0
3ware 9000 Storage Controller device driver for Linux v2.26.02.010.
tw_cli

El controlador del RAID 3ware se gestiona con la interfaz de línea de comandos 3ware Storage Controller Management Command Line Interface. Para abrir la interfaz de línea de comandos, introduzca el comando tw_cli. Con el comando help se muestran todos los comandos disponibles. Para salir de la consola, introduzca el comando exit.

# tw_cli
//XXX> help

Copyright(c) 2004-2006 Applied Micro Circuits Corporation(AMCC). All rights reserved.

AMCC/3ware CLI (version 2.00.06.007)


Commands Description
-------------------------------------------------------------------
focus Changes from one object to another. For Interactive Mode Only!
show Displays information about controller(s), unit(s) and port(s).
flush Flush write cache data to units in the system.
rescan Rescan all empty ports for new unit(s) and disk(s).
update Update controller firmware from an image file.
commit Commit dirty DCB to storage on controller(s). (Windows only)
/cx Controller specific commands.
/cx/ux Unit specific commands.
/cx/px Port specific commands.
/cx/bbu BBU specific commands. (9000 only)
/ex Enclosure specific commands. (9KSX/SE only)
/ex/slotx Enclosure Slot specific commands.
/ex/fanx Enclosure Fan specific commands.
/ex/tempx Enclosure Temperature Sensor specific commands.

Certain commands are qualified with constraints of controller type/model support.
Please consult the twi_cli documentation for explanation of the controller-qualifiers.

The controller-qualifiers of the Enclosure commands (/ex) also apply to Enclosure
Element specific commands (e.g., /ex/elementx).

Type help <command> to get more details about a particular command.
For more detail information see twi_cli's documentation.

//XXX>

Introduzca el siguiente comando para hacer que se muestre información sobre el estado del sistema del RAID:

//XXXX> info

Ctl Model Ports Drives Units NotOpt RRate VRate BBU
------------------------------------------------------------------------
c0 8006-2LP 2 2 1 0 2 - -

//XXXX> info c0

Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
------------------------------------------------------------------------------
u0 RAID-1 OK - - - 232.885 ON -

Port Status Unit Size Blocks Serial
---------------------------------------------------------------
p0 OK u0 232.88 GB 488397168 4ND0XYFE
p1 OK u0 232.88 GB 488397168 4ND0YH77

Para mostrar las alertas del controlador del hardware RAID, introduzca el siguiente comando:

//XXXX> show alarms

Ctl Date Severity Alarm Message
------------------------------------------------------------------------------
c0 - INFO (0x0F:0x0007): Initialization complete: Unit #0
c0 - INFO (0x0F:0x000C): Initialization started: Unit #0

Se mostrará un mensaje de alerta en el siguiente formato:

//XXXX> show alarms

Ctl Date Severity Alarm Message
------------------------------------------------------------------------------
c0 - INFO (0x0F:0x000B): Rebuild started: Unit #0
c0 - ERROR (0x0F:0x0002): Unit degraded: Unit #0

Para eliminar un disco duro defectuoso del RAID del segundo puerto, introduzca el siguiente comando:

//XXXX> maint remove c0 p1
Removing port /c0/p1 ... Done.

Después de reemplazar el disco duro defectuoso, el nuevo disco duro debe ser reconocido. Para ello, introduzca el siguiente comando:

//XXXX> maint rescan
Rescanning controller /c0 for units and drives ...Done.
Found the following unit(s): [none].
Found the following drive(s): [/c0/p1].

Para montar y reconstruir un disco en el segundo puerto, escriba el siguiente comando:

//XXXX> maint rebuild c0 u0 p1
Sending rebuild start request to /c0/u0 on 1 disk(s) [1] ... Done.

Para ver la información sobre la reconstrucción del RAID, escriba el siguiente comando:

//XXXX> info c0

Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
------------------------------------------------------------------------------
u0 RAID-1 REBUILDING 0 - - 232.885 ON -

Port Status Unit Size Blocks Serial
---------------------------------------------------------------
p0 OK u0 232.88 GB 488397168 4ND0XYFE
p1 DEGRADED u0 232.88 GB 488397168 4ND0YH77
Monitorizar el controlador del RAID con el software 3ware Disk Manager 2

3ware ofrece un software para monitorizar y gestionar su controlador del RAID. Puede descargarse este software aquí:

Descargar 3ware Disk Manager 2

Guía de uso de 3ware

Si necesita más información acerca de la instalación, configuración o aplicación de 3ware, consulte su guía de uso:

Guía de uso de 3ware

Areca

Para obtener información sobre el controlador del RAID de Areca, escriba el siguiente comando:

# dmesg|grep -i areca
ARECA RAID ADAPTER0: FIRMWARE VERSION V1.43 2007-4-17
scsi0 : Areca SATA Host Adapter RAID Controller
scsi 0:0:0:0: Direct-Access Areca ARC-1110-VOL#00 R001 PQ: 0 ANSI: 5
scsi 0:0:16:0: Processor Areca RAID controller R001 PQ: 0 ANSI: 0

A continuación se muestran algunos ejemplos de comandos. Puede acceder al controlador mediante el sistema de rescate (Rescue-System):

arcmsr_cli64
Copyright (c) 2004 Areca, Inc. All Rights Reserved.
Areca CLI, Version: 1.71.240( Linux )


Controllers List
----------------------------------------
Controller#01(PCI): ARC-1110
Current Controller: Controller#01
----------------------------------------

CMD Description
==========================================================
main Show Command Categories.
set General Settings.
rsf RaidSet Functions.
vsf VolumeSet Functions.
disk Physical Drive Functions.
sys System Functions.
net Ethernet Functions.
event Event Functions.
hw Hardware Monitor Information.
exit Exit CLI.
==========================================================
Command Format: <CMD> [Sub-Command] [Parameters].
Note: Use <CMD> -h or -help to get details.
CLI>

Con el comando <cmd> info se puede consultar la información del sistema. El comando hw info hace que se muestre la información del monitor (hardware).

CLI> hw info
The Hardware Monitor Information
===========================================
Fan#1 Speed (RPM) : 2673
HDD #1 Temp. : 48
HDD #2 Temp. : 47
HDD #3 Temp. : 51
HDD #4 Temp. : 0
===========================================
GuiErrMsg<0x00>: Success.

CLI>

Para mostrar información sobre los discos duros, escriba el siguiente comando:

CLI> disk info
# ModelName Serial# FirmRev Capacity State
===============================================================================
1 ST3750640AS 5QD5G7Z1 3.AAK 750.2GB RaidSet Member(1)
2 ST3750640AS 5QD5G6JR 3.AAK 750.2GB RaidSet Member(1)
3 ST3750640AS 5QD5G7XQ 3.AAK 750.2GB RaidSet Member(1)
===============================================================================
GuiErrMsg<0x00>: Success.

CLI>

El siguiente comando proporciona información sobre el propio controlador:

CLI> sys info
The System Information
===========================================
Main Processor : 500MHz
CPU ICache Size : 32KB
CPU DCache Size : 32KB
System Memory : 256MB/333MHz
Firmware Version : V1.43 2007-4-17
BOOT ROM Version : V1.43 2007-4-17
Serial Number : Y813CAAAAR101890
Controller Name : ARC-1110
===========================================
GuiErrMsg<0x00>: Success.

CLI>

Para mostrar los eventos actuales, introduzca el siguiente comando:

CLI> event info
Date-Time Device Event Type
===============================================================================
2009-07-09 07:23:14 H/W MONITOR Raid Powered On
2008-09-29 08:06:24 H/W MONITOR Raid Powered On
2008-09-29 07:51:37 H/W MONITOR Raid Powered On
...

Para mostrar información sobre el set de RAID actual (en este ejemplo 3 x 750 GB), introduzca el siguiente comando:

CLI> rsf info
# Name Disks TotalCap FreeCap DiskChannels State
===============================================================================
1 Raid Set # 00 3 2250.5GB 0.0GB 123 Normal
===============================================================================
GuiErrMsg<0x00>: Success.

CLI>

Para mostrar información sobre los volúmenes lógicos del RAID, escriba el siguiente comando:

CLI> vsf info
# Name Raid# Level Capacity Ch/Id/Lun State
===============================================================================
1 ARC-1110-VOL#00 1 Raid5 1500.3GB 00/00/00 Normal
===============================================================================
GuiErrMsg<0x00>: Success.

CLI>

Si quiere realizar cambios en el hardware RAID con el controlador del RAID de Areca, necesita introducir una contraseña. La contraseña predeterminada es "0000". Ejemplo:

<CLI> set password=0000. 
Guía de uso de Areca

Si necesita más información acerca de la instalación, configuración o aplicación de Areca, consulte su guía de uso:

Guía de uso de Areca

Pasos necesarios después de reemplazar un disco duro

Por regla general, cada vez que se sustituye un disco duro defectuoso, la reconstrucción del sistema de RAID empieza automáticamente. Sin embargo, le recomendamos que supervise esta reconstrucción para garantizar la funcionalidad del sistema de RAID.