Monitorizar y reconstruir un hardware RAID (Windows)

Para servidores dedicados y servidores dedicados especiales

En este artículo le explicamos cómo monitorizar el estado de su hardware RAID y cómo reconocer un RAID defectuoso.

Identificar el controlador de hardware

En los servidores raíz de IONOS se utilizan controladores de hardware de 3wareAreca, Adaptec, Broadcom o Dell.

Puede comprobar qué controlador está instalado en su servidor en el Administrador de dispositivos de Windows en la sección Controlador de memoria. Para abrir el administrador de dispositivos, introduzca en el buscador de la barra de tareas "administrador de dispositivos" y haga clic para abrirlo.

Controladores del RAID: programas

Los programas de software que se encargan de la gestión de los controladores del RAID están instalados de manera predeterminada. Si lo necesita, puede descargar el software necesario para su controlador a continuación: 

Adaptec:

https://storage.microsemi.com/en-us/downloads/

Broadcom:

https://www.broadcom.com/support/download-search

Dell:

https://www.dell.com/support/home/es-es?app=products

3ware:

https://www.broadcom.com/support/knowledgebase/1211161499498/operating-systems-supported-for-the-lsi-3ware-and-megaraid-contr

Areca:

https://www.areca.com.tw/support/downloads.html

Comprobar el estado del RAID

Adaptec

El controlador de red de Adaptec se gestiona con la herramienta de línea de comandos arcconf. Los siguientes comandos hacen que se muestre infomación detallada acerca del controlador de RAID de Adaptec y de la configuración:

COMANDO EXPLICLACIÓN
arcconf GETCONFIG 1 Con este comando se muestra información acerca del controlador del RAID, de la configuración, de las matrices del RAID, así como de los discos duros disponibles y su estado actual.
arcconf getconfig 1 PD Con este comando se muestra información acerca de los discos duros existentes.
arcconf getlogs controller-number device ¦ dead ¦ event [clear ¦ tabular] Con este comando se muestran las entradas de logs. Puede introducir los siguientes parámetros para especificar el tipo de entradas que se muestran:
Ejemplo: arcconf getlogs 1 device tabular DEVICE: Muestra todas las entradas de logs con errores que el controlador ha podido encontrar en los dispositivos vinculados.
  DEAD: Muestra todas las entradas de logs en los que se registró una avería de los dispositivos o discos duros.
  EVENT: Muestra todas las entradas de logs con información sobre acontecimientos especiales (p.ej. rebuilds, LDMs, etc.)
  También puede utilizar los siguientes parámetros:
  tabular: Muestra el log en formato tabla.
  clear: Elimina el protocolo del controlador asignado.
arcconf getlogs controller-number device ¦ dead ¦ event [clear ¦ tabular] >NOMBRE_DEL_ARCHIVO.log Con este comando se escriben las entradas de logs en un archivo.
Ejemplo: arcconf getlogs 1 device tabular > device.log  

Podrá encontrar más información al respecto aquí:

User's Guide ARCCONF Command Line Utility 

Broadcom

El controlador de RAID de Broadcom se gestiona y controla con la herramienta de línea de comandos StorCLI. Con los siguientes comandos puede hacer que se muestre información detallada acerca del controlador de RAID Broadcom y de la configuración:

COMANDO EXPLICACIÓN
storcli64 /c0 show all Con este comando se muestra información acerca del controlador del RAID y de la configuración.
storcli64 /c0/eall/sall show Con este comando se muestra información acerca de los discos duros existentes.
storcli64 /c0/eALL/sALL show all Con este comando se muestra información acerca de los discos duros disponibles y su estado acutal (número de serie, temperatura, etc.).
storcli /cx show eventloginfo Con este comando se muestran las entradas de logs.

Podrá encontrar más información al respecto aquí:

12Gb/s MegaRAID Tri-Mode StorCLI User Guide

Dell

El controlador del RAID de Dell se gestiona con la interfaz de línea de comandos PERCCLI. Con los siguientes comandos puede hacer que se muestre información detallada acerca del controlador de RAID de Dell y de la configuración:

COMANDO EXPLICACIÓN
perccli64 /c0/e32/s0 show all Con este comando se muestra información del disco duro 0.
perccli64 /c0/e32/s1 show all Con este comando se muestra información del disco duro 1.
perccli64 /c0 show Con este comando se muestra información acerca de los discos duros existentes.
perccli /c0 show eventloginfo Con este comando se muestran las entradas de logs para el controlador 0.

Podrá encontrar más información al respecto aquí:

Dell EMC PowerEdge RAID Controller CLI Reference Guide

3ware

El controlador del RAID 3ware se gestiona con la interfaz de línea de comandos 3ware Storage Controller Management Command Line Interface. Para abrir la interfaz de línea de comandos, introduzca el comando tw_cli. Con el comando help se muestran todos los comandos disponibles.

Nota

Si la interfaz de línea de comandos 3ware Storage Controller Management Command Line Interface no estuviera disponible en su servidor, puede descargarla aquí:

Descargar 3ware Storage Controller Management Command Line Interface

# tw_cli
//XXX> help

Copyright(c) 2012 LSI

LSI/3ware CLI (version 2.00.11.022)


Commands Description
-------------------------------------------------------------------
focus Changes from one object to another. For Interactive Mode Only!
show Displays information about controller(s), unit(s) and port(s).
flush Flush write cache data to units in the system.
rescan Rescan all empty ports for new unit(s) and disk(s).
update Update controller firmware from an image file.
commit Commit dirty DCB to storage on controller(s). (Windows only)
/cx Controller specific commands.
/cx/ux Unit specific commands.
/cx/px Port specific commands.
/cx/phyx Phy specific commands.
/cx/bbu BBU specific commands. (9000 series)
/cx/ex Enclosure specific commands. (9690SA, 9750)
/ex Enclosure specific commands. (9550SX/9650SE)


Certain commands are qualified with constraints of controller type/model support.
Please consult the twi_cli documentation for explanation of the controller-qualifiers.

Type help <command> to get more details about a particular command.
For more detail information see twi_cli's documentation.

//XXX>

El comando info muestra información sobre el RAID y su estado actual. En este ejemplo, se trata de un RAID5 con una capacidad de 1,36 TB, que consta de 3 discos duros.

//XXXX> info

Ctl Model Ports Drives Units NotOpt RRate VRate BBU
------------------------------------------------------------------------
c0 9750-4i 3 3 1 0 2 1 -

//XXXX> info c0

Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
-----------------------------------------------------------------------------
u0 RAID-5 OK - - 256K 2793.95 RIW ON

VPort Status Unit Size Type Phy Encl-Slot Model
-------------------------------------------------------------------------------
p0 OK u0 1.36 TB SATA 0 ST1500L003-9VT16L
p1 OK u0 1.36 TB SATA 0 ST1500L003-9VT16L
p2 OK u0 1.36 TB SATA 0 ST1500L003-9VT16L

El comando show alarms muestra los mensajes de alarma del controlador del hardware RAID.

//XXXX> show alarms

Ctl Date Severity AEN Message
------------------------------------------------------------------------------
c0 [Wed Feb 01 2014 03:25:11] INFO Rebuild startet: unit=0
c0 [Wed Feb 01 2014 08:13:31] INFO Rebuild completed: unit=0
c0 [Wed Feb 01 2014 08:14:13] INFO Initialize started: unit=0
c0 [Wed Feb 01 2014 08:14:13] INFO Initialize completed: unit=0

En caso de error, la salida se vería así. Aquí el tercer disco (unit=0, vport 2) falló:

//XXXX> show alarms

Ctl Date Severity AEN Message
------------------------------------------------------------------------------
c0 [Wed Feb 02 2014 08:22:10] INFO Rebuild started: unit=0
c0 [Wed Feb 02 2014 08:14:13] ERROR Unit degraded: unit=0, vport 2

Para eliminar el disco duro defectuoso del tercer puerto (p2) del RAID, introduzca el siguiente comando maint remove c0 p2:

//XXXX> maint remove c0 p2
Removing port /c0/p2 ... Done.

Después de reemplazar el disco defectuoso, es necesario que el controlador reconozca el disco nuevo. Para ello, introduzca el siguiente comando:

//XXXX> maint rescan
Rescanning controller /c0 for units and drives ...Done.
Found the following unit(s): [none].
Found the following drive(s): [/c0/p2].

Para conectar un disco duro al tercer puerto y reconstruirlo, introduzca el siguiente comando:

//XXXX> maint rebuild c0 u0 p2
Sending rebuild start request to /c0/u0 on 1 disk(s) [2] ... Done.

Introduzca el siguiente comando para que se muestre información para reconstruir el RAID:

//XXXX> info c0

Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
------------------------------------------------------------------------------------
u0 RAID-5 REBUILDING 0 - 256k 232.885 RiW ON

Port Status Unit Size Type Phy Encl-Slot Model
------------------------------------------------------------------------------------
p0 OK u0 1.36 TB SATA 0 - ST1500L003-9VT16L
p1 OK u0 1.36 TB SATA 0 - ST1500L003-9VT16L
p2 DEGRADED u0 1.36 TB SATA 1 - ST1500L003-9VT16L
Monitorizar el controlador del RAID con el software 3ware Disk Manager 2

3ware ofrece un software para monitorizar y gestionar su controlador del RAID. Puede descargarse este software aquí:

Descargar 3ware Disk Manager 2

Guía de uso de 3ware

Si necesita más información acerca de la instalación, configuración o aplicación de 3ware, consulte su guía de uso:

Guía de uso de 3ware

Areca

Descargue la Windows - CLI utility y ejecútela en su servidor.

Puede descargar el manual completo de CLI de Areca aquí: Manual de CLI de Areca.

En el siguiente ejemplo se muestran algunos comandos:

Copyright (c) 2004 Areca, Inc. All Rights Reserved.
Areca CLI, Version: 1.71.240( Windows )


Controllers List
----------------------------------------
Controller#01(PCI): ARC-1110
Current Controller: Controller#01
----------------------------------------

CMD Description
==========================================================
main Show Command Categories.
set General Settings.
rsf RaidSet Functions.
vsf VolumeSet Functions.
disk Physical Drive Functions.
sys System Functions.
net Ethernet Functions.
event Event Functions.
hw Hardware Monitor Information.
exit Exit CLI.
==========================================================
Command Format: <CMD> [Sub-Command] [Parameters].
Note: Use <CMD> -h or -help to get details.
CLI>

Con el comando <cmd> info se puede consultar la información del sistema. El comando hw info hace que se muestre la información del monitor (hardware).

CLI> hw info
The Hardware Monitor Information
===========================================
Fan#1 Speed (RPM) : 2673
HDD #1 Temp. : 48
HDD #2 Temp. : 47
HDD #3 Temp. : 51
HDD #4 Temp. : 0
===========================================
GuiErrMsg<0x00>: Success.

CLI>

Para mostrar información sobre los discos duros, introduzca el siguiente comando:

CLI> disk info
# ModelName Serial# FirmRev Capacity State
===============================================================================
1 ST3750640AS 5QD5G7Z1 3.AAK 750.2GB RaidSet Member(1)
2 ST3750640AS 5QD5G6JR 3.AAK 750.2GB RaidSet Member(1)
3 ST3750640AS 5QD5G7XQ 3.AAK 750.2GB RaidSet Member(1)
===============================================================================
GuiErrMsg<0x00>: Success.

CLI>

El siguiente comando proporciona información sobre el propio controlador:

CLI> sys info
The System Information
===========================================
Main Processor : 500MHz
CPU ICache Size : 32KB
CPU DCache Size : 32KB
System Memory : 256MB/333MHz
Firmware Version : V1.43 2007-4-17
BOOT ROM Version : V1.43 2007-4-17
Serial Number : Y813CAAAAR101890
Controller Name : ARC-1110
===========================================
GuiErrMsg<0x00>: Success.

CLI>

Para mostrar los eventos actuales, introduzca el siguiente comando:

CLI> event info
Date-Time Device Event Type
===============================================================================
2013-07-09 07:23:14 H/W MONITOR Raid Powered On
2013-09-29 08:06:24 H/W MONITOR Raid Powered On
2013-09-29 07:51:37 H/W MONITOR Raid Powered On
...

Para mostrar información sobre el set de RAID actual (en este ejemplo 3 x 750 GB), introduzca el siguiente comando:

CLI> rsf info
 #  Name             Disks TotalCap  FreeCap DiskChannels       State
===============================================================================
 1  Raid Set # 00        3 2250.5GB    0.0GB 123                Normal
===============================================================================
GuiErrMsg<0x00>: Success.

CLI>

Para mostrar información respecto a los volúmenes lógicos del RAID, introduzca el siguiente comando:

CLI> vsf info
# Name Raid# Level Capacity Ch/Id/Lun State
===============================================================================
1 ARC-1110-VOL#00 1 Raid5 1500.3GB 00/00/00 Normal
===============================================================================
GuiErrMsg<0x00>: Success.

CLI>
Guía de uso de Areca

Si necesita más información acerca de la instalación, configuración o aplicación de Areca, consulte su guía de uso:

Guía de uso de Areca

Pasos necesarios tras sustituir un disco duro

Por regla general, cada vez que se sustituye un disco duro defectuoso, la reconstrucción del sistema de RAID empieza automáticamente. Sin embargo, le recomendamos que supervise esta reconstrucción para garantizar la funcionalidad del sistema de RAID.