Monitorizar y reconstruir hardware RAID (Windows)

Información válida para Servidor Dedicado Windows con hardware RAID

Aquí aprenderá cómo comprobar el estado de los hardware RAID y cómo reconstruirlos si es necesario después de un cambio de disco duro.

A tener en cuenta: Los valores mostrados en este artículo son ejemplares y pueden diferir de su RAID.

Identificar el controlador de hardware

En los servidores raíz de IONOS se utilizan dos tipos de controladores de hardware: LSI 3ware y Areca.

Puede comprobar qué controlador está instalado en su servidor en el Administrador de dispositivos de Windows en la sección Controlador de memoria.

LSI 3ware RAID

tw_cli

Descargue la 3ware Command Line Interface (tw_cli) y ejecútela en su servidor. Por favor, en el enlace, busque "CLI" en la página del proveedor y seleccione "Software" en la página de resultados de búsqueda.

El comando help le devuelve todos los comandos disponibles:

# tw_cli
//XXX> help

Copyright(c) 2012 LSI

LSI/3ware CLI (version 2.00.11.022)


Commands Description
-------------------------------------------------------------------
focus Changes from one object to another. For Interactive Mode Only!
show Displays information about controller(s), unit(s) and port(s).
flush Flush write cache data to units in the system.
rescan Rescan all empty ports for new unit(s) and disk(s).
update Update controller firmware from an image file.
commit Commit dirty DCB to storage on controller(s). (Windows only)
/cx Controller specific commands.
/cx/ux Unit specific commands.
/cx/px Port specific commands.
/cx/phyx Phy specific commands.
/cx/bbu BBU specific commands. (9000 series)
/cx/ex Enclosure specific commands. (9690SA, 9750)
/ex Enclosure specific commands. (9550SX/9650SE)


Certain commands are qualified with constraints of controller type/model support.
Please consult the twi_cli documentation for explanation of the controller-qualifiers.

Type help <command> to get more details about a particular command.
For more detail information see twi_cli's documentation.

//XXX>

info muestra información sobre el RAID y su estado actual. Se trata de un RAID5 con una capacidad de 1,36 TB, que consta de 3 discos duros.

//XXXX> info

Ctl Model Ports Drives Units NotOpt RRate VRate BBU
------------------------------------------------------------------------
c0 9750-4i 3 3 1 0 2 1 -

//XXXX> info c0

Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
-----------------------------------------------------------------------------
u0 RAID-5 OK - - 256K 2793.95 RIW ON

VPort Status Unit Size Type Phy Encl-Slot Model
-------------------------------------------------------------------------------
p0 OK u0 1.36 TB SATA 0 ST1500L003-9VT16L
p1 OK u0 1.36 TB SATA 0 ST1500L003-9VT16L
p2 OK u0 1.36 TB SATA 0 ST1500L003-9VT16L

show alarms muestra los últimos mensajes de alarma:

//XXXX> show alarms

Ctl Date Severity AEN Message
------------------------------------------------------------------------------
c0 [Wed Feb 01 2014 03:25:11] INFO Rebuild startet: unit=0
c0 [Wed Feb 01 2014 08:13:31] INFO Rebuild completed: unit=0
c0 [Wed Feb 01 2014 08:14:13] INFO Initialize started: unit=0
c0 [Wed Feb 01 2014 08:14:13] INFO Initialize completed: unit=0

En caso de error, la salida se vería así. Aquí el tercer disco (unit=0, vport 2) falló:

//XXXX> show alarms

Ctl Date Severity AEN Message
------------------------------------------------------------------------------
c0 [Wed Feb 02 2014 08:22:10] INFO Rebuild started: unit=0
c0 [Wed Feb 02 2014 08:14:13] ERROR Unit degraded: unit=0, vport 2

maint remove c0 p2 elimina el disco duro defectuoso en el tercer puerto (p2) del RAID:

//XXXX> maint remove c0 p2
Removing port /c0/p2 ... Done.

Después de reemplazar el disco defectuoso, es necesario realizar maint rescan para que el controlador reconozca el disco nuevo:

//XXXX> maint rescan
Rescanning controller /c0 for units and drives ...Done.
Found the following unit(s): [none].
Found the following drive(s): [/c0/p2].

El disco puede entonces ser conectado al tercer puerto y reconstruido con maint rebuild c0 u0 p2:

//XXXX> maint rebuild c0 u0 p2
Sending rebuild start request to /c0/u0 on 1 disk(s) [2] ... Done.

info c0 muestra el estado de la reconstrucción:

//XXXX> info c0

Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
------------------------------------------------------------------------------------
u0 RAID-5 REBUILDING 0 - 256k 232.885 RiW ON

Port Status Unit Size Type Phy Encl-Slot Model
------------------------------------------------------------------------------------
p0 OK u0 1.36 TB SATA 0 - ST1500L003-9VT16L
p1 OK u0 1.36 TB SATA 0 - ST1500L003-9VT16L
p2 DEGRADED u0 1.36 TB SATA 1 - ST1500L003-9VT16L
3dm2 (3ware Drive Manager)

Consulte la documentación de 3ware para obtener más información sobre la instalación, configuración y el uso.

Areca RAID

Descargue la Windows - CLI utility y ejecútela en su servidor.

Puede descargar el manual completo de CLI de Areca en http://areca.starline.de/RaidCards/Documents/Manual_Spec/Software/.

En el siguiente ejemplo se muestran algunos comandos:

Copyright (c) 2004 Areca, Inc. All Rights Reserved.
Areca CLI, Version: 1.71.240( Windows )


Controllers List
----------------------------------------
Controller#01(PCI): ARC-1110
Current Controller: Controller#01
----------------------------------------

CMD Description
==========================================================
main Show Command Categories.
set General Settings.
rsf RaidSet Functions.
vsf VolumeSet Functions.
disk Physical Drive Functions.
sys System Functions.
net Ethernet Functions.
event Event Functions.
hw Hardware Monitor Information.
exit Exit CLI.
==========================================================
Command Format: <CMD> [Sub-Command] [Parameters].
Note: Use <CMD> -h or -help to get details.
CLI>

Con el comando <cmd> información se puede consultar la información del sistema, por ejemplo, la información del monitor de hardware (temperatura):

CLI> hw info
The Hardware Monitor Information
===========================================
Fan#1 Speed (RPM) : 2673
HDD #1 Temp. : 48
HDD #2 Temp. : 47
HDD #3 Temp. : 51
HDD #4 Temp. : 0
===========================================
GuiErrMsg<0x00>: Success.

CLI>

disk info muestrainformación sobre los discos duros:

CLI> disk info
# ModelName Serial# FirmRev Capacity State
===============================================================================
1 ST3750640AS 5QD5G7Z1 3.AAK 750.2GB RaidSet Member(1)
2 ST3750640AS 5QD5G6JR 3.AAK 750.2GB RaidSet Member(1)
3 ST3750640AS 5QD5G7XQ 3.AAK 750.2GB RaidSet Member(1)
===============================================================================
GuiErrMsg<0x00>: Success.

CLI>

sys info proporciona información sobre el propio controlador:

CLI> sys info
The System Information
===========================================
Main Processor : 500MHz
CPU ICache Size : 32KB
CPU DCache Size : 32KB
System Memory : 256MB/333MHz
Firmware Version : V1.43 2007-4-17
BOOT ROM Version : V1.43 2007-4-17
Serial Number : Y813CAAAAR101890
Controller Name : ARC-1110
===========================================
GuiErrMsg<0x00>: Success.

CLI>

event info muestra los eventos actuales:

CLI> event info
Date-Time Device Event Type
===============================================================================
2013-07-09 07:23:14 H/W MONITOR Raid Powered On
2013-09-29 08:06:24 H/W MONITOR Raid Powered On
2013-09-29 07:51:37 H/W MONITOR Raid Powered On
...

rsf info muestra información sobre el set de raid actual (en este ejemplo están instalados 3*750 GB):

CLI> rsf info
 #  Name             Disks TotalCap  FreeCap DiskChannels       State
===============================================================================
 1  Raid Set # 00        3 2250.5GB    0.0GB 123                Normal
===============================================================================
GuiErrMsg<0x00>: Success.

CLI>

vsf info devuelve información sobre los volúmenes RAID lógicos:

CLI> vsf info
# Name Raid# Level Capacity Ch/Id/Lun State
===============================================================================
1 ARC-1110-VOL#00 1 Raid5 1500.3GB 00/00/00 Normal
===============================================================================
GuiErrMsg<0x00>: Success.

CLI>

Reconstruir un RAID defectuoso en un controlador Areca

Un RAID defectuoso podría verse así:

CLI> rsf info
# Name Disks TotalCap FreeCap DiskChannels State
===============================================================================
1 Raid Set # 00 3 2250.5GB 0.0GB 1x3 Degrade
2 Raid Set # 00 3 2250.5GB 2250.5GB x2x Incompleted
===============================================================================
GuiErrMsg<0x00>: Success.

El Raid Set 2 tiene el estado Incompleted.

La contraseña del controlador debe ser introducida para que pueda realizar cambios en la configuración. La contraseña predeterminada es 0000:

<CLI> set password=0000. 

El set de RAID con el estado Incompleted debe borrarse. En este ejemplo es el RAID 2 que se elimina con el comando rsf delete raid=2:

CLI> rsf delete raid=2
GuiErrMsg<0x00>: Success.
CLI> rsf info
# Name Disks TotalCap FreeCap DiskChannels State
===============================================================================
1 Raid Set # 00 3 2250.5GB 0.0GB 1x3 Degrade
===============================================================================
GuiErrMsg<0x00>: Success.

Después puede usar rsf createhs drv=2 para montar el disco como Hot Spare de nuevo:

CLI> rsf createhs drv=2
GuiErrMsg<0x00>: Success.

El controlador Areca detecta automáticamente un nuevo disco. Por lo tanto, no es necesario iniciar una reconstrucción.

La reconstrucción se inicia automáticamente y puede ser monitoreada:

CLI> rsf info
# Name Disks TotalCap FreeCap DiskChannels State
===============================================================================
1 Raid Set # 00 3 2250.5GB 0.0GB 123 Rebuilding
===============================================================================

GuiErrMsg<0x00>: Success.