Usar el sistema de rescate de Linux

Para servidores dedicados y servidores dedicados especiales

En este artículo le explicamos cómo utilizar el sistema de rescate de su servidor dedicado.

El sistema de rescate (Rescue System) es una herramienta importante que le ayudará a diagnosticar y reparar la instalación del sistema.

Nota

Si ha comprado un Servidor Dedicado administrado a través del Cloud Panel, consulte los siguientes artículos para obtener información sobre el sistema de rescate de Linux de su servidor:

Arrancar un servidor dedicado en el sistema de rescate de Linux

Arrancar el servidor dedicado en el sistema de recuperación de Windows

Usar el sistema de rescate de Linux (hardware RAID)

Usar el sistema de rescate de Windows en servidores dedicados (adquiridos a partir del 28/10/2018)

Información importante sobre los sistemas de rescate disponibles

Los siguientes sistemas de rescate están disponibles para los Servidores Dedicados adquiridos en el marco del programa de Servidores a precios especiales:

  • Sistema de rescate mínimo (minidistribución) de 64 bits de Linux (debian/stable)

  • Sistema de rescate de 64 bits de Linux (debian/oldstable)

  • Sistema de rescate de 64 bits de Linux (debian/estable)


Sistema de rescate

Con el sistema de rescate le será posible, entre otras cosas:

  • hacer una copia de seguridad de los datos de su servidor

  • reparar un sistema de archivos dañado

  • acceder a los archivos de registro o archivos log, para identificar las fuentes de error

  • asignar una nueva contraseña de root

  • reparar la configuración de la red de su servidor


Sistema de rescate mínimo

El sistema de rescate mínimo de Linux (minidistribuición) no dispone de todos los programas que el sistema de rescate incluye. Por lo tanto, solo use el sistema de rescate mínimo si tiene poca RAM y ya no puede arrancar el sistema.

Nota

Si está utilizando el sistema de rescate mínimo, no podrá acceder a los comandos StorCLI, PERCCLI y ARCCONF CLI.

Arrancar el servidor en el sistema de rescate

Consulte el siguiente artículo para saber cómo arrancar su servidor en el sistema de rescate:

Arrancar un servidor Linux en el sistema de rescate

Identificar el tipo de controlador de hardware

Puede usar el programa lshw para comprobar qué controlador de hardware está instalado en su servidor. Mediante este podrá ver información detallada sobre los componentes del hardware.

Mostrar información del hardware con lshw

Para mostrar un resumen de la información del hardware, introduzca el siguiente comando:

lshw -short

Para mostrar la información del hardware como un archivo de texto, introduzca el siguiente comando:

lshw > lshw_información.txt

Controladores del RAID: programas

Los programas de software que se encargan de la gestión de los controladores del RAID están instalados de manera predeterminada. Si lo necesita, puede descargar el software necesario para su controlador a continuación: 


Adaptec

https://storage.microsemi.com/en-us/downloads


Broadcom

https://www.broadcom.com/support/download-search


Dell

https://www.dell.com/support/home/es-es?app=products


3ware

https://www.broadcom.com/support/knowledgebase/1211161499498/operating-systems-supported-for-the-lsi-3ware-and-megaraid-contr


Areca

https://www.areca.com.tw/support/downloads.html

Comprobar el estado del hardware RAID

Utilice los comandos que se indican a continuación para acceder a la información del hardware RAID y de configuración:

Adaptec
COMANDO EXPLICACIÓN
arcconf GETCONFIG 1 Con este comando se muestra información acerca del controlador del RAID, de la configuración, de las matrices del RAID, así como de los discos duros disponibles y su estado actual.
arcconf getconfig 1 PD Con este comando se muestra información acerca de los discos duros existentes.
arcconf getlogs controller-number device ¦ dead ¦ event [clear ¦ tabular] Con este comando se muestran las entradas de logs. Puede introducir los siguientes parámetros para especificar el tipo de entradas que se muestran:
Ejemplo: arcconf getlogs 1 device tabular DEVICE: Muestra todas las entradas de logs con errores que el controlador ha podido encontrar en los dispositivos vinculados.
  DEAD: Muestra todas las entradas de logs en los que se registró una avería de los dispositivos o discos duros.
  EVENT: Muestra todas las entradas de logs con información sobre acontecimientos especiales (p.ej. rebuilds, LDMs, etc.)
  También puede utilizar los siguientes parámetros:
  tabular: Muestra el log en formato tabla.
  clear: Elimina el protocolo del controlador asignado.
arcconf getlogs controller-number device ¦ dead ¦ event [clear ¦ tabular] > NOMBRE_DEL_ARCHIVO.log Con este comando se escriben las entradas de logs en un archivo.
Ejemplo: arcconf getlogs 1 device tabular > device.log  

Podrá encontrar más información al respecto aquí:

User's Guide ARCCONF Command Line Utility

Broadcom
COMANDO EXPLICACIÓN
storcli64 /c0 show all Con este comando se muestra información acerca del controlador del RAID y de la configuración.
storcli64 /c0/eall/sall show Con este comando se muestra información acerca de los discos duros existentes.
storcli64 /c0/eALL/sALL show all Con este comando se muestra información acerca de los discos duros disponibles y su estado actual (número de serie, temperatura, etc.).
storcli /cx show eventloginfo Con este comando se muestran las entradas de logs.

Podrá encontrar más información al respecto aquí:

12Gb/s MegaRAID Tri-Mode StorCLI User Guide

DELL-PERC-RAID
COMANDO EXPLICACIÓN
perccli64 /c0/e32/s0 show all Con este comando se muestra información del disco duro 0.
perccli64 /c0/e32/s1 show all Con este comando se muestra información del disco duro 1.
perccli64 /c0 show Con este comando se muestra información acerca de los discos duros existentes.
perccli /c0 show Con este comando se muestran las entradas de logs para el controlador 0.

Podrá encontrar más información relevante aquí:

Dell EMC PowerEdge RAID Controller CLI Reference Guide

3ware-RAID

Si desea obtener instrucciones sobre cómo usar tw_cli para acceder a la información del Hardware RAID y de la configuración, consulte el siguiente artículo:

Monitorizar y reconstruir un hardware RAID (Linux)

Para obtener más información sobre su instalación, configuración y aplicación, consulte la documentación de 3ware aquí:

https://www.broadcom.com/support/knowledgebase/1211161499541/lsi-3ware-user-documentation-downloads

Areca

Si desea obtener instrucciones sobre cómo utilizar la interfaz de líneas de comandos para acceder a la información del hardware RAID y de configuración, consulte el siguiente artículo:

Monitorizar y reconstruir un hardware RAID (Linux)

Podrá obtener más información sobre la interfaz de líneas de comando aquí:

https://areca.starline.de/RaidCards/Documents/Manual_Spec/Software

Comprobar el estado del software RAID

Para comprobar el estado del software RAID, introduzca el siguiente comando en el shell:

rescate:~# cat /proc/mdstat

Mostrar partición

En el sistema de rescate podrá realizar una partición del disco duro interno, comprobar el sistema de archivos y corregir ajustes incorrectos.

Para mostrar la lista de los sistemas de archivos e identificar el sistema de archivos, introduzca el comando df -h (df por sus siglas en inglés disk free). Con el parámetro -h se puede mostrar el número de bloques ocupados en forma legible por máquina, ya sea en gigas, megas o kilobytes.

rescue on 87.106.16.168:~$ df -h
Filesystem      Size  Used Avail Use% Mounted on
/dev/root       372M  356M   17M  96% /
devtmpfs         32G     0   32G   0% /dev
tmpfs            32G     0   32G   0% /dev/shm
tmpfs            32G  102M   32G   1% /run
tmpfs           5.0M     0  5.0M   0% /run/lock
tmpfs            32G     0   32G   0% /sys/fs/cgroup

Para mostrar una lista de los discos duros, particiones y volúmenes lógicos existentes, introduzca el comando fdisk -l. fdisk es un programa de líneas de comando utilizada para particionar discos, además de visualizar, crear o eliminar particiones.

rescue:~# fdisk -l

En el siguiente ejemplo se muestra información sobre la partición de un servidor con software RAID. Se ha accedido a esta información mediante el sistema de rescate.

Nota

La información puede variar dependiendo de la configuración y el modelo del servidor. 

fdisk -l
Disk /dev/sda: 250.0 GB, 250059350016 bytes
255 heads, 63 sectors/track, 30401 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes

Device Boot Start End Blocks Id System
/dev/sda1 1 123 987966 fd Linux raid autodetect
/dev/sda2 124 367 1959930 82 Linux swap / Solaris
/dev/sda4 368 30401 241248105 5 Extended
/dev/sda5 368 976 4891761 fd Linux raid autodetect
/dev/sda6 977 3409 19543041 fd Linux raid autodetect
/dev/sda7 3410 4018 4891761 fd Linux raid autodetect
/dev/sda8 4019 30401 211921416 fd Linux raid autodetect

Disk /dev/sdb: 250.0 GB, 250059350016 bytes
255 heads, 63 sectors/track, 30401 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes

Device Boot Start End Blocks Id System
/dev/sdb1 1 123 987966 fd Linux raid autodetect
/dev/sdb2 124 367 1959930 82 Linux swap / Solaris
/dev/sdb4 368 30401 241248105 5 Extended
/dev/sdb5 368 976 4891761 fd Linux raid autodetect
/dev/sdb6 977 3409 19543041 fd Linux raid autodetect
/dev/sdb7 3410 4018 4891761 fd Linux raid autodetect
/dev/sdb8 4019 30401 211921416 fd Linux raid autodetect

Disk /dev/md8: 217.0 GB, 217007456256 bytes
2 heads, 4 sectors/track, 52980336 cylinders
Units = cylinders of 8 * 512 = 4096 bytes

Disk /dev/md8 doesn't contain a valid partition table

Disk /dev/md7: 5009 MB, 5009047552 bytes
2 heads, 4 sectors/track, 1222912 cylinders
Units = cylinders of 8 * 512 = 4096 bytes

Disk /dev/md7 doesn't contain a valid partition table

Disk /dev/md6: 20.0 GB, 20012007424 bytes
2 heads, 4 sectors/track, 4885744 cylinders
Units = cylinders of 8 * 512 = 4096 bytes

Disk /dev/md6 doesn't contain a valid partition table

Disk /dev/md5: 5009 MB, 5009047552 bytes
2 heads, 4 sectors/track, 1222912 cylinders
Units = cylinders of 8 * 512 = 4096 bytes

Disk /dev/md5 doesn't contain a valid partition table

Disk /dev/md1: 1011 MB, 1011548160 bytes
2 heads, 4 sectors/track, 246960 cylinders
Units = cylinders of 8 * 512 = 4096 bytes

Disk /dev/md1 doesn't contain a valid partition table

Si no ve ningún disco duro, partición o volumen lógico después de introducir el comando fdisk -l, es posible que haya un problema con el controlador RAID, los discos duros o el cableado. En este caso, por favor contacte con el servicio de Atención al Cliente.

Comprobación del sistema de archivos

Antes de montar la partición o el volumen lógico respectivo, debe comprobar la consistencia del sistema de archivos con el File System Check (FSCK).

Advertencia

No realice una comprobación del sistema de archivos en particiones montadas y/o cifradas, ya que esto puede provocar la pérdida de datos. Si se comprueba el sistema de archivos de un volumen lógico, éste tampoco puede estar montado.

Por lo tanto, asegúrese de que la partición o el volumen lógico no esté montado o cifrado antes de comprobar el sistema de archivos con el File System Check.

Para comprobar una partición o un volumen lógico con el File System Check, introduzca el siguiente comando:

fsck -f /dev/md1

En el siguiente ejemplo, se comprueba el sistema de archivos de la partición md1. El resultado muestra que el sistema de archivos está intacto.

fsck -f /dev/md1
fsck 1.40-WIP (07-Apr-2007)
e2fsck 1.40-WIP (07-Apr-2007)
/: recovering journal
Pass 1: Checking inodes, blocks, and sizes
Pass 2: Checking directory structure
Pass 3: Checking directory connectivity
Pass 4: Checking reference counts
Pass 5: Checking group summary information

/: ***** FILE SYSTEM WAS MODIFIED *****
/: 7628/123648 files (0.5% non-contiguous), 83136/246960 blocks

Las particiones md5, md6 y md7 usan el sistema de archivos XFS, por lo que no necesitan ser revisadas. Si aún así, desea comprobar estas particiones, introduzca el siguiente comando:

rescue:~# xfs_check /dev/mdX
Ejemplo:

rescue:~# xfs_check /dev/md5


Si recibe un mensaje de error al comprobar el sistema de archivos con la función de File System Check, monte y desmonte la partición. Luego, vuelva a ejecutar la comprobación.

El siguiente es un ejemplo de un mensaje de error común que puede aparecer al realizar una comprobación:

xfs_check /dev/md5
ERROR: The filesystem has valuable metadata changes in a log which needs to
be replayed. Mount the filesystem to replay the log, and unmount it before
re-running xfs_check. If you are unable to mount the filesystem, then use
the xfs_repair -L option to destroy the log and attempt a repair.
Note that destroying the log may cause corruption -- please attempt a mount
of the filesystem before doing this.
mount /dev/md5 /mnt
umount /dev/md5
xfs_check /dev/md5

Si la comprobación del sistema de archivos no se ejecuta correctamente después de montar y desmontar la partición, se puede reparar la partición con el siguiente comando:

rescue:~# xfs_repair -L /dev/mdx

Precaución

Cuando utiliza el comando xfs_repair -L /dev/mdx para reparar la partición, es posible que se pierdan datos. Por lo tanto, siempre cree una copia de seguridad antes de reparar una partición con este comando.

Montar el disco duro interno

Proceda de la siguiente manera para montar el disco duro interno en el directorio /mnt:

rescue:/# mount /RUTA/partición /mnt

Ejemplo:

mount /dev/md1 /mnt

Nota

Es posible que las particiones o volúmenes lógicos difieran según el tipo y el modelo de servidor.

Acceder a la lista de sistemas de archivos

Para ver los sistemas de archivos disponibles, acceda a la lista fstab con el siguiente comando:

cat /mnt/etc/fstab
/dev/md1 / ext3 defaults 1 1
/dev/sda2 none swap sw
/dev/sdb2 none swap sw
/dev/vg00/usr /usr xfs defaults 0 2
/dev/vg00/var /var xfs defaults,usrquota 0 2
/dev/vg00/home /home xfs defaults,usrquota 0 2
devpts /dev/pts devpts gid=5,mode=620 0 0
none /proc proc defaults 0 0
none /tmp tmpfs defaults 0 0

Montar los sistemas de archivos

Para montar los sistemas de archivos, introduzca los siguientes comandos:

mount /dev/vg00/usr /mnt/usr
mount /dev/vg00/var /mnt/var
mount /dev/vg00/home /mnt/home
for f in proc sys dev ; do mount --bind /$f /mnt/$f ; done

A continuación cambie al sistema respectivo.

Imágenes sin LVM hasta diciembre de 2010

Si dispone de imágenes sin Logical Volume Manager (LVM) en las tarifas del servidor de hasta diciembre de 2010, debe montar el disco duro interno en el directorio /mnt y luego cambiar directamente a ese sistema:

mount /dev/md1 /mnt
mount /dev/md5 /mnt/usr
mount /dev/md6 /mnt/var
mount /dev/md7 /mnt/home

Cambiar al entorno chroot

Después de montar las particiones, use chroot para cambiar al sistema en el cual están instalados los discos duros. Para el shell y todos los programas iniciados desde él, el directorio /mnt se considera como el sistema de archivos raíz. Entonces /mnt se convierte en / después del cambio de raíz, así como /mnt/var/log se convierte en /var/log, etc. De la misma manera, algunos programas del sistema normal seguirán funcionando, ya que el punto de referencia / es el mismo que el punto de referencia del sistema normal.

Para cambiar al sistema en el cual están instalados los discos mediante chroot, introduzca el siguiente comando:

chroot /mnt

Después de haber introducido este comando, podrá acceder a su sistema para reparar y/o configurar su sistema operativo.

pwd
/
ll
total 112
drwxr-xr-x 2 root root 4096 Jun 15 17:05 bin
drwxr-xr-x 4 root root 4096 Jun 15 17:07 boot
drwxr-xr-x 10 root root 12288 Jun 15 17:05 dev
drwxr-xr-x 75 root root 4096 Jun 30 06:32 etc
drwxr-xr-x 6 root root 66 Jun 30 12:25 home
drwxr-xr-x 9 root root 4096 Jul 2 2008 lib
drwx------ 2 root root 49152 Jun 15 17:07 lost+found
drwxr-xr-x 2 root root 4096 Sep 22 2007 mnt
drwxr-xr-x 4 root root 4096 Jul 2 2008 opt
drwxr-xr-x 2 root root 4096 Jul 9 2008 proc
drwx------ 10 root root 4096 Jun 16 13:35 root
drwxr-xr-x 3 root root 4096 Jun 19 10:13 sbin
drwxr-xr-x 2 root root 4096 Jun 15 16:52 srv
drwxr-xr-x 2 root root 4096 Aug 14 2008 sys
drwxrwxrwt 2 root root 4096 Jun 15 17:07 tmp
drwxr-xr-x 12 root root 141 Jun 15 17:05 usr
drwxr-xr-x 17 root root 4096 Jun 15 17:07 var
lrwxrwxrwx 1 root root 12 Jun 15 17:05 vmlinuz -> boot/vmlinuz
lrwxrwxrwx 1 root root 16 Jun 15 17:05 vmlinuz.old -> boot/vmlinuz.old

Funcionamiento provisional de los servicios del servidor en el entorno chroot

También puede iniciar algunos servicios de servidor a través de los scripts start/stop que se encuentran en /etc/init.d/ del sistema chroot. Por ejemplo, podrá iniciar el sistema de base de datos MySQL con /etc/init.d/mysql start.

Para detener los servicios de nuevo, use stop. El siguiente ejemplo muestra cómo volver a detener el sistema de base de datos MySQL:

/etc/init.d/mysql stop

Nota

No todos los servicios de los servidores funcionan en el entorno chroot.

Atención

El sistema de rescate no sustituye a un sistema operativo en funcionamiento. Por lo tanto, inicie los servicios del servidor en el entorno chroot sólo cuando deba reparar su sistema operativo y la configuración.

Hacer una copia de seguridad

En algunos casos, se requiere una reinstalación del sistema operativo. Existen las siguientes opciones para hacer una copia de seguridad de los datos de su servidor:

  • Hacer una copia de seguridad de los datos en su ordenador local usando WinSCP.

  • Guardar los datos en otro servidor mediante Secure Copy.

  • Guardar los datos en un ordenador local utilizando Secure Copy.


Después de hacer una copia de seguridad de sus datos, podrá instalar una nueva imagen en el servidor o restaurar una copia de seguridad de su sistema. Luego podrá copiar los archivos respaldados al servidor.

Guardar datos usando WinSCP en un ordenador local con el sistema operativo Microsoft Windows

Con WinSCP es posible copiar fácilmente los datos de su servidor a un directorio de su ordenador local usando el método de arrastrar y soltar.

Puede descargar WinSCP a través de la siguiente URL:

https://winscp.net/eng/download.php

Si desea obtener instrucciones sobre cómo usar WinSCP para guardar los datos de su servidor en un ordenador local con Microsoft Windows, haga clic aquí:

Guardar una copia de seguridad en su ordenador local (servidor Linux)


Copiar datos a otro servidor con sistema operativo Linux usando Secure Copy

Secure Copy es un protocolo para la transmisión cifrada de datos basado en Secure Shell. Para copiar los datos de su servidor a otro servidor usando Secure Copy, introduzca el siguiente comando en el shell:

scp -r /RUTA/DIRECTORIO nombre_de_usuario@DIRECCIÓN_IP:/RUTA/DIRECTORIO_DESTINO


Ejemplo:

[root@localhost ~]# scp -r /mnt root@82.165.69.130:/home/backup


Guardar datos de un ordenador local con sistema operativo Linux

El siguiente comando le permite copiar un directorio ubicado en su servidor a su ordenador local:

scp usuario_remoto@IP_DEL_SERVIDOR:/DIRECTORIO_EN_EL_SERVIDOR /DIRECTORIO_LOCAL

Ejemplo:

[root@localhost ~]# scp root@217.160.44.208:/home /opt/backup
En el ejemplo anterior, el directorio /home se ha sido copiado en el directorio /opt/backup que se encuentra en su ordenador local.


Para guardar un solo archivo en su ordenadorlocal, escriba el siguiente comando:

scp usuario_remoto@IP_DEL_SERVIDOR:/remote/DIRECTORIO_EN_EL_SERVIDOR/NOMBRE_DE_ARCHIVO.txt /DIRECTORIO_LOCAL
Ejemplo:

[root@localhost ~]# scp root@217.160.44.208:/remote/home/test.txt /TEMP

El siguiente comando le permite copiar un directorio ubicado en su ordenador local a su servidor:

scp -r /DIRECTORIO_LOCAL usuario_remoto@IP_DEL_SERVIDOR:/DIRECTORIO_EN_EL_SERVIDOR

Ejemplo:

[root@localhost ~]# scp -r /home/backup root@217.160.44.208:/home

Para copiar un solo archivo, introduzca el siguiente comando:

scp -r /DIRECTORIO/NOMBRE_DE_ARCHIVO usuario_remoto@IP_DEL_SERVIDOR:/DIRECTORIO_EN_EL_SERVIDOR


Ejemplo:

[root@localhost ~]# scp -r /home/test.txt root@217.160.44:/home

Nota

Si scp no está disponible, puede instalar el programa con el siguiente comando:

CentOS

[root@localhost ~]# yum install openssh-clients
Debian / Ubuntu

[root@localhost ~]# apt - install openssh-server

Desmontar los sistemas de archivos y finalizar la sesión de mantenimiento

Una vez que haya terminado de mantener su servidor root, salga del entorno chroot y desmonte los sistemas de archivos en orden inverso.

exit
umount /mnt/home
umount /mnt/var
umount /mnt/usr
umount /mnt
Advertencia

No reinicie el sistema cuando los sistemas de archivos estén montados, ya que esto puede resultar en pérdida de datos. Por lo tanto, asegúrese de que los sistemas de archivos estén desmontados antes de realizar un reinicio.

Prueba de memoria

El Sistema de rescate también incluye el programa MemTest86. Con este programa es posible comprobar la memoria de su servidor.

Nota

El sistema de rescate se ejecuta en la memoria RAM, por lo tanto, el espacio ocupado no puede ser comprobado con MemTest86.

memtest all
[...]
_

Cambiar el modo de arranque

Asegúrese de que el modo de arranque de su servidor vuelva al modo normal. Para ello, proceda de la siguiente manera:

  • Acceda a su cuenta IONOS.
  • Haga clic en MENÚ > Servidores & Cloud.
    OpcionalSeleccione el contrato deseado.

  • En la sección Gestión del servidor, haga clic en Herramienta de Restauración.

  • En el recuadro Restauración, habilite la opción Arrancar ahora y seleccione Sistema normal en el Modo de arranque.

  • Haga clic en Siguiente.

Reiniciar el servidor

Abra el shell y reinicie el sistema. Para ello, introduzca el siguiente comando:
shutdown -rn now
Ejemplo:

[root@localhost ~]# shutdown -rn now
shutdown: sending all processes the TERM signal...
Connection to su_empresa.es closed by remote host.
$ _