A menudo surge la necesidad de consultar o incluso restaurar páginas web antiguas. Gracias a he­rra­mie­n­tas como la Wayback Machine, la caché de Google o WebCite, puedes buscar páginas web antiguas, acceder a versiones an­te­rio­res de una página o recuperar una versión antigua de una web, como por ejemplo la página de inicio original.

Crear una página web
Estás de suerte, tu página web ahora con IA
  • Creador de páginas web rápido e intuitivo
  • Imágenes y textos in­s­ta­n­tá­neos con SEO op­ti­mi­za­do por IA
  • Dominio, SSL y buzón de correo ele­c­tró­ni­co incluidos

¿Por qué puede ser útil ver versiones antiguas de una web?

  • Páginas fuera de línea: los problemas técnicos o la ca­n­ce­la­ción de servicios de alo­ja­mie­n­to pueden hacer que ciertos co­n­te­ni­dos des­apa­re­z­can. Gracias a los archivos web, es posible consultar las versiones an­te­rio­res de una web incluso cuando la página original ya no está di­s­po­ni­ble.
  • In­ve­s­ti­ga­ción y ve­ri­fi­ca­ción de fuentes: pe­rio­di­s­tas, blogueros y expertos pueden buscar páginas web antiguas, comparar versiones an­te­rio­res y citarlas de forma ve­ri­fi­ca­ble en sus trabajos.
  • Pro­pó­si­tos SEO: los co­n­te­ni­dos ar­chi­va­dos permiten ver versiones antiguas de una web, analizar enlaces, do­cu­me­n­tar cambios y apro­ve­char el potencial de enlace de dominios antiguos.
  • Pruebas y fines legales: las capturas o versiones ar­chi­va­das pueden servir como evidencia en casos de di­fa­ma­ción, amenazas o disputas laborales.

El proyecto Internet Archive: ver páginas web antiguas y mucho más

Internet Archive es un proyecto sin ánimo de lucro creado por Brewster Kahle que conserva co­n­te­ni­dos digitales desde 1996. Su he­rra­mie­n­ta principal es la Wayback Machine, con la que puedes ver páginas web antiguas, consultar capturas hi­s­tó­ri­cas de páginas, textos, imágenes o vídeos. Algunas de las páginas web más antiguas al­ma­ce­na­das datan de 1996, y hoy la Wayback Machine cuenta con más de 300 000 millones de páginas ar­chi­va­das, lo que te permite buscar páginas web antiguas y ver la versión antigua de una web con facilidad.

Además de páginas web, Internet Archive también recopila:

  • Textos y libros
  • Gra­ba­cio­nes de audio, incluidos co­n­cie­r­tos en directo
  • Vídeos y programas de te­le­vi­sión
  • Imágenes
  • Programas y apli­ca­cio­nes de software

Los co­n­te­ni­dos proceden del dominio público o son aportados por los propios titulares de derechos. Gran parte del material proviene de uni­ve­r­si­da­des, in­s­ti­tu­cio­nes públicas y proyectos de di­gi­ta­li­za­ción como Project Gutenberg y LibriVox.

Tutorial de Wayback Machine: cómo ver y archivar páginas web antiguas

Si has perdido co­n­te­ni­dos de tu página web o quieres ver versiones antiguas de una web, la Wayback Machine puede ayudarte. En solo unos pasos podrás buscar páginas web antiguas, consultar versiones an­te­rio­res e incluso archivar tus propias páginas para co­n­se­r­var­las.

Paso 1: introduce la URL di­re­c­ta­me­n­te

Escribe el dominio que quieras consultar en la barra de búsqueda superior y pulsa Enter para acceder a los re­su­l­ta­dos. Allí podrás ver todas las versiones ar­chi­va­das di­s­po­ni­bles de esa página web.

Imagen: Función de la barra de búsqueda de la Wayback Machine
Si­m­ple­me­n­te escribe la URL de la página web que buscas en la barra de búsqueda.

Paso 2: accede a la página principal de Wayback Machine

Haz clic en el icono web amarillo para ir a la página principal. Desde allí, introduce la URL del dominio que quieras consultar y se­le­c­cio­na “Browse History” para ver páginas web antiguas y acceder a las versiones ar­chi­va­das di­s­po­ni­bles.

Imagen: Archivo de Wayback Machine
Navega por el archivo de la Wayback Machine.

Paso 3: busca usando palabras clave

Introduce el término de búsqueda en la barra de búsqueda inferior y se­le­c­cio­na “search archived web sites”. Luego haz clic en “Go” para ver una lista de re­su­l­ta­dos con el dominio, una breve de­s­cri­p­ción, los snapshots (versiones ar­chi­va­das) di­s­po­ni­bles y las gra­ba­cio­nes de medios asociadas.

Imagen: Búsqueda por palabras clave
Elige aquí los criterios para buscar una página web.
Hecho

Un snapshot es una in­s­ta­n­tá­nea de una página web. Los elementos dinámicos como los fo­r­mu­la­rios no funcionan en ella, pero los co­n­te­ni­dos se pueden leer o copiar.

Paso 4: usa la línea de tiempo y las capturas (snapshots)

Para cada URL archivada, la Wayback Machine muestra una línea de tiempo con columnas que indican cuántas capturas se rea­li­za­ron en cada fecha. En la vista de ca­le­n­da­rio, los snapshots aparecen marcados con distintos colores:

  • Azul: rastreo exitoso
  • Verde: re­di­re­c­cio­nes
  • Naranja: URL no en­co­n­tra­da (4xx)
  • Rojo: error del servidor (5xx)

Cómo usar la línea de tiempo:

  1. Haz clic en una fecha resaltada en color.
  2. Elige la marca de tiempo que te interese para ver la versión archivada de la página web.
  3. Explora la página como no­r­ma­l­me­n­te lo harías y copia los co­n­te­ni­dos que necesites.
Imagen: Ejemplo del calendario de una página web en la Wayback Machine
Los círculos verdes y ana­ra­n­ja­dos indican que los ra­s­trea­do­res re­gi­s­tra­ron al menos un intento de re­di­re­c­ción o que no en­co­n­tra­ron la URL, aunque esto no aplica a todos los intentos de ese día.

Paso 5: archiva tu propia página web (self-snapshot)

No todas las páginas web se guardan de forma au­to­má­ti­ca. Las razones pueden ser:

  • Una etiqueta noindex o una entrada es­pe­cí­fi­ca en el robots.txt impiden la in­de­xa­ción
  • Los co­n­te­ni­dos están pro­te­gi­dos por co­n­tra­se­ña
  • La página ha sido eliminada ma­nua­l­me­n­te del archivo
  • Los co­n­te­ni­dos dinámicos no se capturan co­rre­c­ta­me­n­te

Cómo guardar tu página web:

  1. Ve a la página principal de la Wayback Machine.
  2. En el campo “Save Page Now”, introduce la URL o dominio que quieras archivar.
Imagen: Guardar tu propia página web
Introduce aquí tu dominio para guardar la página web.
  1. En pocos segundos, Wayback Machine genera un snapshot que se guarda de forma pe­r­ma­ne­n­te. De este modo, podrás ver páginas web antiguas incluso si la versión en línea deja de estar di­s­po­ni­ble más adelante.
Consejo

En el caso de páginas menos conocidas o locales, merece la pena crear tus propios snapshots con re­gu­la­ri­dad.

¿Cómo descargar páginas web antiguas?

Si necesitas acceder al código fuente, los enlaces o realizar pruebas SEO, existen varias he­rra­mie­n­tas útiles para descargar páginas web antiguas:

  • Wayback Machine Do­w­n­loa­der (GitHub, código abierto): descarga archivos HTML, medios y páginas de índice.
  • Ar­chi­va­rix (versión en línea): gratuita para páginas web con hasta 200 archivos, ofrece la descarga en formato ZIP tras el registro.
  • HTTrack Website Copier: he­rra­mie­n­ta clásica para descargar páginas web completas (también páginas ar­chi­va­das, si indicas las URL de Wayback).

Ten en cuenta que Archive.org no ofrece su propio de­s­ca­r­ga­dor de páginas web, aunque sí permite descargar textos, imágenes y archivos de audio siempre que tengas los derechos co­rre­s­po­n­die­n­tes.

Al­te­r­na­ti­va 1: busca páginas web no tan antiguas con la caché de Google

Si la in­fo­r­ma­ción que necesitas todavía es re­la­ti­va­me­n­te reciente, una simple búsqueda en Google puede bastar. Los ra­s­trea­do­res de Google recopilan y almacenan páginas web de manera similar a la Wayback Machine, creando un snapshot en la caché que muestra la última versión indexada de una página. Si la página original deja de estar di­s­po­ni­ble te­m­po­ra­l­me­n­te, puedes seguir ac­ce­die­n­do a esa versión en caché. En co­m­pa­ra­ción con archive.org, este snapshot suele ser más reciente, aunque solo se conserva una versión por fecha (marca de tiempo).

Para acceder a la versión en caché de una página, escribe el siguiente comando en la barra de di­re­c­cio­nes de tu navegador:

http://webcache.googleusercontent.com/search?q=cache:https://www.DOMINIO.com

Sustituye DOMINIO.com por la URL que quieras consultar. Ten en cuenta que las versiones en caché de Google no suelen incluir elementos dinámicos ni co­n­te­ni­dos mu­l­ti­me­dia.

Consejo

Incluso si una página está co­n­fi­gu­ra­da como noindex y no aparece en los re­su­l­ta­dos de búsqueda, la caché de Google a veces puede mostrar una versión anterior.

Al­te­r­na­ti­va 2: accede a páginas web ya ar­chi­va­das con WebCite

La he­rra­mie­n­ta WebCite permite acceder a páginas web ya ar­chi­va­das y citarlas como fuente. Sin embargo, ac­tua­l­me­n­te no admite nuevas so­li­ci­tu­des de archivado. Aun así, los snapshots exi­s­te­n­tes pueden seguir co­n­su­l­tá­n­do­se y uti­li­zá­n­do­se como re­fe­re­n­cia. Gracias a ello, es posible buscar páginas web antiguas y recuperar versiones an­te­rio­res de páginas web.

Para acceder a una versión archivada, entra en la página web de WebCite y usa la función de búsqueda para in­tro­du­cir el dominio o el ID del snapshot. De este modo podrás ver la versión antigua de una web que ya haya sido archivada y citarla como fuente estable e inal­te­ra­ble.

Imagen: Captura de la función de búsqueda de WebCite
Introduce en el campo de búsqueda la URL del dominio que buscas.
Ir al menú principal