No todo el contenido que existe en los sitios web y en las tiendas online está li­bre­me­n­te di­s­po­ni­ble para todos los usuarios y motores de búsqueda. Este contenido de acceso re­s­tri­n­gi­do se resume con el término “deep web”. Las razones de las re­s­tri­c­cio­nes de acceso pueden ser múltiples.

Dominios web
Compra y registra tu dominio ideal
  • Tu dominio protegido con Ce­r­ti­fi­ca­do SSL Wildcard gratis
  • Función Domain Connect para una co­n­fi­gu­ra­ción DNS si­m­pli­fi­ca­da gratis
  • Registro privado y gratis para mayor seguridad

Deep web: de­fi­ni­ción

La mayoría de la gente pro­ba­ble­me­n­te no esté muy fa­mi­lia­ri­za­da con el término “deep web”, pero es el término genérico para todo tipo de datos a los que no se puede acceder si­m­ple­me­n­te uti­li­za­n­do un motor de búsqueda o in­tro­du­cie­n­do una URL.

Se trata de una gran parte de los datos y páginas que están a tu di­s­po­si­ción en internet: por ejemplo, bases de datos de empresas, uni­ve­r­si­da­des y museos que solo pueden visitarse iniciando sesión, cuentas bancarias, cestas de la compra, cuentas de usuario de tiendas online y mucho más. En sentido estricto, la deep web también incluye la dark web, aunque estos dos tipos de co­n­te­ni­dos se di­fe­re­n­cian muy cla­ra­me­n­te.

Di­fe­re­n­cias entre deep web, dark web e internet

Vamos a comenzar con una de­fi­ni­ción clara de internet tal y como lo conocemos: todos los motores de búsqueda, sitios de noticias, tiendas online y páginas de inicio a las que podemos acceder a través de na­ve­ga­do­res como Chrome o Firefox y para los que no se requieren datos de acceso adi­cio­na­les, pe­r­te­ne­cen a la surface web (visible web, internet su­pe­r­fi­cial o web su­pe­r­fi­cial) aunque en este caso hay una tra­n­si­ción fluida o una parte del contenido que ya pertenece a la deep web desde el punto de vista de los motores de búsqueda. En los si­guie­n­tes párrafos lo ex­pli­ca­re­mos con mayor detalle.

La deep web, que re­pre­se­n­ta una parte si­g­ni­fi­ca­ti­va­me­n­te mayor del conjunto de internet, incluye todos los co­n­te­ni­dos con acceso re­s­tri­n­gi­do. Google y otros motores de búsqueda no pueden indexar estos datos.

Dentro de la deep web está la dark web. En este caso, el acceso está aún más regulado y solo es posible mediante el uso de te­c­no­lo­gías es­pe­cia­les. Debido a las li­mi­ta­cio­nes y al anonimato total de la dark web, de­s­gra­cia­da­me­n­te suele ser un imán para la actividad delictiva. En los párrafos si­guie­n­tes, usaremos el término deep web solo para re­fe­ri­r­nos a los co­n­te­ni­dos descritos en el párrafo anterior y no a los citados co­n­te­ni­dos de la dark web.

¿Por qué no se en­cue­n­tran los co­n­te­ni­dos en la deep web?

Como ya hemos descrito an­te­rio­r­me­n­te, una po­si­bi­li­dad por la que los crawlers del motor de búsqueda no en­cue­n­tran ni indexan los co­n­te­ni­dos es la re­s­tri­c­ción de acceso mediante un inicio de sesión o la solicitud de una co­n­tra­se­ña. El co­n­se­n­ti­mie­n­to a unas co­n­di­cio­nes de uso o una barrera de pago también pueden ser ob­s­tácu­los en este contexto. En todos estos casos, tú como usuario solo puedes acceder a la URL si pre­via­me­n­te has in­tro­du­ci­do una co­n­tra­se­ña o has aceptado el pago.

Pero todavía hay otro caso más en la deep web. En este sentido, puedes acceder a la página si conoces la URL, pero el crawler de un motor de búsqueda sigue sin en­co­n­trar­la ni indexarla. Hay varias causas:

Por un lado, los we­b­ma­s­te­rs pueden excluir es­pe­cí­fi­ca­me­n­te el contenido de la in­de­xa­ción uti­li­za­n­do el comando Nofollow. Por otro lado, existe la po­si­bi­li­dad de que una página esté oculta dentro de un sitio web de tal manera que el crawler no pueda en­co­n­trar­la. Para cada sitio web, el crawler solo dispone de un de­te­r­mi­na­do “pre­su­pue­s­to de páginas”; una vez que se agota, si todavía quedan páginas de un nivel inferior, estas no se tienen en cuenta. Una tercera po­si­bi­li­dad es la falta de re­qui­si­tos técnicos para la in­de­xa­ción, por ejemplo, si se utiliza Flash.

¿Qué implica el contenido de la deep web para tu sitio web?

En principio, el contenido de la deep web no implica ningún problema para ti ni para los vi­si­ta­n­tes de tu sitio web. Todo lo contrario: este tipo de páginas se en­cue­n­tran en casi todos los sitios web im­po­r­ta­n­tes o en las tiendas online y los usuarios se enfrentan a los inicios de sesión con total na­tu­ra­li­dad.

Sin embargo, donde sí influye la falta de in­de­xa­ción por parte de Google es en el tema de la op­ti­mi­za­ción de motores de búsqueda.

Es­pe­cia­l­me­n­te cuando se trata de temas cie­n­tí­fi­cos o médicos, muchos co­n­te­ni­dos re­le­va­n­tes suelen estar pro­te­gi­dos con una re­s­tri­c­ción de acceso. Sin embargo, el objetivo debe ser hacer que la mayor cantidad de contenido posible sea de libre acceso e indexable (en la medida en que las leyes y la política de la empresa lo permitan), o al menos diseñar landing pages que permitan al motor de búsqueda hacerse una idea de lo que (todavía) queda por descubrir en tu sitio web.

Ir al menú principal