El mayor inconveniente del log file analysis es que HTTP es un protocolo sin estado, lo que significa que este protocolo de transferencia, que es el responsable de la comunicación entre el servidor y el cliente, trata a cada petición de forma independiente. En consecuencia, el servidor web asigna dos instancias diferentes a dos aperturas de una página por parte de un mismo cliente, algo muy poco práctico a la hora de analizar el comportamiento general de un usuario. Para evitar esta problemática se dispone de dos soluciones:
1. Adjudicar un identificador de sesión (Session ID): este consiste en un número generado en el servidor que se almacena en el navegador del usuario, de tal forma que señaliza todas las peticiones al servidor que se realizan desde este navegador y permite recogerlas agrupadas en una sola sesión. Se puede asignar de dos formas:
- Puede usarse una cookie que se almacena en el cliente con la primera solicitud y que se transmite con cada contacto posterior al servidor. Sin embargo, como las cookies no son visibles en los archivos de registro, requieren una programación especial para poder realizar el análisis.
- El identificador de sesión puede ser remitido como parámetro URL, aunque estos enlaces, específicos para cada usuario, suponen un trabajo de programación considerable. Desde el punto de vista del SEO, los URL individuales también generan problemas, porque, en cada visita, el crawler puede acceder al mismo contenido en otros URL, lo que puede hacer que lo considere contenido duplicado.
2. Identificación del usuario mediante la dirección IP: si todas las acciones de un usuario se pueden deducir de la misma dirección IP, se pueden asignar inequívocamente. Condición para ello, según muchos expertos en protección de datos, es que el usuario haya aceptado previamente el registro de su dirección IP completa para su análisis. Los problemas en este método aparecen siempre cuando los usuarios reciben su IP de forma dinámica y es, en consecuencia, registrada varias veces, o cuando varios usuarios, como podrían ser servidores proxy, utilizan la misma IP.
3. Medidas independientes del servidor: los denominados píxeles de seguimiento, elemento básico del page-tagging que se integra en una página web de forma invisible, entregan información adicional sobre, entre otras cosas, la resolución de la pantalla y los plugins instalados en el navegador del usuario. Si se cruza su análisis con la dirección IP y la información sobre el navegador y el sistema operativo, es posible diferenciar en cierta medida a los usuarios, aunque nunca totalmente. Sí es posible realizar un seguimiento con ayuda de los pixel widgets o elementos Ajax, pero un log analysis simple no revela ninguna información sobre la manera de usarlos.
Otro problema del log file anlysis se deriva de la función de caching del navegador web o del servidor proxy, porque, aunque acelera la entrega de los datos solicitados, también es la responsable de que, en ocasiones, los usuarios no tengan contacto con el servidor web. Aquellas peticiones que impliquen contenido almacenado en la memoria caché aparecen en los archivos de registro del servidor de forma restringida (código de estado 304 “Not modified”). Cabe mencionar, por último, que el registro, el almacenamiento y la evaluación de los accesos al servidor requieren recursos adicionales, en especial en el caso de proyectos con mucho tráfico de visitas. Además, un log file analysis no tiene en cuenta indicadores clave como la tasa de rebote o la permanencia de las visitas, por lo cual este método se erige más en complemento de otros instrumentos que en método único de análisis.