Los archivos de registro o logs de un servidor web guardan in­fo­r­ma­ción acerca del origen y el co­m­po­r­ta­mie­n­to de los vi­si­ta­n­tes de una página web. Por lo tanto, una eva­lua­ción detallada de los archivos log determina, por ejemplo, qué navegador utilizan los usuarios, cuánto tiempo pe­r­ma­ne­cen en una web, cuántas su­b­pá­gi­nas visitan y qué bu­s­ca­do­res o enlaces los han conducido a ella. Gracias a estas y otras in­fo­r­ma­cio­nes, los archivos log son una fuente pri­mo­r­dial para valorar la facilidad de uso de un proyecto web, para im­ple­me­n­tar, así, las co­rre­s­po­n­die­n­tes es­tra­te­gias de op­ti­mi­za­ción. Debido a que es prá­c­ti­ca­me­n­te imposible evaluar estos archivos de texto de forma manual, existen varias he­rra­mie­n­tas de análisis de archivos de registro, como Log Analyzer, que asumen la tarea y presentan grá­fi­ca­me­n­te los re­su­l­ta­dos del análisis. Otro ejemplo in­te­re­sa­n­te es la he­rra­mie­n­ta de código abierto GoAccess.

Los fu­n­da­me­n­tos de GoAccess

En julio de 2010, el de­sa­rro­lla­dor Gerardo Orellana publicó la primera versión de GoAccess. Ini­cia­l­me­n­te bajo la licencia GNU y desde 2016 bajo la licencia MIT, GoAccess puede ser utilizado de forma gratuita y adaptado a las ne­ce­si­da­des propias. Ac­tua­l­me­n­te, el software es ge­s­tio­na­do y de­sa­rro­lla­do por Orellana en la pla­ta­fo­r­ma GitHub.  La idea básica detrás de GoAccess es el análisis y la re­pre­se­n­ta­ción visual de es­ta­dí­s­ti­cas web en tiempo real. Para ase­gu­rar­lo, el ana­li­za­dor de registros evalúa los distintos formatos de archivos log de se­r­vi­do­res web y servicios en la nube como Apache, nginx, Amazon S3 o Clou­d­Fro­nt y presenta los re­su­l­ta­dos grá­fi­ca­me­n­te en un panel de control. GoAccess puede ser utilizado en sistemas UNIX desde el navegador o desde la línea de comandos. Al­te­r­na­ti­va­me­n­te, los re­su­l­ta­dos del análisis pueden ser pre­se­n­ta­dos en los formatos HTML, JSON o CVS.  Los re­qui­si­tos del sistema para utilizar GoAccess son mínimos y, debido a que está escrito en C, solo basta con que la pla­ta­fo­r­ma cuente con la bi­blio­te­ca C ncurses. Para utilizar GoAccess en sistemas ope­ra­ti­vos Windows, necesitas la colección de he­rra­mie­n­tas Cygwin, con las que también puedes utilizar otras apli­ca­cio­nes Linux en Windows.

Las ca­ra­c­te­rí­s­ti­cas di­s­ti­n­ti­vas de esta he­rra­mie­n­ta de código abierto

No se necesita ningún tipo de co­n­fi­gu­ra­cio­nes es­pe­cí­fi­cas para im­ple­me­n­tar GoAccess. Basta con se­le­c­cio­nar el archivo log e iniciar el análisis para recibir có­mo­da­me­n­te la in­fo­r­ma­ción en tiempo real. Los datos se presentan en secciones in­di­vi­dua­les, donde no solo se muestran los valores para los periodos in­di­vi­dua­les de medición, sino que también se incluye un valor para el periodo total de revisión. Por defecto, los re­su­l­ta­dos están ordenados cro­no­ló­gi­ca­me­n­te, pero también es posible filtrar los datos de­pe­n­die­n­do del número de páginas vistas o de vi­si­ta­n­tes, del consumo de ancho de banda o del tiempo de carga de la página web (total, media o máxima). Algunos valores se pueden vi­sua­li­zar en gráficos de barras o diagramas de curvas. Además de la in­fo­r­ma­ción me­n­cio­na­da an­te­rio­r­me­n­te, en “Overall Analyzed Requests” GoAccess pro­po­r­cio­na un resumen de todos los archivos de registro ana­li­za­dos hasta ahora. 

Los datos an­te­rio­r­me­n­te me­n­cio­na­dos son pre­se­n­ta­dos tanto en el terminal como el panel del navegador (ambos en inglés) en atra­c­ti­vos gráficos y diagramas para que, rá­pi­da­me­n­te, puedas sacar co­n­clu­sio­nes sobre la facilidad de uso de tu web y sobre tus vi­si­ta­n­tes. La siguiente tabla explica los di­fe­re­n­tes aspectos cubiertos por GoAccess durante su análisis de los archivos log, re­su­mie­n­do los re­su­l­ta­dos y su si­g­ni­fi­ca­do.

ValorTra­du­c­ciónValor decisivoSi­g­ni­fi­ca­do para el análisis web
Unique visitors per day – including spidersVi­si­ta­n­tes únicos diarios, in­clu­ye­n­do bots Visitas, vi­si­ta­n­tes, fecha (Data)Todas las visitas rea­li­za­das desde una misma IP se cuentan como una única visita. Observar el número de vi­si­ta­n­tes durante un periodo de tiempo pro­lo­n­ga­do permite ver si las campañas y los co­n­te­ni­dos han tenido éxito.
Requested Files (URLs)Datos so­li­ci­ta­dos (in­clu­ye­n­do URL)Visitas, ancho de banda, tiempo de carga (Avg., Cum., Max. T.S.), URL (Data)Esta sección presenta una visión general de los URL más so­li­ci­ta­dos. Aquí conocerás qué páginas de tu proyecto web son pa­r­ti­cu­la­r­me­n­te populares, así como la cantidad de ancho de banda consumida y la es­ta­bi­li­dad de los tiempos de carga.
Static RequestsSo­li­ci­tu­des de contenido estático Visitas, ancho de banda, tiempo de carga, archivos (Data)Al igual que en el caso anterior, se muestran los URL más so­li­ci­ta­dos, pero úni­ca­me­n­te para co­n­te­ni­dos estáticos tales como gráficos, iconos o elementos de diseño.
Not Found URLs (404s)Di­re­c­cio­nes URL no en­co­n­tra­das (Errores 404)Visitas, URL (Data)En esta categoría, los URL me­n­cio­na­dos han llevado a los usuarios a en­co­n­trar­se con el error 404. Con la ayuda de esta es­ta­dí­s­ti­ca podrás ide­n­ti­fi­car y so­lu­cio­nar problemas de red o enlaces de­fe­c­tuo­sos. Recuerda que estos últimos tienen un impacto negativo para los usuarios y para los motores de búsqueda.
Visitor Hostnames and IPsNombre del host y di­re­c­cio­nes IPCiudad, país, nombre del host, IP (Data)Esta sección ofrece in­fo­r­ma­ción acerca de los pro­vee­do­res y las di­re­c­cio­nes IP de los vi­si­ta­n­tes. Adi­cio­na­l­me­n­te, GoAccess pro­po­r­cio­na datos sobre el país y lugar de origen. Aquí, el principal beneficio es poder presentar contenido pe­r­so­na­li­za­do a los usuarios. Sin embargo, de­pe­n­die­n­do del país será necesario co­n­si­de­rar la le­gi­s­la­ción de pro­te­c­ción de datos para poder utilizar esta in­fo­r­ma­ción.
Operating SystemsSistemas ope­ra­ti­vosVisitas, vi­si­ta­n­tes, sistema operativo (Data)Aquí se muestran los sistemas ope­ra­ti­vos que utilizan los vi­si­ta­n­tes. Esta in­fo­r­ma­ción se utiliza pri­n­ci­pa­l­me­n­te para de­te­r­mi­nar el po­r­ce­n­ta­je del tráfico móvil.
BrowsersNa­ve­ga­do­resVisitas, vi­si­ta­n­tes, na­ve­ga­do­res (Data)En esta zona se enumeran los tipos de clientes. En primer lugar podrás ver los números de los di­fe­re­n­tes na­ve­ga­do­res, pero también qué crawlers rastrean tu web, en caso de que los haya.
Time Di­s­tri­bu­tionDi­s­tri­bu­ción temporal de las visitasVisitas, vi­si­ta­n­tes, tiempos de carga, hora (Data)Recibirás un resumen exacto sobre los horarios de mayor tráfico. Con este criterio de­te­r­mi­nas exac­ta­me­n­te en qué momentos del día tus usuarios son pa­r­ti­cu­la­r­me­n­te activos, con lo que podrás insertar pu­bli­ci­dad o publicar co­n­te­ni­dos con mucha exactitud.
Virtual HostsHosts virtualesVisitas, ancho de banda, host (Data)Si ejecutas más de un host virtual (dominios, di­re­c­cio­nes IP) en tu servidor web, con la ayuda de esta es­ta­dí­s­ti­ca puedes filtrar aquellos recursos que demandan un mayor esfuerzo por parte de tu servidor.
Referrers URLsDi­re­c­cio­nes URL de re­fe­re­n­cia Visitas, URL (Data)Los referrers son las di­re­c­cio­nes URL que di­ri­gie­ron al visitante a tu página web. Con esta es­ta­dí­s­ti­ca puedes filtrar los sitios asociados más fuertes, así como los criterios de búsqueda exactos cuando el visitante llegó a tu web desde un motor de búsqueda.
Referring SitesPáginas web de re­fe­re­n­cia Visitas, dirección web (Data)A di­fe­re­n­cia de las es­ta­dí­s­ti­cas an­te­rio­res, aquí no obtendrás el URL, sino la dirección general del sitio de origen.
Ke­y­ph­ra­ses from Google's search engingeCriterios de búsqueda uti­li­za­dos en GoogleVisitas, criterios de búsqueda Además de las es­ta­dí­s­ti­cas de URL, GoAccess ofrece una lista separada de los criterios de búsqueda, al menos para Google.
Geo LocationLo­ca­li­za­ción geo­grá­fi­caVi­si­ta­n­tes, origen (Data)Esta sección ofrece la lo­ca­li­za­ción geo­grá­fi­ca exacta de las di­re­c­cio­nes IP del sistema del usuario. Sin embargo, este punto también implica las mismas cue­s­tio­nes legales co­rre­s­po­n­die­n­tes a la pro­te­c­ción de datos que para la categoría de nombre de host y usuario IP.
HTTP Status CodesCódigos de estado HTTPVisitas, código de estado (Data)Esta categoría ofrece una visión general de las re­s­pue­s­tas del servidor. Con esta in­fo­r­ma­ción puedes de­te­r­mi­nar si tu servidor web funciona co­rre­c­ta­me­n­te y si los usuarios vi­sua­li­zan y acceden a tus co­n­te­ni­dos sin ningún problema.

Así se instala y utiliza GoAccess

Para ase­gu­rar­te de que estás in­s­ta­la­n­do la versión más reciente de GoAccess, es re­co­me­n­da­ble utilizar el archivo de in­s­ta­la­ción di­s­po­ni­ble en su página oficial. Para gestionar la descarga y la in­s­ta­la­ción desde la línea de comando, ne­ce­si­ta­rás in­tro­du­cir el siguiente comando:

$ wget http://tar.goaccess.io/goaccess-1.0.tar.gz
$ tar -xzvf goaccess-1.0.tar.gz
$ cd goaccess-1.0/
$ ./configure --enable-utf8
$ make
# make install

No olvides que tener ncurses instalada en el sistema, en su versión más actual, es un requisito im­pre­s­ci­n­di­ble para el correcto fu­n­cio­na­mie­n­to de GoAccess en nginx y Apache. En caso de que aún no lo hayas hecho, podrás co­n­fi­gu­rar la bi­blio­te­ca C con el siguiente código:

$ wget http://ftp.gnu.org/pub/gnu/ncurses/ncurses-5.7.tar.gz
$ tar xzf ncurses-6.0.tar.gz
$ cd ncurses-6.0
$ ./configure --prefix=/opt/ncurses
$ make
# make install
$ ls -la /opt/ncurses

Si deseas acceder a una do­cu­me­n­ta­ción más detallada sobre las po­si­bi­li­da­des de co­n­fi­gu­ra­ción de esta he­rra­mie­n­ta de análisis de archivos log, puedes visitar la versión en inglés del manual de GoAccess.

Ir al menú principal