Tutorial de Kibana: análisis de datos con Elasticsearch

Equipo editorial de IONOS13.3.2019

Índice

El motor de búsqueda y análisis Elasticsearch es una de las mejores soluciones de código abierto para indexar y estructurar grandes bases de datos. Sin embargo, para extraer conclusiones valiosas de su análisis, a menudo es necesario presentarlos de forma clara y comprensible. La herramienta de visualización Kibana se ha desarrollado especialmente para la presentación de datos obtenidos con ElasticSearch. ¿Cómo usar Kibana?

¿Qué es Kibana?

Kibana es una interfaz web escalable para la representación visual de datos. Junto con Elasticsearch y la herramienta de procesamiento de datos Logstash, forma la llamada “pila ELK” (también llamada Elastic Stack). Esta suite de código abierto permite a los usuarios recoger, organizar y preparar datos con fines analíticos desde diferentes servidores (y en cualquier formato). Además de la capacidad de visualizar los datos procesados por Logstash y Elasticsearch, Kibana también ofrece análisis automáticos en tiempo real, un algoritmo de búsqueda muy flexible y diferentes tipos de vistas (histogramas, gráficos, diagramas circulares, etc.) para los datos. En el panel de control (dashboard), las diversas visualizaciones interactivas pueden combinarse para formar una imagen general dinámica que permita su filtrado y examen.

Para mostrar este video, se requieren cookies de terceros. Puede acceder y cambiar sus ajustes de cookies aquí.

Al ser una aplicación web escrita en JavaScript, Kibana puede utilizarse en todas las plataformas. Solo se incurrirá en gastos si se utiliza el servicio de hosting Elastic Cloud, ofrecido por el desarrollador. Este servicio de pago permite implementar y organizar un clúster seguro Kibana-Elasticsearch en Amazon o Google sin tener que proporcionar recursos propios.

Tutorial de Kibana: primeros pasos con la herramienta de visualización

Kibana ofrece una amplia gama de funciones para presentar gráficamente bases de datos preparadas. Sin embargo, antes de que la herramienta esté lista para filtrar y visualizar la información en el dashboard, de tal manera que permita identificar, analizar y evaluar los valores clave, hay un largo trabajo previo. Con este manual de Kibana, te facilitamos la puesta en marcha de esta competente interfaz web porque aprenderás cómo instalar Kibana correctamente, cómo crear tu primer panel de control y cómo incorporar bases de datos ya existentes a la herramienta de visualización.

Paso 1: poner en marcha Kibana

Dado que Kibana está diseñado para mostrar datos que se han indexado usando Elasticsearch, el primer paso será instalar el motor de búsqueda y análisis. Los paquetes correspondientes para Windows, macOS y Linux se encuentran en el centro de descargas de Elasticsearch. Requiere un entorno de ejecución Java actual (64 bits).

Kibana también está disponible como software multiplataforma para Windows, macOS y Linux (RPM, DEB). Dado que la aplicación está basada en el entorno de ejecución de JavaScript Node.js, los distintos paquetes de instalación también contienen los archivos binarios de Node.js necesarios para ejecutar la herramienta de visualización (no es compatible con versiones independientes). Los diferentes paquetes (ZIP) también se descargan, como Elasticsearch, desde la página principal de Elastic.

Nota

Los usuarios de Linux y Mac también pueden instalar Kibana desde el repositorio Elastic usando los gestores de paquetes apt y yum. En los manuales online de Kibana encontrarás instrucciones detalladas al respecto.

Una vez descomprimido el paquete Kibana, ejecuta el archivo bin/kibana (macOS, Linux) o bin\kibana.bat (Windows) para poner en marcha el servidor Kibana.

El servidor Kibana tarda unos segundos en iniciarse.

Abre, a continuación, el backend de Kibana a través de la dirección 'http://localhost:5601' en el navegador (Elasticsearch ya debe estar ejecutándose).

La interfaz de usuario de Kibana solo está disponible en inglés.

Paso 2: nutrir a Kibana con datos

Para poder explorar el panel de control de Kibana y sus funciones con más detalle, primero ha de disponer de datos. En la página web de Elastic hay tres bases de datos de muestra descargables gratuitamente que son las que utilizaremos aquí para realizar pruebas. Se trata de las bases de datos “shakespeare.json” (base de datos de las obras completas de William Shakespeare), “accounts.zip” (conjunto de cuentas ficticias) y “logs.jsonl.gz” (conjunto de archivos de registro generados al azar).

Descarga y descomprime los tres archivos y guárdalos en una ubicación de tu elección.

Las bases de datos de muestra también pueden descargarse haciendo clic en sus respectivos enlaces. La descarga se iniciará automáticamente.

Antes de introducir los datos en la herramienta, es necesario crear una imagen (mapping) de los campos de las bases de datos shakespeare y server logs. Estas clasificaciones subdividen los documentos en el índice en grupos lógicos y especifican las propiedades de los campos (hasta qué punto pueden buscarse, por ejemplo). La herramienta adecuada para configurar el mapeo es la consola, que se encuentra en el menú “Dev Tool” > “Console” en la interfaz de Kibana.

El plugin Console de Kibana proporciona una interfaz que permite interactuar directamente con la API REST de Elasticsearch.

Ahora inserta por orden los siguientes mappings utilizando una petición PUT:

PUT /shakespeare
{
 "mappings": {
  "doc": {
   "properties": {
    "speaker": {"type": "keyword"},
    "play_name": {"type": "keyword"},
    "line_id": {"type": "integer"},
    "speech_number": {"type": "integer"}
   }
  }
 }
}

PUT /logstash-2015.05.18
{
    "mappings": {
        "log": {
            "properties": {
                "geo": {
                    "properties": {
                        "coordinates": {
                            "type": "geo_point"
                        }
                    }
                }
            }
        }
    }
}

PUT /logstash-2015.05.19
{
    "mappings": {
        "log": {
            "properties": {
                "geo": {
                    "properties": {
                        "coordinates": {
                            "type": "geo_point"
                        }
                    }
                }
            }
        }
    }
}

PUT /logstash-2015.05.20
{
    "mappings": {
        "log": {
            "properties": {
                "geo": {
                    "properties": {
                        "coordinates": {
                            "type": "geo_point"
                        }
                    }
                }
            }
        }
    }
}

Pulsando en el símbolo del triángulo verde, obtienes la respuesta a la petición introducida en la consola de Kibana.

Utiliza ahora la API Bulk de Elasticsearch para cargar con Curl los registros (datos) a través de la terminal. En Windows, utiliza la PowerShell con el Invoke-RestMethod (ejemplo de código a continuación):

curl -H 'Content-Type: application/x-ndjson' -XPOST 'localhost:9200/bank/account/_bulk?pretty' --data-binary @accounts.json
curl -H 'Content-Type: application/x-ndjson' -XPOST 'localhost:9200/shakespeare/doc/_bulk?pretty' --data-binary @shakespeare_6.0.json
curl -H 'Content-Type: application/x-ndjson' -XPOST 'localhost:9200/_bulk?pretty' --data-binary @logs.jsonl

Invoke-RestMethod "http://localhost:9200/bank/account/_bulk?pretty" -Method Post -ContentType 'application/x-ndjson' -InFile "accounts.json"
Invoke-RestMethod "http://localhost:9200/shakespeare/doc/_bulk?pretty" -Method Post -ContentType 'application/x-ndjson' -InFile "shakespeare_6.0.json"
Invoke-RestMethod "http://localhost:9200/_bulk?pretty" -Method Post -ContentType 'application/x-ndjson' -InFile "logs.jsonl"

Asegúrate de ejecutar los comandos de carga de los registros en el directorio donde se encuentran las tres bases de datos de ejemplo.

Nota

En función de la potencia de cálculo del equipo, la carga de los datos puede durar más o menos.

Vuelve a la consola de Kibana y verifica el éxito de la transferencia con la siguiente petición GET:

GET /_cat/indices?v

Si los datos se han cargado como debían, la salida debería ser:

El “health status” amarillo (“yellow”) indica que Elasticsearch ha clasificado todos los fragmentos primarios (partes de un índice de datos), pero no todas las réplicas (copias de seguridad de los fragmentos).

Paso 3: definir un primer patrón de índice

Para que Kibana sepa qué datos ha de procesar, hay que crear los patrones para los índices “Shakespeare”, “bank” y “logstash”. Para definir el primero haremos lo siguiente:

Abre el menú “Management” (Administración) y clica en “Index Patterns” (Patrones de índice). Con el primer patrón de índice, la página “Create index pattern” (Crear patrón de índice) se abre automáticamente, aunque también puede abrirse con el botón del mismo nombre.
Escribe “shakes*” en el campo “Index pattern” y, a continuación, pincha en “Next step” (Paso siguiente).
Dado que no se requiere ninguna configuración especial para este patrón, omite el siguiente paso y completa la creación del patrón haciendo clic en “Create index pattern”.

Un patrón de índice recién creado debe coincidir con al menos un índice que contenga datos. De lo contrario, no se podrá continuar con el proceso de configuración.

Repite los pasos para el modelo “ba*”, que se asigna automáticamente al índice “bank”.

Finalmente, define también un patrón de índice con el nombre “logstash*” para los tres índices de registros del servidor (server logs). Con este patrón no se salta el menú de configuración, sino que se selecciona la entrada “@timestamp” en el menú desplegable “Time Filter field name” (Nombre de campo de filtro de tiempo), ya que estos registros contienen datos de secuencias cronológicas. A continuación, clica en “Create index pattern” como en los dos patrones anteriores.

Los datos cronológicos (como los registros del servidor), constituyen registros de datos que se recopilan de forma continua.

Paso 4: explorar los registros que se han incorporado a Kibana

Una vez tu servidor Kibana cuenta con registros, puedes iniciar una consulta de búsqueda con Elasticsearch para examinarlos y filtrar los resultados. Para ello, en Kibana ve al menú “Discover” y selecciona el patrón de índice para su búsqueda utilizando el símbolo del triángulo pequeño en la barra de menú de la izquierda. Para nuestro tutorial de Kibana Dashboard, nos hemos decantado por el registro de cuentas (ba*):

Kibana: lista las entradas del registro seleccionado, en este caso ba*, que contiene categorías típicas de cuentas bancarias como saldo, nombre, edad, etc.

Como prueba, filtra ahora el registro de cuentas bancarias para ver solo las cuentas que cumplen con determinados criterios. Por ejemplo, para buscar específicamente cuentas que tengan un saldo superior a 47 500 euros y pertenezcan a personas mayores de 38 años, escribe el siguiente comando en el cuadro de búsqueda:

balance:>47500 AND age:>38

Discover devuelve como respuesta cuatro cuentas (97, 177, 878 y 916) que se corresponden con las propiedades seleccionadas.

Con el botón “Add a filter” (Añade un filtro) puedes definir tus propios filtros para la base de datos seleccionada.

Puedes guardar tus búsquedas haciendo clic en el botón “Save” en la barra de menú superior.

Paso 5: visualizar los datos

Si has seguido los pasos explicados hasta ahora en este tutorial de Kibana, ya estás en situación de visualizar los datos implementados para dar vida a tu panel de control. Como ejemplo, crearemos un gráfico circular que representará la base de datos de cuentas bancarias. Este diagrama deberá mostrar, por un lado, qué porción del total de las 1000 cuentas cae dentro de ciertos rangos de saldo de cuenta y, por otro lado, cómo resulta la distribución por edades dentro de estas divisiones.

Abre en un primer paso el menú “Visualize” (Visualizar) y haz clic en “Create a visualization” (Crear una visualización) para obtener una lista de los tipos de gráficos disponibles. Selecciona la opción “Pie” (Pastel).

Entre los tipos de visualización disponibles en Kibana también se incluyen mapas de calor, gráficos de barras y gráficos de área.

En un primer paso, solo verás un círculo que aglutina todas las entradas de la base de datos, ya que todavía no se han definido categorías. Estas se llaman “Buckets” (Cubos) en Kibana y se crean en el punto homónimo del menú.

Para definir los diferentes rangos para los saldos, pincha en “Split Slices” (Separar porciones) y selecciona “Range” (Rango) en el menú desplegable “Aggregation” (Agregación):

Con el tipo "Range" se crean rangos de valores para campos seleccionados de un registro de datos.

En “Field” (Campo) busca la entrada “balance”(saldo) y pincha en ella, para después pinchar cuatro veces en el botón “Add Range” (Añadir rango), con lo que definirás seis categorías para saldos de cuentas:

0	999
1000	2999
3000	6999
7000	14999
15000	30999
31000	50000

Pincha, a continuación, en “Apply changes”(Aplicar cambios) y el gráfico circular mostrará la distribución de las cuentas según los rangos de saldos que has definido.

Kibana crea automáticamente la leyenda para el diagrama, cuya posición (derecha, izquierda, arriba, abajo) puede ajustarse en las opciones.

En un segundo paso, se añade otro anillo al diagrama que visualiza la distribución de los rangos de edad en correspondencia con las áreas de saldo de cuenta. Para ello, pincha en “Add sub-buckets” (Añadir subcategorías), luego de nuevo en “Split Slices” y finalmente selecciona “Terms” (Condiciones) en el menú desplegable. Busca en “Field” la entrada “age” (edad) y acepta los cambios pinchando en “Apply changes”.

Si mueves el ratón sobre los componentes del diagrama, Kibana mostrará información sobre herramientas adicionales, a menos que se haya desactivado en las opciones.

Ahora puedes guardar la visualización utilizando el botón "Guardar" situado en la barra de menú superior.

Paso 6: organizar el Dashboard

Finalmente, nos detendremos brevemente el Dashboard de Kibana. Para ello será necesario crear un primer panel de control de prueba utilizando la búsqueda y la visualización que se guardaron en los pasos anteriores 4 y 5. Selecciona en primer lugar el panel de control en la navegación de la página y clica en “Create new dashboard” (Crear nuevo panel de control) y, a continuación, en “Add” (Añadir). Kibana listará entonces automáticamente todas las visualizaciones o búsquedas guardadas:

La función de búsqueda permite encontrar fácilmente cualquier panel de control incluso con un gran número de visualizaciones o resultados de búsqueda.

Haciendo clic con el botón izquierdo del ratón se añade al panel de control la visualización del saldo de la cuenta y el resultado de la búsqueda, permitiendo la presentación en paralelo.

Con el botón "Share" puedes compartir tu panel de control de Kibana con otros usuarios o incorporarlo a tu sitio web.

Ahora puedes modificar los paneles cambiando su tamaño o su posición, por ejemplo. También es posible mostrar un resultado de visualización o búsqueda en toda la pantalla o eliminarlo del panel de control. Mediante “Inspect” (Inspeccionar), puedes visualizar información adicional sobre los datos y consultas subyacentes de muchas visualizaciones.

Nota

Si quitas un panel del Dashboard de Kibana, la visualización o búsqueda guardada no se pierde.

¿Le ha resultado útil este artículo?

Artículos Favoritos

Dominio correo electrónico: Qué es y cómo crear uno propio

¿Cómo crear un correo con dominio propio? Transmite profesionalidad y favorece la…

¿Cómo comprar un dominio?

¿Cómo registrar un dominio web con los dominios de primer y segundo nivel deseados? ¿Cómo…

Tipos de dominios: ¿los conoces?

¿Qué tipos de dominios hay en Internet? ¿Qué diferencia hay entre los dominios de primer…

Prompt engineering: definición, ejemplos y buenas prácticas

¿Qué es prompt engineering?, ¿cómo obtener mejores resultados de ChatGPT y otras…

7 tipos de páginas web: ¿qué sitio web necesitas?

Dentro de los tipos de página web, elegir un formato adecuado es fundamental para el éxito…

Artículos similares

Elasticsearch

Si trabajas con grandes cantidades de datos, necesitas un potente motor de búsqueda orientado a documentos como Elasticsearch. Este servidor te permite realizar búsquedas de texto completo y puede configurarse para que se ajuste a tus necesidades. En nuestro tutorial de…

Base de Datos
Tutoriales

sakkmesterkeshutterstock

Big data: cómo se usan los datos que generamos

Comprar, reservar vacaciones y buscar regalos en Internet son actos cotidianos en donde, sin pensarlo, con cada búsqueda o cada vez que introduce su dirección de correo electrónico, el usuario está dejando una huella de sus intereses y necesidades. Recolectadas afanosamente,…

Protección de Datos
Base de Datos
Tienda Online
E-Commerce
Big Data

Software de data mining: realiza análisis de datos más efectivos

En la era digital, incluso en las pequeñas y medianas empresas los datos crecen hasta límites insospechados. Para poder obtener la información que se desea de los registros es necesario recurrir a las herramientas de data mining encargadas de extraer patrones repetitivos de la…

Base de Datos
Big Data
Análisis de Datos

Apache Kafka: tutorial para los primeros pasos

El software de mensajería y transmisión Apache Kafka, escrito en Scala, es una de las soluciones más utilizadas para almacenar y procesar grandes flujos de datos de forma eficiente. En este tutorial de Kafka descubrirás los requisitos previos para utilizar Apache Kafka y la mejor…

Tutoriales
Apache

InfluxDB: explicación, ventajas y primeros pasos

El sistema de código abierto InfluxDB gestiona y visualiza los datos de bases de datos de series temporales de miles de juegos de datos del Internet de las cosas (IdC) o de datos de sensores en un flujo continuo de datos con marca temporal. La versión 2.0 está disponible en la…

Base de Datos