Cómo utilizar Pandas DataFrame Index

Índice

Con la indexación de DataFrames de la Biblioteca Python Pandas podrás acceder de una forma eficiente y directa a datos específicos dentro de un DataFrame. Con la ayuda de un índice de DataFrames de Pandas se pueden seleccionar filas y columnas específicas dentro del DataFrame, lo que puede resultar muy útil para el análisis de datos.

Hosting

Hosting de primera al mejor precio

3x más rápido, ahora un 60 % de ahorro
Alta disponibilidad >99.99 %
Solo en IONOS: hasta 500 GB incluidos

¿En qué consiste la indexación?

Cuando se indexa un DataFrame de Pandas, el objetivo es facilitar la selección de determinados elementos del DataFrame. Esto se hace seleccionando filas y columnas según sus posiciones o etiquetas. Los índices sirven para encontrar y manipular datos de una forma más rápida, ya que ofrecen una especie de “sistema de direcciones” para la estructura de datos.

Sintaxis de la propiedad `DataFrame.index` de Pandas

Puedes utilizar la propiedad index para ver las etiquetas de un índice de un DataFrame. La sintaxis es la siguiente:

DataFrame.index

python

Sintaxis de la indexación de DataFrames

Existen diferentes formas de indexar un DataFrame de Pandas y la sintaxis de la indexación varía dependiendo de la operación que desees realizar.

Indexación con etiquetas (nombres de columnas)

Puedes utilizar los nombres de las columnas del DataFrame de Pandas para la indexación. Aquí tienes un ejemplo:

import pandas as pd
# Ejemplo de DataFrame
data = {
    'Nombre': ['Alicia', 'Juan', 'Carlos'],
    'Edad': [25, 30, 35],
    'Ciudad': ['Madrid', 'Lugo', 'Cádiz']
}
df = pd.DataFrame(data)
print(df)

python

El aspecto del DataFrame resultante sería el siguiente:

Nombre    Edad    Ciudad
0    Alicia    25     Madrid
1    Juan      30     Lugo
2    Carlos    35     Cádiz

Para acceder a todos los valores de una columna específica, puedes utilizar el nombre de la columna con el operador de indexación [] para su indexación. Para ello, introduce el nombre de la columna como una cadena de Python en el operador de indexación:

# Acceso a la columna “Edad”
print(df['Edad'])

python

Como resultado, se obtienen los diferentes valores de las edades:

0    25
1    30
2    35
Name: Edad, dtype: int64

Si quieres que se muestren varias columnas, no solo una, puedes indicar los nombres de dichas columnas separados por comas en el operador de indexación.

Indexación con `loc[]` (nombres de filas)

Para poder acceder a una fila específica de tu DataFrame, necesitarás el indexador loc de Pandas. Puedes pasarle el nombre de la fila o el número de la fila. En el siguiente ejemplo, se usa el DataFrame anterior y, en este caso, se extraerá la primera columna con los valores de “Alicia”:

print(df.loc[0])

python

Como resultado, aparecen los valores previstos, es decir, los que pertenecen a “Alicia”:

Nombre        Alicia
Edad          25
Ciudad        Madrid
Name: 0, dtype: object

Indexación con `iloc[]` (números de filas y columnas)

Existe otra forma de acceder a elementos específicos de un DataFrame y. probablemente, sea la más conocida: la indexación con números de filas y columnas. Para trabajar con el índice numérico del DataFrame de Pandas necesitarás la propiedad iloc del DataFrame.

# Acceso a la primera fila
print(df.iloc[0])
# Acceso al valor en la primera fila y la segunda columna
print(df.iloc[0, 1])

python

Los resultados que obtenemos al usar la propiedad iloc[] son los siguientes:

Nombre        Alicia
Edad          25
Ciudad        Madrid
Name: 0, dtype: object
25

Indexación de valores individuales

Si solo te interesa un valor específico del DataFrame, puedes usar el indexador at, que te permitirá extraer ese valor de una forma rápida y muy clara. Para ello, define la fila y la columna correspondientes con sus nombres. Si el valor que nos interesa es el lugar de residencia de Juan, indicaremos la columna “Ciudad” y la primera fila para obtenerlo:

print(df.at(1, 'Ciudad'))

python

El resultado es la ciudad en la que vive Juan, es decir, Lugo.

También existe la posibilidad de utilizar el indexador iat, que funciona de forma similar a at, pero en lugar de usar los nombres de las filas y columnas, como en el ejemplo anterior, hay que usar la posición numérica. Podemos obtener el mismo resultado que en el ejemplo anterior utilizando iat:

print(df.iat(1, 2))

python

Indexación booleana

Los subconjuntos de un DataFrame también se pueden indexar usando condiciones específicas. En este caso, hablamos de la llamada indexación booleana. La condición que desees comprobar debe evaluarse como verdadera (True) o falsa (False) y se coloca directamente dentro del operador de indexación. Por ejemplo, si quisiéramos extraer solo las filas en las que la persona sea mayor de 30 años, podríamos hacerlo así:

# Selección de las filas en las que la edad sea superior a 30
print(df[df[Edad] > 30])

python

Como era de esperar, la condición anterior solo se cumple para Carlos, que tiene 35 años. Por lo tanto, el resultado es el siguiente:

Nombre    Edad    Ciudad
2     Carlos    35    Cádiz

Nota

Ten en cuenta que puedes utilizar todos los operadores de comparación booleanos que se evalúan como True o False. Aprende todo lo que necesitas saber sobre los operadores de Python en nuestra guía.

Artículos Favoritos

Compraventa de dominios: cómo ganar dinero con las direcciones web

La compraventa de dominios puede convertirse en una actividad lucrativa, siempre que se…

Nextcloud alternatives: comparativa de cinco alternativas

¿Estás buscando alternativas a Nextcloud, pero quieres saber si están a la misma altura?…

Los mejores proveedores de copias de seguridad en la nube

¡Asegura tus datos de manera fiable en la nube! Tus datos estarán en buenas manos con…

Cómo actualizar Debian 13 paso a paso

Aprende cómo actualizar Debian 13 de forma segura y sin errores, desde la preparación del…

Alternativas a InDesign de Adobe gratuitas

¿Te sale muy caro usar InDesign para la maquetación y el diseño editorial? Descubre las…

Artículos similares

BEST-BACKGROUNDSShutterstock

Iterar sobre DataFrames con Pandas itterows()

Pandas DataFrame itterows() es una forma de iterar sobre las filas de un DataFrame de Pandas. Esta función se utiliza especialmente cuando se requiere un procesamiento fila por fila, por ejemplo, al realizar cálculos. En este artículo te enseñamos cómo trabajar con la función…

Python Pandas

Mr. Kosalshutterstock

Guía rápida sobre el método Pandas any()

El método any() para DataFrames de Pandas es una herramienta muy útil para comprobar rápidamente si en un eje específico de un DataFrame existe al menos un valor True o verdadero. Esto resulta de gran utilidad para el análisis y la validación de datos. ¿Quieres saber cómo…

Python Pandas

ESB Professionalshutterstock

Pandas DataFrame: cómo manipular tablas en Python de manera sencilla

El módulo Pandas es una de las mejores herramientas para manipular datos en Python. Los DataFrames son una de las estructuras de datos centrales en Pandas y sirven para manipular datos bidimensionales estructurados de forma clara y eficiente. Te explicamos su estructura y…

Python Pandas

ra2 studioShutterstock

Python Pandas: la biblioteca para analizar y manipular datos

Python Pandas permite procesar, manipular y analizar conjuntos de datos con facilidad, por lo que resulta especialmente útil para analistas de datos e investigadores. Te mostramos las ventajas de utilizar la biblioteca Pandas y te explicamos cómo usar sus funciones más…

Python
Python Pandas

UndreyShutterstock

La función Pandas iloc() de Python

Cuando estés trabajando con DataFrames en la biblioteca Pandas de Python, es posible que no quieras incluir todas las filas o columnas de un DataFrame para realizar un análisis de los datos. Con la propiedad iloc[] de Pandas podrás seleccionar las filas o columnas que deseas…

Python Pandas

REDPIXEL.PLShutterstock

Calcula valores promedio fácilmente con Pandas mean()

La función Pandas DataFrame.mean() se utiliza para calcular valores promedio en los DataFrame de Pandas. Es flexible a la hora de manejar valores NaN y te permite calcular los promedios tanto por filas como por columnas. En este artículo te enseñamos todo lo que debes saber para…

Python Pandas

Cómo utilizar Pandas DataFrame Index

¿En qué consiste la in­de­xa­ción?

Sintaxis de la propiedad DataFrame.index de Pandas

Sintaxis de la in­de­xa­ción de Da­ta­Fra­mes

In­de­xa­ción con etiquetas (nombres de columnas)

In­de­xa­ción con loc[] (nombres de filas)

In­de­xa­ción con iloc[] (números de filas y columnas)

In­de­xa­ción de valores in­di­vi­dua­les

In­de­xa­ción booleana

¿En qué consiste la indexación?

Sintaxis de la propiedad `DataFrame.index` de Pandas

Sintaxis de la indexación de DataFrames

Indexación con etiquetas (nombres de columnas)

Indexación con `loc[]` (nombres de filas)

Indexación con `iloc[]` (números de filas y columnas)

Indexación de valores individuales

Indexación booleana