Seleccionar datos de DataFrames con Pandas loc[]

Índice

Pandas DataFrame.loc[] es un indexador de la Biblioteca Python Pandas que se utiliza para seleccionar datos de un DataFrame basándose en etiquetas. De esta manera, puedes extraer filas y columnas específicas de un DataFrame.

Hosting

Hosting de primera al mejor precio

3x más rápido, ahora un 60 % de ahorro
Alta disponibilidad >99.99 %
Solo en IONOS: hasta 500 GB incluidos

Sintaxis de Pandas `loc[]`

El parámetro que se le pasa a loc[] es la selección de etiquetas deseada. Por lo demás, la sintaxis es muy simple:

DataFrame.loc[selection]

python

En Pandas loc[], la selección se realiza principalmente en función de etiquetas. El parámetro que se pasa puede ser una etiqueta individual, una lista o un rango de etiquetas. Sin embargo, también se pueden utilizar arrays booleanos.

Diferencias entre `loc[]` y `iloc[]`

Mientras que Pandas DataFrame.loc[] selecciona datos basados en etiquetas, existe otro indexador similar en Pandas, DataFrame.iloc, que se utiliza para seleccionar datos basados en posiciones de enteros.

El siguiente ejemplo ilustra de una forma clara las diferencias entre ambos indexadores. Primero, se crea un DataFrame de Pandas:

import pandas as pd
# Ejemplo de DataFrame
data = {'Nombre': ['Ana', 'Juan', 'Tomás'], 'Edad': [23, 35, 30]}
df = pd.DataFrame(data)
print(df)

python

El DataFrame resultante sería el siguiente:

Nombre   Edad
0      Ana     23
1     Juan     35
2    Tomás     30

Si quisiéramos extraer a “Ana” del DataFame, se podrían utilizar tanto loc[] como iloc[]. El resultado que se obtiene es el mismo, pero siguiendo dos rutas diferentes:

# Con loc por etiqueta
print(df.loc[0, 'Nombre'])  # Salida: 'Ana'
# Con iloc por posición
print(df.iloc[0, 0])  # Salida: 'Ana'

python

Cómo utilizar Pandas `DataFrame.loc[]`

Pandas loc[] sirve para extraer subconjuntos de un DataFrame, ya sea una o varias filas o columnas. El indexador loc[] puede tener diferentes aplicaciones de uso.

Selección de una fila individual

A continuación, crearemos un DataFrame de ejemplo usando el siguiente código:

import pandas as pd
data = {
    'Nombre': ['Ana', 'Juan', 'Tomás'],
    'Edad': [23, 35, 30],
    'Ciudad': ['León', 'Madrid', 'Salamanca']
}
df = pd.DataFrame(data)
print(df)

python

El DataFrame resultante sería el siguiente:

Nombre  Edad    Ciudad
0      Ana    23      León
1     Juan    35    Madrid
2    Tomás    30 Salamanca

Para seleccionar los datos de la fila con el índice 1 (que corresponde a Juan), se puede utilizar el indexador Pandas loc[]:

juan_data = df.loc[1]
print(juan_data)

python

El resultado sería el siguiente:

Nombre         Juan
Edad             35
Ciudad       Madrid
Name: 1, dtype: object

Selección de varias columnas

También puedes usar DataFrame.loc[] para seleccionar un subconjunto de columnas. El código selecciona las columnas “Nombre” y “Ciudad” para todas las filas:

name_stadt = df.loc[:, ['Nombre', 'Ciudad']]
print(name_stadt)

python

Como resultado, obtienes un subconjunto del DataFrame original:

Nombre    Ciudad
0      Ana      León
1     Juan    Madrid
2    Tomás Salamanca

Selección basada en una condición

Con Pandas loc[] también es posible seleccionar filas basadas en una condición. En este caso, se utilizan operadores de comparación booleanos. En el siguiente código, por ejemplo, se filtrarán todas las personas que tienen más de 25 años:

older_than_25 = df.loc[df['Edad'] > 25]
print(older_than_25)

python

Nombre  Edad    Ciudad
1     Juan    35    Madrid
2    Tomás    30 Salamanca

Artículos Favoritos

Compraventa de dominios: cómo ganar dinero con las direcciones web

La compraventa de dominios puede convertirse en una actividad lucrativa, siempre que se…

Nextcloud alternatives: comparativa de cinco alternativas

¿Estás buscando alternativas a Nextcloud, pero quieres saber si están a la misma altura?…

Los mejores proveedores de copias de seguridad en la nube

¡Asegura tus datos de manera fiable en la nube! Tus datos estarán en buenas manos con…

Cómo actualizar Debian 13 paso a paso

Aprende cómo actualizar Debian 13 de forma segura y sin errores, desde la preparación del…

Alternativas a InDesign de Adobe gratuitas

¿Te sale muy caro usar InDesign para la maquetación y el diseño editorial? Descubre las…

Artículos similares

ESB Professionalshutterstock

Pandas DataFrame: cómo manipular tablas en Python de manera sencilla

El módulo Pandas es una de las mejores herramientas para manipular datos en Python. Los DataFrames son una de las estructuras de datos centrales en Pandas y sirven para manipular datos bidimensionales estructurados de forma clara y eficiente. Te explicamos su estructura y…

Python Pandas

Mr. Kosalshutterstock

Cómo utilizar Pandas DataFrame Index

La indexación de los DataFrames de Pandas es una herramienta fantástica para trabajar con datos de una forma más eficiente. Existen diferentes métodos con los que podrás acceder a datos y a subconjuntos específicos de tu DataFrame para manipularlos. Te explicamos qué es el índice…

Python Pandas

BEST-BACKGROUNDSShutterstock

Iterar sobre DataFrames con Pandas itterows()

Pandas DataFrame itterows() es una forma de iterar sobre las filas de un DataFrame de Pandas. Esta función se utiliza especialmente cuando se requiere un procesamiento fila por fila, por ejemplo, al realizar cálculos. En este artículo te enseñamos cómo trabajar con la función…

Python Pandas

ra2 studioShutterstock

Pandas Tables: formatear DataFrames como tablas

Mostrar un DataFrame de Pandas (Python) como tabla es una tarea esencial que se puede conseguir de muchas maneras, dependiendo de los requisitos. Ya sea una salida simple en consola, una tabla HTML formateada o una visualización en formatos estándar, existen diversas formas de…

Python Pandas

Mr. Kosalshutterstock

Guía rápida sobre el método Pandas any()

El método any() para DataFrames de Pandas es una herramienta muy útil para comprobar rápidamente si en un eje específico de un DataFrame existe al menos un valor True o verdadero. Esto resulta de gran utilidad para el análisis y la validación de datos. ¿Quieres saber cómo…

Python Pandas

Ranjit Karmakarshutterstock

Guía rápida sobre el método Pandas describe()

El método DataFrame.describe() de Pandas nos permite generar un resumen estadístico completo de los datos numéricos en un DataFrame de forma rápida. Ofrece la posibilidad de ajustar los cuantiles y especificar tipos de datos, lo que lo convierte en un método extremadamente…

Python Pandas

Se­le­c­cio­nar datos de Da­ta­Fra­mes con Pandas loc[]

Sintaxis de Pandas loc[]

Di­fe­re­n­cias entre loc[] y iloc[]

Cómo utilizar Pandas DataFrame.loc[]

Selección de una fila in­di­vi­dual

Selección de varias columnas

Selección basada en una condición

Seleccionar datos de DataFrames con Pandas loc[]

Sintaxis de Pandas `loc[]`

Diferencias entre `loc[]` y `iloc[]`

Cómo utilizar Pandas `DataFrame.loc[]`

Selección de una fila individual