Puedes usar la función unique() de la Biblioteca Python Pandas para obtener los valores únicos en una columna de un DataFrame, lo que te permitirá obtener una visión general de los diferentes valores dentro de un conjunto de datos.

Hosting
El hosting como nunca lo habías visto
  • Rápido, seguro, flexible y escalable
  • Certificado SSL/DDoS incluido
  • Dominio y asesor personal incluidos

Sintaxis de DataFrame[].unique() en Pandas

La sintaxis básica para utilizar la función unique() de Pandas es sencilla, ya que esta función no acepta ningún parámetro adicional:

DataFrame['column_name'].unique()
python

Ten en cuenta que en los DataFrames de Pandas, la función unique() solo se puede aplicar a una columna específica del DataFrame. Por lo tanto, deberás especificar la columna antes de usarla. La función unique() genera un array de NumPy con los valores únicos en el orden que aparecen, es decir, no realiza ninguna ordenación de los valores.

Nota

Si llevas algún tiempo programando en Python, seguramente ya conoces el equivalente de NumPy a la función unique() de Pandas. Te recomendamos usar la variante de Pandas, ya que será más eficiente en este caso.

Cómo usar Pandas unique()

Para utilizar unique() en los DataFrames de Pandas, debes especificar la columna en la que quieres buscar valores únicos.

En el siguiente ejemplo te mostramos un DataFrame con información sobre diferentes personas:

import pandas as pd
# Crear un DataFrame de ejemplo
data = {
    'Nombre': ['Alicia', 'Juan', 'Carlos', 'David', 'Eduardo'],
    'Edad': [24, 27, 22, 32, 29],
    'Ciudad': ['Madrid', 'Barcelona', 'Madrid', 'Valencia', 'Barcelona']
}
df = pd.DataFrame(data)
print(df)
python

El DataFrame resultante sería el siguiente:

Nombre    Edad       Ciudad
0    Alicia     24       Madrid
1     Juan     27    Barcelona
2    Carlos     22       Madrid
3    David     32     Valencia
4   Eduardo     29    Barcelona

Ahora, si quieres identificar las ciudades en las que viven estas personas, asegurándote de que cada ciudad solo se liste una vez, puedes utilizar la función unique() de Pandas en la columna del DataFrame que contiene las ciudades:

# Encontrar ciudades únicas
unique_cities = df['Ciudad'].unique()
print(unique_cities)
python

El resultado es un array de NumPy que contiene cada ciudad una sola vez y que muestra que las personas de la lista provienen de tres ciudades diferentes: Madrid, Barcelona y Valencia.

['Madrid' 'Barcelona' 'Valencia']
¿Le ha resultado útil este artículo?
Ir al menú principal