Puedes usar la función unique() de la Bi­blio­te­ca Python Pandas para obtener los valores únicos en una columna de un DataFrame, lo que te permitirá obtener una visión general de los di­fe­re­n­tes valores dentro de un conjunto de datos.

Hosting
Hosting de primera al mejor precio
  • 3x más rápido, ahora un 60 % de ahorro
  • Alta di­s­po­ni­bi­li­dad >99.99 %
  • Solo en IONOS: hasta 500 GB incluidos

Sintaxis de DataFrame[].unique() en Pandas

La sintaxis básica para utilizar la función unique() de Pandas es sencilla, ya que esta función no acepta ningún parámetro adicional:

DataFrame['column_name'].unique()
python

Ten en cuenta que en los Da­ta­Fra­mes de Pandas, la función unique() solo se puede aplicar a una columna es­pe­cí­fi­ca del DataFrame. Por lo tanto, deberás es­pe­ci­fi­car la columna antes de usarla. La función unique() genera un array de NumPy con los valores únicos en el orden que aparecen, es decir, no realiza ninguna or­de­na­ción de los valores.

Nota

Si llevas algún tiempo pro­gra­ma­n­do en Python, se­gu­ra­me­n­te ya conoces el equi­va­le­n­te de NumPy a la función unique() de Pandas. Te re­co­me­n­da­mos usar la variante de Pandas, ya que será más eficiente en este caso.

Cómo usar Pandas unique()

Para utilizar unique() en los Da­ta­Fra­mes de Pandas, debes es­pe­ci­fi­car la columna en la que quieres buscar valores únicos.

En el siguiente ejemplo te mostramos un DataFrame con in­fo­r­ma­ción sobre di­fe­re­n­tes personas:

import pandas as pd
# Crear un DataFrame de ejemplo
data = {
    'Nombre': ['Alicia', 'Juan', 'Carlos', 'David', 'Eduardo'],
    'Edad': [24, 27, 22, 32, 29],
    'Ciudad': ['Madrid', 'Barcelona', 'Madrid', 'Valencia', 'Barcelona']
}
df = pd.DataFrame(data)
print(df)
python

El DataFrame re­su­l­ta­n­te sería el siguiente:

Nombre    Edad       Ciudad
0    Alicia     24       Madrid
1     Juan     27    Barcelona
2    Carlos     22       Madrid
3    David     32     Valencia
4   Eduardo     29    Barcelona

Ahora, si quieres ide­n­ti­fi­car las ciudades en las que viven estas personas, ase­gu­rá­n­do­te de que cada ciudad solo se liste una vez, puedes utilizar la función unique() de Pandas en la columna del DataFrame que contiene las ciudades:

# Encontrar ciudades únicas
unique_cities = df['Ciudad'].unique()
print(unique_cities)
python

El resultado es un array de NumPy que contiene cada ciudad una sola vez y que muestra que las personas de la lista provienen de tres ciudades di­fe­re­n­tes: Madrid, Barcelona y Valencia.

['Madrid' 'Barcelona' 'Valencia']
Ir al menú principal