Obtener valores únicos con Pandas unique()
Puedes usar la función unique()
de la Biblioteca Python Pandas para obtener los valores únicos en una columna de un DataFrame, lo que te permitirá obtener una visión general de los diferentes valores dentro de un conjunto de datos.
- Rápido, seguro, flexible y escalable
- Certificado SSL/DDoS incluido
- Dominio y asesor personal incluidos
Sintaxis de DataFrame[].unique()
en Pandas
La sintaxis básica para utilizar la función unique()
de Pandas es sencilla, ya que esta función no acepta ningún parámetro adicional:
DataFrame['column_name'].unique()
pythonTen en cuenta que en los DataFrames de Pandas, la función unique()
solo se puede aplicar a una columna específica del DataFrame. Por lo tanto, deberás especificar la columna antes de usarla. La función unique()
genera un array de NumPy con los valores únicos en el orden que aparecen, es decir, no realiza ninguna ordenación de los valores.
Si llevas algún tiempo programando en Python, seguramente ya conoces el equivalente de NumPy a la función unique()
de Pandas. Te recomendamos usar la variante de Pandas, ya que será más eficiente en este caso.
Cómo usar Pandas unique()
Para utilizar unique()
en los DataFrames de Pandas, debes especificar la columna en la que quieres buscar valores únicos.
En el siguiente ejemplo te mostramos un DataFrame con información sobre diferentes personas:
import pandas as pd
# Crear un DataFrame de ejemplo
data = {
'Nombre': ['Alicia', 'Juan', 'Carlos', 'David', 'Eduardo'],
'Edad': [24, 27, 22, 32, 29],
'Ciudad': ['Madrid', 'Barcelona', 'Madrid', 'Valencia', 'Barcelona']
}
df = pd.DataFrame(data)
print(df)
pythonEl DataFrame resultante sería el siguiente:
Nombre Edad Ciudad
0 Alicia 24 Madrid
1 Juan 27 Barcelona
2 Carlos 22 Madrid
3 David 32 Valencia
4 Eduardo 29 Barcelona
Ahora, si quieres identificar las ciudades en las que viven estas personas, asegurándote de que cada ciudad solo se liste una vez, puedes utilizar la función unique()
de Pandas en la columna del DataFrame que contiene las ciudades:
# Encontrar ciudades únicas
unique_cities = df['Ciudad'].unique()
print(unique_cities)
pythonEl resultado es un array de NumPy que contiene cada ciudad una sola vez y que muestra que las personas de la lista provienen de tres ciudades diferentes: Madrid, Barcelona y Valencia.
['Madrid' 'Barcelona' 'Valencia']