Pandas DataFrame[].unique(): Einzigartige Werte ermitteln

Sie können bei Python Pandas DataFrames die unique()-Funktion nutzen, um die eindeutigen Werte in einer Spalte eines DataFrames zu ermitteln. So können Sie sich effizient eine Übersicht der verschiedenen Werte innerhalb eines Datensatzes verschaffen.

Webhosting
Top-Hosting für Ihre Website
  • Flexibel: Hosting, das jedem Website-Traffic standhält
  • Verlässlich: Inklusive 24/7-Support und persönlicher Beratung
  • Sicher: Kostenloses SSL-Zertifikat, DDoS-Schutz und Backups

Syntax von Pandas DataFrame[].unique()

Die grundlegende Syntax für die Anwendung von Pandas unique() ist einfach, denn die Funktion nimmt keinerlei Parameter entgegen:

DataFrame['column_name'].unique()
python

Beachten Sie, dass bei Pandas DataFrames unique() nur auf eine spezifische Spalte des DataFrames angewendet werden kann. Diese müssen Sie also zuvor spezifizieren. Die unique()-Funktion liefert Ihnen ein numpy-Array mit den einzigartigen Werten in der Reihenfolge ihres Erscheinens zurück; eine Sortierung der Werte findet nicht statt.

Hinweis

Wenn Sie sich schon länger mit Python-Programmierung beschäftigen, kennen Sie sicher auch das numpy-Äquivalent zu Pandas unique()-Funktion. Eine Anwendung der Pandas-Variante ist aus Effizienzgründen vorzuziehen.

Anwendung von Pandas unique()

Auf Pandas DataFrames kann unique() dann genutzt werden, wenn Sie zuvor eine Spalte spezifizieren, in der nach eindeutigen Werte gesucht werden soll.

Im folgenden Beispiel betrachten wir einen DataFrame mit Informationen über verschiedene Personen.

import pandas as pd
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Edward'],
    'Alter': [24, 27, 22, 32, 29],
    'Stadt': ['New York', 'Los Angeles', 'New York', 'Chicago', 'Los Angeles']
}
df = pd.DataFrame(data)
print(df)
python

Der resultierende DataFrame sieht wie folgt aus:

Name  Alter      Stadt
0    Alice     24     New York
1    Bob     27  Los Angeles
2  Charlie     22     New York
3    David     32    Chicago
4   Edward     29  Los Angeles

Es sollen nun die Städte ermittelt werden, in denen diese Personen leben. Hierbei soll jede Stadt nur ein einziges Mal gelistet werden. Pandas unique()-Funktion wird hierzu auf der Spalte des DataFrames angewendet, die die Städte enthält:

# Eindeutige Städte finden
unique_cities = df['Stadt'].unique()
print(unique_cities)
python

Die Ausgabe ist ein numpy-Array, der jede Stadt ein Mal enthält. Dies zeigt, dass die Personen aus drei verschiedenen Städten stammen: New York, Los Angeles und Chicago.

['New York' 'Los Angeles' 'Chicago']
War dieser Artikel hilfreich?
Page top