Pandas DataFrame[].unique(): Einzigartige Werte ermitteln
Sie können bei Python Pandas DataFrames die unique()
-Funktion nutzen, um die eindeutigen Werte in einer Spalte eines DataFrames zu ermitteln. So können Sie sich effizient eine Übersicht der verschiedenen Werte innerhalb eines Datensatzes verschaffen.
- Flexibel: Hosting, das jedem Website-Traffic standhält
- Verlässlich: Inklusive 24/7-Support und persönlicher Beratung
- Sicher: Kostenloses SSL-Zertifikat, DDoS-Schutz und Backups
Syntax von Pandas DataFrame[].unique()
Die grundlegende Syntax für die Anwendung von Pandas unique()
ist einfach, denn die Funktion nimmt keinerlei Parameter entgegen:
Beachten Sie, dass bei Pandas DataFrames unique()
nur auf eine spezifische Spalte des DataFrames angewendet werden kann. Diese müssen Sie also zuvor spezifizieren. Die unique()
-Funktion liefert Ihnen ein numpy-Array mit den einzigartigen Werten in der Reihenfolge ihres Erscheinens zurück; eine Sortierung der Werte findet nicht statt.
Wenn Sie sich schon länger mit Python-Programmierung beschäftigen, kennen Sie sicher auch das numpy-Äquivalent zu Pandas unique()
-Funktion. Eine Anwendung der Pandas-Variante ist aus Effizienzgründen vorzuziehen.
Anwendung von Pandas unique()
Auf Pandas DataFrames kann unique()
dann genutzt werden, wenn Sie zuvor eine Spalte spezifizieren, in der nach eindeutigen Werte gesucht werden soll.
Im folgenden Beispiel betrachten wir einen DataFrame mit Informationen über verschiedene Personen.
Der resultierende DataFrame sieht wie folgt aus:
Es sollen nun die Städte ermittelt werden, in denen diese Personen leben. Hierbei soll jede Stadt nur ein einziges Mal gelistet werden. Pandas unique()
-Funktion wird hierzu auf der Spalte des DataFrames angewendet, die die Städte enthält:
Die Ausgabe ist ein numpy-Array, der jede Stadt ein Mal enthält. Dies zeigt, dass die Personen aus drei verschiedenen Städten stammen: New York, Los Angeles und Chicago.