Pandas DataFrame[].unique(): Einzigartige Werte ermitteln

IONOS Redaktion27.08.20242 mins

Sie können bei Python Pandas DataFrames die unique()-Funktion nutzen, um die eindeutigen Werte in einer Spalte eines DataFrames zu ermitteln. So können Sie sich effizient eine Übersicht der verschiedenen Werte innerhalb eines Datensatzes verschaffen.

Webhosting

Top-Hosting für Ihre Website

Flexibel: Hosting, das jedem Website-Traffic standhält
Verlässlich: Inklusive 24/7-Support und persönlicher Beratung
Sicher: Kostenloses SSL-Zertifikat, DDoS-Schutz und Backups

Syntax von Pandas `DataFrame[].unique()`

Die grundlegende Syntax für die Anwendung von Pandas unique() ist einfach, denn die Funktion nimmt keinerlei Parameter entgegen:

DataFrame['column_name'].unique()

python

Beachten Sie, dass bei Pandas DataFrames unique() nur auf eine spezifische Spalte des DataFrames angewendet werden kann. Diese müssen Sie also zuvor spezifizieren. Die unique()-Funktion liefert Ihnen ein numpy-Array mit den einzigartigen Werten in der Reihenfolge ihres Erscheinens zurück; eine Sortierung der Werte findet nicht statt.

Hinweis

Wenn Sie sich schon länger mit Python-Programmierung beschäftigen, kennen Sie sicher auch das numpy-Äquivalent zu Pandas unique()-Funktion. Eine Anwendung der Pandas-Variante ist aus Effizienzgründen vorzuziehen.

Anwendung von Pandas `unique()`

Auf Pandas DataFrames kann unique() dann genutzt werden, wenn Sie zuvor eine Spalte spezifizieren, in der nach eindeutigen Werte gesucht werden soll.

Im folgenden Beispiel betrachten wir einen DataFrame mit Informationen über verschiedene Personen.

import pandas as pd
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Edward'],
    'Alter': [24, 27, 22, 32, 29],
    'Stadt': ['New York', 'Los Angeles', 'New York', 'Chicago', 'Los Angeles']
}
df = pd.DataFrame(data)
print(df)

python

Der resultierende DataFrame sieht wie folgt aus:

Name  Alter      Stadt
0    Alice     24     New York
1    Bob     27  Los Angeles
2  Charlie     22     New York
3    David     32    Chicago
4   Edward     29  Los Angeles

Es sollen nun die Städte ermittelt werden, in denen diese Personen leben. Hierbei soll jede Stadt nur ein einziges Mal gelistet werden. Pandas unique()-Funktion wird hierzu auf der Spalte des DataFrames angewendet, die die Städte enthält:

# Eindeutige Städte finden
unique_cities = df['Stadt'].unique()
print(unique_cities)

python

Die Ausgabe ist ein numpy-Array, der jede Stadt ein Mal enthält. Dies zeigt, dass die Personen aus drei verschiedenen Städten stammen: New York, Los Angeles und Chicago.

['New York' 'Los Angeles' 'Chicago']

War dieser Artikel hilfreich?

Pandas Table: DataFrames als Tabellen formatieren

Das Anzeigen eines Python Pandas DataFrame als Table ist eine essenzielle Aufgabe, die auf viele verschiedene Arten gelöst werden kann, je nach den Anforderungen. Ob einfache Konsolenausgabe, formatierte HTML-Tabelle oder Visualisierung in Standardformaten – es gibt eine breite…

Python Pandas

Pandas loc[]: Daten aus DataFrames auswählen

Die Pandas-DataFrame-Eigenschaft loc[] bietet die Möglichkeit, Daten basierend auf Labels zu extrahieren. Sie ist besonders nützlich für die Arbeit mit Daten, bei denen die Position von Zeilen und Spalten nicht immer vorhersehbar ist. Erfahren Sie in diesem Artikel, wie Sie loc[]…

Python Pandas

BEST-BACKGROUNDSShutterstock

Pandas iterrows(): So iterieren Sie über DataFrames

Pandas DataFrame.iterrows() ist eine Möglichkeit, um über die Zeilen eines DataFrames zu iterieren. Sie wird insbesondere dann eingesetzt, wenn eine zeilenweise Verarbeitung erforderlich ist, zum Beipsiel bei der Durchführung von Berechnungen. Erfahren Sie hier, wie Sie mit der…

Python Pandas

Mr. Kosalshutterstock

Pandas: DataFrame Index verstehen

Die Indexierung von Pandas DataFrames ist ein leistungsstarkes Werkzeug, um effizient und effektiv mit Daten zu arbeiten. Mit verschiedenen Methoden können Sie gezielt auf Daten und Teilmengen Ihres DataFrames zugreifen, um sie zu bearbeiten. Wir zeigen Ihnen, was genau der…

Python Pandas

Datenbereinigung mit Pandas dropna()

Die Pandas-DataFrame.dropna()-Funktion ist ein mächtiges Werkzeug zur Bereinigung von Datensätzen, indem sie fehlende Werte effizient entfernt. Sie bietet Flexibilität durch verschiedene Parameter, wodurch Programmierende spezifische Anforderungen an die Datenreinigung stellen…

Python Pandas

Ranjit Karmakarshutterstock

Pandas DataFrame describe() im Überblick

Die Pandas-DataFrame.describe()-Methode bietet eine schnelle Möglichkeit, eine umfassende statistische Zusammenfassung numerischer Daten in einem DataFrame zu generieren. Durch die Möglichkeit, Quantile anzupassen und Datentypen zu spezifizieren, ist sie äußerst flexibel und für…

Python Pandas

Pandas DataFrame[].unique(): Einzigartige Werte ermitteln

Syntax von Pandas DataFrame[].unique()

Anwendung von Pandas unique()

Inhaltsverzeichnis

Syntax von Pandas `DataFrame[].unique()`

Anwendung von Pandas `unique()`