Pandas loc[]: Daten aus DataFrames auswählen

Inhaltsverzeichnis

Pandas DataFrame.loc[] ist eine DataFrame-Eigenschaft in der Python-Pandas-Bibliothek, die dazu dient, Daten aus einem DataFrame basierend auf Bezeichnern (Labels) auszuwählen. So können Zeilen und Spalten eines DataFrames gezielt extrahiert werden.

Webhosting

Das beste Webhosting zum Spitzenpreis

3x schneller und 60 % günstiger
Maximale Verfügbarkeit mit > 99.99 %
Nur bei IONOS: Bis zu 500 GB Speicherplatz inklusive

Syntax von Pandas `loc[]`

Man übergibt loc[] als Parameter die gewünschte Labelauswahl. Ansonsten ist die Syntax sehr einfach:

DataFrame.loc[selection]

python

Bei Pandas loc[] wird die Auswahl vorrangig basierend auf Labeln vorgenommen. Der übergebene Parameter kann daher ein einzelnes Label, eine Liste oder ein Slice von Labeln sein. Doch auch Boolesche Arrays können genutzt werden.

`loc[]` vs. `iloc[]`

Während Pandas DataFrame.loc[] Daten basierend auf Labels auswählt, wird das ähnlich klingende DataFrame.iloc verwendet, um Daten basierend auf Integer-basierten Positionen auszuwählen.

Folgendes Codebeispiel hilft zur Veranschaulichung der Unterschiede. Zunächst wird ein Pandas DataFrame erstellt:

import pandas as pd
# Beispiel DataFrame
data = {'Name': ['Anna', 'Bob', 'Chris'], 'Alter': [23, 35, 30]}
df = pd.DataFrame(data)
print(df)

python

Der resultierende DataFrame sieht wie folgt aus:

Name  Alter
0   Anna     23
1    Bob     35
2  Chris     30

Um nun „Anna“ aus dem DataFrame zu extrahieren, können sowohl Pandas loc[] als auch iloc[] genutzt werden. Das Ergebnis ist dasselbe, der Weg dahin unterscheidet sich aber:

# Mit loc nach Label
print(df.loc[0, 'Name'])  # Ausgabe: 'Anna'
# Mit iloc nach Position
print(df.iloc[0, 0])  # Ausgabe: 'Anna'

python

Anwendung von Pandas `DataFrame.loc[]`

Pandas loc[] hilft Ihnen dabei, Teilmengen Ihres DataFrames zu extrahieren. Hierbei kann es sich um einzelne oder mehrere Zeilen bzw. Spalten handeln – mit loc[] können verschiedene Anwendungsfälle umgesetzt werden.

Auswahl einer einzelnen Zeile

Im Folgenden wird ein Beispiel-DataFrame mit den folgenden Daten betrachtet:

import pandas as pd
data = {
    'Name': ['Anna', 'Bob', 'Chris'],
    'Alter': [23, 35, 30],
    'Stadt': ['Berlin', 'Hamburg', 'München']
}
df = pd.DataFrame(data)
print(df)

python

Der resultierende DataFrame sieht wie folgt aus:

Name  Alter    Stadt
0   Anna     23   Berlin
1    Bob     35  Hamburg
2  Chris     30  München

Um die Daten der Zeile mit dem Index 1 auszuwählen (entspricht Bob), kann Pandas loc[] verwendet werden:

bob_data = df.loc[1]
print(bob_data)

python

Das Resultat ist wie erwartet:

Name         Bob
Alter         35
Stadt    Hamburg
Name: 1, dtype: object

Auswahl mehrerer Spalten

Auch für die Auswahl einer Untermenge an Spalten eignet sich DataFrame.loc[]. Folgender Code wählt die Spalten „Name“ und „Stadt“ für alle Zeilen aus:

name_stadt = df.loc[:, ['Name', 'Stadt']]
print(name_stadt)

python

Als Ergebnis erhält man eine Untermenge des ursprünglichen DataFrames:

Name    Stadt
0   Anna   Berlin
1    Bob  Hamburg
2  Chris  München

Bedingte Auswahl

Mit Pandas loc[] ist es ebenfalls möglich, Zeilen basierend auf einer Bedingung auswählen. Hierzu werden einfach Boolesche Vergleichsoperatoren eingesetzt. Im folgenden Code sollen zum Beispiel alle Personen, die älter als 25 Jahre sind, gefiltert werden:

older_than_25 = df.loc[df['Alter'] > 25]
print(older_than_25)

python

Der obige Codeschnipsel liefert folgenden DataFrame, der nur noch die Daten derjenigen Personen enthält, die älter als 25 sind:

Name  Alter    Stadt
1    Bob     35  Hamburg
2  Chris     30  München

10 Jahre Digital Guide: Eine Erfolgsgeschichte

KI-Wissen für Ihren Erfolg

Unser Newsletter bringt Ihnen die wichtigsten Insights rund um KI – verständlich, praxisnah und auf den Punkt.

Pandas DataFrame: In Python Tabellen schnell und übersichtlich manipulieren!

Das Pandas-Modul ist eines der mächtigsten Werkzeuge zur Datenmanipulation in Python. Eine der zentralen Datenstrukturen in Pandas ist der DataFrame. Mit DataFrames kann man zweidimensionale, strukturierte Daten effizient und übersichtlich manipulieren. Wir erklären Ihnen anhand…

Python Pandas

Mr. Kosalshutterstock

Pandas: DataFrame Index verstehen

Die Indexierung von Pandas DataFrames ist ein leistungsstarkes Werkzeug, um effizient und effektiv mit Daten zu arbeiten. Mit verschiedenen Methoden können Sie gezielt auf Daten und Teilmengen Ihres DataFrames zugreifen, um sie zu bearbeiten. Wir zeigen Ihnen, was genau der…

Python Pandas

BEST-BACKGROUNDSShutterstock

Pandas iterrows(): So iterieren Sie über DataFrames

Pandas DataFrame.iterrows() ist eine Möglichkeit, um über die Zeilen eines DataFrames zu iterieren. Sie wird insbesondere dann eingesetzt, wenn eine zeilenweise Verarbeitung erforderlich ist, zum Beipsiel bei der Durchführung von Berechnungen. Erfahren Sie hier, wie Sie mit der…

Python Pandas

ra2 studioShutterstock

Pandas Table: DataFrames als Tabellen formatieren

Das Anzeigen eines Python Pandas DataFrame als Table ist eine essenzielle Aufgabe, die auf viele verschiedene Arten gelöst werden kann, je nach den Anforderungen. Ob einfache Konsolenausgabe, formatierte HTML-Tabelle oder Visualisierung in Standardformaten – es gibt eine breite…

Python Pandas

Mr. Kosalshutterstock

Python Pandas any() im Überblick

Die Methode Pandas DataFrame any() ist ein effizientes Werkzeug, um schnell zu prüfen, ob in einer bestimmten Achse eines DataFrames mindestens ein True-Wert vorhanden ist. Sie ist besonders hilfreich bei der Analyse und Validierung von Daten. Wir zeigen Ihnen, wie Sie die…

Python Pandas

Ranjit Karmakarshutterstock

Pandas DataFrame describe() im Überblick

Die Pandas-DataFrame.describe()-Methode bietet eine schnelle Möglichkeit, eine umfassende statistische Zusammenfassung numerischer Daten in einem DataFrame zu generieren. Durch die Möglichkeit, Quantile anzupassen und Datentypen zu spezifizieren, ist sie äußerst flexibel und für…

Python Pandas

Pandas loc[]: Daten aus Da­ta­Frames auswählen

Syntax von Pandas loc[]

loc[] vs. iloc[]

Anwendung von Pandas DataFrame.loc[]

Auswahl einer einzelnen Zeile

Auswahl mehrerer Spalten

Bedingte Auswahl

Pandas loc[]: Daten aus DataFrames auswählen

Syntax von Pandas `loc[]`

`loc[]` vs. `iloc[]`

Anwendung von Pandas `DataFrame.loc[]`