Pandas loc[]: So filterst du deine DataFrames präzise
Pandas DataFrame.loc[] ist ein praktisches Feature der Python-Pandas-Bibliothek. Damit wählst du Daten aus einem DataFrame ganz einfach über Bezeichner (Labels) aus. So lassen sich Zeilen und Spalten gezielt für deine Projekte extrahieren.
Die Syntax von Pandas loc[]
Du übergibst loc[] lediglich die gewünschte Auswahl der Labels als Parameter. Der Aufbau ist dabei denkbar simpel:
DataFrame.loc[selection]pythonDie Auswahl erfolgt bei Pandas loc[] primär über die Labels. Dabei kannst du ein einzelnes Label, eine Liste oder einen Bereich (Slice) von Labels angeben. Auch das Filtern über Boolesche Arrays ist möglich.
Unterschiede: loc[] vs. iloc[]
Während Pandas DataFrame.loc[] auf Labels setzt, nutzt du DataFrame.iloc, wenn du Daten anhand ihrer numerischen Position (Integer-basiert) ansprechen willst.
Das folgende Beispiel verdeutlicht den Unterschied. Zuerst erstellen wir einen Pandas DataFrame:
import pandas as pd
# Beispiel DataFrame
data = {'Name': ['Anna', 'Bob', 'Chris'], 'Alter': [23, 35, 30]}
df = pd.DataFrame(data)
print(df)pythonSo sieht der erstellte DataFrame aus:
Name Alter
0 Anna 23
1 Bob 35
2 Chris 30