Pandas mean(): Mittelwerte ganz unkompliziert berechnen

Inhaltsverzeichnis

Die DataFrame.mean()-Funktion in Python Pandas ist dein Werkzeug zur Berechnung des Mittelwerts über verschiedene Achsen eines DataFrames. Mit Pandas mean() analysierst du numerische Daten effizient und erhältst sofort klare Einblicke in deren Verteilung.

Syntax von Pandas `DataFrame.mean()`

Die Anwendung der Pandas-mean()-Funktion ist unkompliziert und arbeitet mit bis zu drei Parametern:

DataFrame.mean(axis=None, skipna=True, numeric_only=None)

python

Relevante Parameter

Passe Pandas DataFrame.mean() mit diesen Parametern einfach an dein Projekt an:

Parameter	Beschreibung	Standardwert
`axis`	Legt fest, ob die Berechnung über Zeilen (`axis=0`) oder Spalten (`axis=1`) erfolgt.	`0`
`skipna`	Bei `True` werden NaN-Werte in der Analyse ignoriert.	`True`
`numeric_only`	Bei `True` fließen nur numerische Datentypen in das Ergebnis ein.	`False`

So nutzt du die Pandas `mean()`-Funktion

Es gibt verschiedene Wege, wie du Pandas DataFrame.mean() sinnvoll einsetzen kannst.

Mittelwerte für jede Spalte ermitteln

Für die folgenden Beispiele nutzen wir einen Pandas-DataFrame mit diesen Testdaten:

import pandas as pd
data = {
    'A': [1, 2, 3, 4],
    'B': [4, 5, 6, 7],
    'C': [7, 8, 9, 10]
}
df = pd.DataFrame(data)
print(df)

python

Daraus ergibt sich dieser DataFrame:

A  B    C
0  1  4    7
1  2  5    8
2  3  6    9
3  4  7  10

Willst du den Durchschnitt pro Spalte wissen, nutzt du die Pandas-mean()-Funktion einfach mit dem Standardwert axis=0:

column_means = df.mean()
print(column_means)

python

Hierbei werden die Werte der Spalten A, B und C summiert und durch die Anzahl der Einträge dividiert. Das Ergebnis erhältst du als Pandas Series:

A    2.5
B    5.5
C    8.5
dtype: float64

Durchschnittswerte pro Zeile berechnen

Möchtest du stattdessen den Schnitt für jede Zeile berechnen, setzt du den Parameter axis auf 1:

row_means = df.mean(axis=1)
print(row_means)

python

Durch Pandas mean() wird für jede Zeile die Summe der Elemente durch deren Anzahl geteilt. Der Output sieht dann so aus:

0    4.0
1    5.0
2    6.0
3    7.0
dtype: float64

Umgang mit NaN-Werten

In diesem Beispiel arbeiten wir mit einem DataFrame, der fehlende Werte (NaN) enthält:

import pandas as pd
import numpy as np
data = {
    'A': [1, 2, np.nan, 4],
    'B': [4, np.nan, 6, 7],
    'C': [7, 8, 9, np.nan]
}
df = pd.DataFrame(data)
print(df)

python

Daraus entsteht folgender DataFrame:

A    B    C
0  1.0  4.0  7.0
1  2.0  NaN  8.0
2  NaN  6.0  9.0
3  4.0  7.0  NaN

Mit dem Parameter skipna steuerst du, wie mit Lücken umgegangen wird. Standardmäßig ist dieser auf True eingestellt, wodurch Pandas mean() diese Werte einfach auslässt. Würdest du hier skipna=False wählen, wäre das Ergebnis für jede Spalte mit einer Lücke ebenfalls NaN.

mean_with_nan = df.mean()
print(mean_with_nan)

python

Das Ergebnis der Abfrage mit Pandas mean() lautet:

A    2.333333
B    5.666667
C    8.000000
dtype: float64

Pandas-DataFrames mit merge() effizient zusammenführen

Mit der merge()-Funktion von Pandas bündelst du als Programmierer:in flexibel Daten aus unterschiedlichsten Quellen. Nutze die Parameter gezielt für diverse Joins, um deine Analysen auf das nächste Level zu heben. Wir zeigen dir in diesem Guide, wie du merge() richtig einsetzt,…

Mr. Kosalshutterstock

Lücken schließen: NaN-Werte mit Pandas fillna() bereinigen

Die Pandas-Funktion fillna() hilft dir dabei, fehlende Werte in Datensätzen professionell zu handhaben. Dank vielseitiger Parameter ersetzt du NaN-Werte flexibel nach deinen Vorstellungen, damit deine Projekte glatt laufen. Erfahre hier, welche Optionen dir zur Verfügung stehen…

Pandas isna(): So spürst du jede Datenlücke souverän auf

Mit der isna()-Funktion spürst du Datenlücken in deinem DataFrame ruckzuck auf. Die simple Anwendung verschafft dir sofort Durchblick bei fehlenden Werten, damit die Datenbereinigung glatt läuft. Hier erfährst du, wie du Pandas isna() clever einsetzt und dein Projekt sicher auf…

BEST-BACKGROUNDSShutterstock

So filterst du DataFrames mit Pandas isin()

Die Pandas isin()-Funktion ist dein Ass im Ärmel für jede Datenanalyse. Mit ihrer intuitiven Logik checkst du im Handumdrehen, ob gewünschte Werte in deinem DataFrame landen. Ganz egal, ob du Spalten filterst oder komplexe Dictionary-Abfragen startest: Mit diesem Tool laufen…

NDAB Creativityshutterstock

So meisterst du Pandas groupby()

Mit der Pandas-Funktion DataFrame.groupby() sortierst du Datenbestände nach deinen Wünschen und erledigst anspruchsvolle Zusammenfassungen im Handumdrehen. Die richtige Anwendung macht deine Auswertungen nicht nur schneller, sondern sorgt auch für die nötige Klarheit. Hier liest…

UndreyShutterstock

Pandas DataFrame[].unique(): Eindeutige Werte finden

Mit Pandas DataFrame[].unique() spürst du Unikate in deinen Datensätzen blitzschnell auf. Das ist der ideale Weg, um Doppeltes zu finden und deine Tabellen sauber zu halten. Dank der Ausgabe als Numpy-Array verarbeitest du selbst große Datenmengen völlig reibungslos. Lies weiter…

Pandas mean(): Mit­tel­wer­te ganz un­kom­pli­ziert berechnen

Syntax von Pandas DataFrame.mean()

Relevante Parameter

So nutzt du die Pandas mean()-Funktion

Mit­tel­wer­te für jede Spalte ermitteln

Durch­schnitts­wer­te pro Zeile berechnen

Umgang mit NaN-Werten

Pandas mean(): Mittelwerte ganz unkompliziert berechnen

Syntax von Pandas `DataFrame.mean()`

So nutzt du die Pandas `mean()`-Funktion

Mittelwerte für jede Spalte ermitteln

Durchschnittswerte pro Zeile berechnen