-
Table des matières
-
-
-
-
-
-
-
-
Mesure | Définition | Code Pandas |
---|---|---|
Moyenne | Somme des valeurs ÷ nombre total | df["colonne"].mean() |
Médiane | Valeur centrale | df["colonne"].median() |
Mode | Valeur(s) la/les plus fréquente(s) | df["colonne"].mode() |
Ces mesures montrent comment les données sont réparties autour de la moyenne :
Mesure | Définition | Code Pandas |
---|---|---|
Variance | Moyenne des carrés des écarts | df["colonne"].var() |
Écart-type | Racine carrée de la variance | df["colonne"].std() |
Amplitude | Différence entre max et min | df["colonne"].max() - df["colonne"].min() |
Les histogrammes permettent de visualiser la fréquence des valeurs d’une variable.
Code d’exemple :
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv("donnees.csv")
df["revenu"].hist(bins=10)
plt.title("Distribution des revenus")
plt.xlabel("Revenu")
plt.ylabel("Fréquence")
plt.show()