Skip to content

MedDataMuse/Machine_learning

Repository files navigation

Machine Learning supervisĂ© — RĂ©gression & Classification (Python / scikit-learn)

Ce dĂ©pĂŽt contient deux scripts Python complets et reproductibles illustrant une mise en Ɠuvre rigoureuse du machine learning supervisĂ©, en rĂ©gression et en classification, avec :

préparation des données propre,

pénalisations (LASSO, Ridge, Elastic Net),

validation croisée interne + externe,

prĂ©dictions honnĂȘtes (out-of-sample),

métriques finales globales.

📌 Script 1 — RĂ©gression supervisĂ©e (ML_regression_supervisee.py)

🎯 Objectif

🧠 Comparer plusieurs modĂšles de rĂ©gression linĂ©aire pĂ©nalisĂ©e sur le jeu de donnĂ©es Ozone, en respectant une validation croisĂ©e externe stricte.

đŸ§Ș ModĂšles implĂ©mentĂ©s

MCO (régression linéaire classique)

LASSO

Ridge

Elastic Net (α = 0.5)

🔁 MĂ©thodologie

Encodage des variables catégorielles (dummies)

Standardisation apprise uniquement sur le train

Validation croisée interne pour le choix des hyperparamÚtres

Validation croisĂ©e externe (10 blocs) pour des prĂ©dictions honnĂȘtes

Agrégation finale des prédictions

📊 Évaluation

RMSE globale calculĂ©e sur l’ensemble des prĂ©dictions out-of-sample

Sauvegarde :

PREV_regression_base.csv → toutes les prĂ©dictions

perf_regression_base.csv → tableau de performance

📌 Script 2 — Classification supervisĂ©e (ML_classification_supervisee.py)

🎯 Objectif

Comparer plusieurs variantes de régression logistique pénalisée sur le jeu de données SAheart (maladie coronarienne).

đŸ§Ș ModĂšles implĂ©mentĂ©s

Logistique non pénalisée

Logistique LASSO

Logistique Ridge

Logistique Elastic Net

🔁 MĂ©thodologie

Construction de la matrice de design via patsy

Standardisation intégrée dans des Pipeline

Validation croisée interne pour le choix de λ

Validation croisĂ©e externe (10 blocs) pour des probabilitĂ©s honnĂȘtes

Grilles de pénalisation construites de maniÚre contrÎlée

📊 Évaluation

AUC globale calculée sur toutes les observations

Sauvegarde :

PROB_classif.csv → probabilitĂ©s prĂ©dites

perf_classif.csv → AUC par modùle

About

My ML projects

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published