GitHub - MedDataMuse/Machine_learning: My ML projects

Machine Learning supervisé — Régression & Classification (Python / scikit-learn)

Ce dépôt contient deux scripts Python complets et reproductibles illustrant une mise en œuvre rigoureuse du machine learning supervisé, en régression et en classification, avec :

préparation des données propre,

pénalisations (LASSO, Ridge, Elastic Net),

validation croisée interne + externe,

prédictions honnêtes (out-of-sample),

métriques finales globales.

📌 Script 1 — Régression supervisée (ML_regression_supervisee.py)

🎯 Objectif

🧠 Comparer plusieurs modèles de régression linéaire pénalisée sur le jeu de données Ozone, en respectant une validation croisée externe stricte.

🧪 Modèles implémentés

MCO (régression linéaire classique)

LASSO

Ridge

Elastic Net (α = 0.5)

🔁 Méthodologie

Encodage des variables catégorielles (dummies)

Standardisation apprise uniquement sur le train

Validation croisée interne pour le choix des hyperparamètres

Validation croisée externe (10 blocs) pour des prédictions honnêtes

Agrégation finale des prédictions

📊 Évaluation

RMSE globale calculée sur l’ensemble des prédictions out-of-sample

Sauvegarde :

PREV_regression_base.csv → toutes les prédictions

perf_regression_base.csv → tableau de performance

📌 Script 2 — Classification supervisée (ML_classification_supervisee.py)

🎯 Objectif

Comparer plusieurs variantes de régression logistique pénalisée sur le jeu de données SAheart (maladie coronarienne).

🧪 Modèles implémentés

Logistique non pénalisée

Logistique LASSO

Logistique Ridge

Logistique Elastic Net

🔁 Méthodologie

Construction de la matrice de design via patsy

Standardisation intégrée dans des Pipeline

Validation croisée interne pour le choix de λ

Validation croisée externe (10 blocs) pour des probabilités honnêtes

Grilles de pénalisation construites de manière contrôlée

📊 Évaluation

AUC globale calculée sur toutes les observations

Sauvegarde :

PROB_classif.csv → probabilités prédites

perf_classif.csv → AUC par modèle

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
Ml_classification_supervisee_gradientboost.ipynb		Ml_classification_supervisee_gradientboost.ipynb
Ml_regression_supervisee.ipynb		Ml_regression_supervisee.ipynb
README.md		README.md
SAheart.data		SAheart.data
choixglmstats.py		choixglmstats.py
choixolsstats.py		choixolsstats.py
logistic_step_sk.py		logistic_step_sk.py
ols_step_sk.py		ols_step_sk.py
ozone.txt		ozone.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Machine Learning supervisé — Régression & Classification (Python / scikit-learn)

📌 Script 1 — Régression supervisée (ML_regression_supervisee.py)

🎯 Objectif

🧪 Modèles implémentés

📌 Script 2 — Classification supervisée (ML_classification_supervisee.py)

About

Uh oh!

Releases

Packages

Languages

MedDataMuse/Machine_learning

Folders and files

Latest commit

History

Repository files navigation

Machine Learning supervisé — Régression & Classification (Python / scikit-learn)

📌 Script 1 — Régression supervisée (ML_regression_supervisee.py)

🎯 Objectif

🧪 Modèles implémentés

📌 Script 2 — Classification supervisée (ML_classification_supervisee.py)

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages