- [x] Intro - [x] 1er chapitre : Cas simple MLFlow (scikit learn auto log) - [x] 2eme chapitre : Cas métier sur APE (class custom) - [x] Contextualisation / Problématique - [x] Présentation data - [x] Class custom / différence autolog - [x] 3eme chapitre : - [x] Déploiement local puis FastAPI - [x] Déploiement Kubernetes (manuel) - [ ] Déploiement Kubernetes automatisé (ArgoCD) @ThomasFaria - [x] 4eme chapitre : Entrainement/optimisation distribué (argo workflow) - [ ] 5eme chapitre : ML en production - [x] Quelle organisation ? - [ ] Monitoring / observability : quelles métriques ? - [ ] Métier : training-prod skew, data drift, model drift - [x] (Software : logging API, resources use, latence, ...) - [x] Construire la chaîne de traitement des logs - [x] Implémenter le logging pertinent dans le code applicatif (métriques métiers..) @ThomasFaria - [x] Envoyer les logs sur S3 @avouacr - [x] ETL pour construire des parquets partitionnés par date @avouacr - [x] Dashboard avec Superset/Redash @tomseimandi - [ ] Aller plus loin - [ ] Réentraînements
Intro
1er chapitre : Cas simple MLFlow (scikit learn auto log)
2eme chapitre : Cas métier sur APE (class custom)
3eme chapitre :
4eme chapitre : Entrainement/optimisation distribué (argo workflow)
5eme chapitre : ML en production
Aller plus loin