Skip to content
View BINTOUDIOP's full-sized avatar
  • LILLE

Block or report BINTOUDIOP

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don't include any personal information such as legal names or email addresses. Markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
BINTOUDIOP/README.md

Bintou DIOP

Data Scientist / MLOps Engineer


🚀 À propos

Je travaille sur la chaîne complète de la donnée : de l'analyse statistique à la mise en production de modèles (MLOps). Ma particularité est d'intégrer les enjeux de conformité RGPD et les standards de l'ANSSI dès la conception des projets, grâce à mon diplôme de DPO.

Côté technique, je développe des outils interactifs (Streamlit, Chainlit) et j'utilise les infrastructures Cloud (Azure, GCP) pour rendre mes modèles accessibles et scalables. Compétences clés : Modélisation prédictive, RAG (Retrieval-Augmented Generation), Containerisation.


🛠️ Stack technique

Catégorie Outils et frameworks
Data Science & Big Data Python, SQL, PySpark, Pandas, Statsmodels, SAS
AI & LLM Orchestration LangChain, LangGraph, RAG, OpenAI API, ChromaDB (Vector DB)
Web Apps & Dashboards Streamlit, Chainlit, Flask, PowerBI, Tableau
MLOps & Cloud Docker, MLflow, Azure, Google Cloud (GCP), AWS, OVHCloud
Gouvernance & Sécurité Certifiée DPO, Conformité RGPD, Standards CNIL / ANSSI

📂 Projets stratégiques

Problématique : Extraire et analyser des informations complexes dans des rapports financiers.

  • Valeur ajoutée : Création d'un agent capable de raisonner et de croiser des données textuelles et numériques.
  • Impact : Réduction du temps de recherche d'informations stratégiques.

Problématique : Prédire les risques de défaut de paiement de manière industrielle.

  • Valeur ajoutée : Mise en place d'un pipeline complet (Suivi d'expériences -> API Flask -> Container Docker -> Cloud Azure).
  • Impact : Garantie de reproductibilité et de scalabilité du modèle en production.

Problématique : Identifier les facteurs critiques de pollution atmosphérique.

  • Valeur ajoutée : Analyse de données multi-villes et modélisation prédictive haute précision (R² > 0.8).
  • Impact : Identification visuelle des polluants les plus impactants pour aider à la prise de décision environnementale.

Pinned Loading

  1. BINTOUDIOP BINTOUDIOP Public

    Je construis des projets data de l'analyse au déploiement avec une expertise sur les enjeux RGPD.

  2. Projet_GenAI Projet_GenAI Public

    Agent conversationnel multi-compétences orchestré par LangGraph. Intègre RAG pour les documents financiers, Recherche Web (Tavily), Calcul et Gestion de Calendrier, exposé via Chainlit et déployé s…

    Python

  3. Projet_MLOPS Projet_MLOPS Public

    Projet MLOps sur données bancaires : pipeline complet de machine learning avec exploration, prétraitement, modélisation, suivi MLflow et déploiement CI/CD. Illustre traçabilité, reproductibilité et…

    Jupyter Notebook

  4. Prediction_du_diabete Prediction_du_diabete Public

    Prediction du diabète avec Random Forest Classifier.

    Jupyter Notebook

  5. Global-Air-Quality Global-Air-Quality Public

    Analyse exploratoire et modélisation prédictive de l'indice de qualité de l'air (AQI) dans 6 grandes villes mondiales.

    Jupyter Notebook

  6. supermarche-ventes-prediction supermarche-ventes-prediction Public

    Prévision de vente sur plusieurs magasins de Favorita sur un large volume de données.

    Jupyter Notebook 1