Présentation
Modibo DIABATÉ
Titulaire d'un Doctorat de Mathématiques Appliquées - Statistique de l'Université Grenoble Alpes, je suis ingénieur de recherche et développement (R&D) en Science des données (Statistique, Intelligence Artificielle (IA), Big Data) et ingénieur de données (certifié sur Microsoft Azure) dans un grand groupe industriel européen.
Auparavant, j'ai été Enseignant Chercheur et R&D en Intelligence Artificielle à l'Institut Supérieur de l'Electronique et du Numérique (ISEN Yncréa) Méditerranée au sein de l'équipe pluridisciplinaire Software Development de l'ISEN en tant que leader technique en IA.
Avant l'ISEN, j'ai été Enseignant Chercheur contractuel (ATER) à Grenoble INP ENSIMAG et Chercheur postdoctoral au Laboratoire MAP5 à l'Université de Paris.
Aperçu général de mes activités
Recherche et Développement (R&D)
Domaines de compétences techniques :
Data Science & Modélisation mathématique
Modélisation Probabiliste : modèles de dynamique des populations (équations différentielles stochastiques), simulation numérique
Statistique inférentielle & computationnelle : modèles de régression non linéaires à effets mixtes (NLMEM), algorithme EM et variantes (SAEM, maxEM, ...), calcul de segmentation (max-EM), Algorithme Forward Backward / Expectation Propagation - Belief Propagation, analyse de survie, tests d'hypothèses, réduction de dimension (ACP, t-SNE, UMAP)
Intelligence Artificielle (Machine Learning / Deep Learning) : classification (sons, images, etc.), détection d'anomalies & maintenance prédictive, IA embarquée, traitement automatique du langage naturel (NLP) & analyse de données séquentielles (Transformers & modèles larges de langages (LLM)), industrialisation de modèles d'IA (mlflow/Databricks)
Data engineering & Data analyse : ETL / ELT from scratch en R et Python, Data Engineering sur Microsoft Azure (Data Factory, Synapse Analytics, Databricks, Stream Analytics, PySpark, SQL) et sur Talend Open Studio, Data visualization & Analytics from scratch (R, Python) et avec Orange Data mining et Power BI
Autres : Web sémantique (graphes RDF, SPARQL, ontologies, etc.), applications Java (Spring boot & Postman), cryptographie, IVVQ (tests IHM et fonctionnels automatisés)
Principaux domaines d'application : Smart Energy, microélectronique, IoT, santé & biologie (e-santé, santé publique, cancer, génétique, épidémiologie, etc.), économie / social, défense, aviation, ...
Enseignement
Probabilités appliquées : expériences aléatoires, variables aléatoires, mesure de probabilité, moments d'une variable aléatoire, fonction de répartition, densité de probabilité, lois usuelles, probabilités totales, etc.
Statistique descriptive : graphiques de visualisation statistique, calcul d'indicateurs statistiques standards, analyse de corrélation, analyse en composante principale (ACP)
Statistique inférentielle : population / échantillon, convergences, loi des grands nombres, théorème de la limite centrale, estimation ponctuelle, intervalles de confiance, tests d'hypothèse statistique, méthode des moindres carrés, méthodes du maximum de vraisemblance, notion d'entropie croisée, méthode des moments, propretés, d'un estimateur statistique, etc.
Statistique bayésienne : théorème de Bayes, loi a priori / loi a posteriori, méthodes de Monte-Carlo par Chaînes de Markov (MCMC), algorithme de Metropolis Hastings / échantillonneur de Gibbs, etc.
Data Science / Intelligence Artificielle / Machine Learning / Deep Learning : régression linéaire simple / multiple, régression logistique simple / multiple, Naive Bayes, analyse discriminante linéaire (LDA), k plus proches voisins (k-NN), k-means, arbre de décision & forêt aléatoire, SVM, Perceptron, Multilayer Perceptron (MLP) & Dense Neural Networks (DNN), Convolutional Neural Network (CNN), YOLO, Reccurent Neural Network (RNN, LSTM, GRU, BiLSTM), Mécanismes d'attention & Transformers, Natural Language Processing (NLP) & modèles larges de langages (LLM)
Optimisation mathématique & Optimisation pour le Machine Learning : théorie de l'optimisation numérique (lagrangien, conditions KKT, etc.), l'algorithme de descente de gradient et variantes stochastiques
Langages de programmation enseignés : Python, Java, R, C++
Evènements récents
Salons / Rencontres :
Salon Big Data & AI Paris 2023, Modibo DIABATE, Ingénieur R&D Data Science et Intelligence Artificielle
Rencontre Pôle SCS, mars 2022, à Chalucet, Toulon : "Utilisation de techniques d'auto-apprentissage dans le cadre de l'optimisation de la consommation électrique", Dr Modibo DIABATE, Enseignant Chercheur en Intelligence Artificielle (IA) et Anais GALLIGANI, Responsable Smart Energy, Yncréa Méditerranée
Productions scientifiques / techniques récentes
Principal Projet de recherche fondamentale en cours :
Projet R&D récent :
InterConnect (Interoperable solutions connecting smart homes, buildings and grids), au sein de l'équipe Software Development & IA de l'ISEN Yncréa Méditerranée, 2021-2022
Publications récentes :
AI-Optimized Demand Response: Enhancing Electricity Efficiency in Build- ings. Sampath Mukherjee, Johan Krumps, Sylvain Rival, Anthony Bi- can, Anaïs Galligan, Florian Sananes, Théa Gutmacher, Youssef Dahman, Alex Barnadas i Morera, Modibo Diabate [V. AI framework for French and Greek pi- lot], David Bouret, Maria Perez, Ghislain Oudinet. 2024.ResearchGate (DOI:10.13140/RG.2.2.27805.28644)
Parameter estimation and treatment optimization in a stochastic model for immunotherapy of cancer. M. Diabate, L. Coquille and A. Leclercq-Samson. 2019. Journal of Theoretical Biology