Présentation
Modibo DIABATÉ
Détenteur d'un doctorat de Mathématiques Appliquées de l'Université Grenoble Alpes, je suis ingénieur R&D (recherche et développement) en Data Science (Statistique, Intelligence Artificielle (IA), Big Data) chez Thales.
Auparavant, j'ai été, de septembre 2021 à décembre 2022, Enseignant Chercheur et R&D en Intelligence Artificielle à l'Institut Supérieur de l'Electronique et du Numérique (ISEN Yncréa) Méditerranée au sein de l'équipe pluridisciplinaire Software Development de l'ISEN en tant que leader technique en IA.
Avant l'ISEN, j'ai été Chercheur postdoctoral au Laboratoire MAP5-Université de Paris (de septembre 2020 à Août 2021) et Enseignant Chercheur contractuel (ATER) à Grenoble INP ENSIMAG (de septembre 2019 à Août 2020) à la suite de ma thèse de doctorat (soutenue en décembre 2019).
Aperçu général de mes activités
Recherche et Développement (R&D)
Domaines de compétences techniques :
Data Science & Modélisation mathématique
Modélisation Probabiliste : modèles de Markov cachés (HMM), modèles de dynamique des populations (processus de naissance et de mort, systèmes prédateurs -proies, etc.), équations différentielles déterministes/stochastiques, simulation numérique
Statistique inférentielle & computationnelle : statistique descriptive numérique et graphique, modèles linéaires généralisés, modèles de régression non linéaires à effets mixtes, statistique bayésienne, algorithme EM et variantes (SAEM, maxEM, ...), calcul de segmentation (max-EM), Expectation Propagation, Forward Backward, analyse de survie, tests d'hypothèses, réduction de dimension (ACP, t-SNE, UMAP), optimisation numérique
Intelligence Artificielle (Machine Learning/Deep Learning) : classification (sons, images, etc.), détection d'anomalies, détection d'objets (images), maintenance prédictive, IA embarquée, traitement automatique du langage naturel (NLP) & analyse de données séquentielles, industrialisation de modèles d'IA (mlflow)
Data engineering & Data analyse : ETL from scratch en R et Python, Data Engineering sur Azure (Data Factory, Synapse Analytics, Databricks, Stream Analytics, PySpark, SQL), Data visualization & Analytics from scratch (R, Python) et avec Orange Data mining et Power BI
Autres : Web sémantique (graphes RDF, SPARQL, ontologies, etc.), applications Java (Spring boot & Postman), cryptographie, IVVQ en Python (aviation/défense)
Principaux domaines d'application : Smart Energy, microélectronique, IoT, santé & biologie (e-santé, santé publique, cancer, génétique, épidémiologie, etc.), économie/social, aviation, défense
Enseignement
Probabilités appliquées
Statistique descriptive : construction théorique de graphiques statistiques, calcul d'indicateurs statistiques standards, analyse de corrélation, tests d'hypothèse statistique, analyse en composante principale (ACP)
Statistique inférentielle : méthode des moindres carrés, méthodes du maximum de vraisemblance & notion d'entropie croisée, méthode des moments, analyse d'un estimateur statistique
Principaux algorithmes de Machine Learning/Deep Learning/Data Science : régression linéaire simple/multiple, régression logistique simple/multiple, Naive Bayes, analyse discriminante linéaire (LDA), k plus proches voisins (k-NN), k-means, arbre de décision & forêt aléatoire, SVM, Perceptron, Multilayer Perceptron (MLP) & Dense Neural Networks (DNN), Convolutional Neural Network (CNN), YOLO, Reccurent Neural Network (RNN, LSTM, GRU, BiLSTM), Mécanismes d'attention & Transformers, Natural Language Processing (NLP), Generative Adversarial Network (GAN), Recommender system
Optimisation mathématique & Optimisation pour le Machine Learning : théorie de l'optimisation numérique (lagrangien, conditions KKT, etc.), l'algorithme de descente de gradient et variantes stochastiques et pas adaptatifs)
Langages de programmation enseignés : Python, Java, R, C++
Evènements récents
Rencontres Laboratoires - Entreprises 2022 :
Rencontre Pôle SCS, mars 2022, à Chalucet, Toulon : "Utilisation de techniques d'auto-apprentissage dans le cadre de l'optimisation de la consommation électrique", Dr Modibo DIABATE, Enseignant Chercheur en Intelligence Artificielle (IA) et Anais GALLIGANI, Responsable Smart Energy, Yncréa Méditerranée
Productions scientifiques/techniques
Principal projet en cours : InterConnect (Interoperable solutions connecting smart homes, buildings and grids), au sein de l'équipe Software Development & IA
Publication récente : Parameter estimation and treatment optimization in a stochastic model for immunotherapy of cancer. M. Diabate, L. Coquille and A. Leclercq-Samson. 2019. Journal of Theoretical Biology