AROB@S

Farida Zehraoui

Qui suis-je ?

Maître de Conférences

Equipe AROB@S, Laboratoire  IBISC,
Département d'informatique, Université d'Evry, Paris-Saclay
Bâtiment IBGBI, 23 Boulevard de France, 91037 Evry, FRANCE
Téléphone : (+33) 1 64 85 34 64
Email: zehraoui at ibisc.univ-evry.fr

Sujets de recherche

Mon domaine de recherche est l'Intelligence Artificielle (IA), plus particulièrement, l'apprentissage automatique (AA). Depuis plusieurs années, je m'intéresse à la proposition de nouveaux modèles d'AA et à leur application au domaine de la santé.
Dans le domaine de la santé, les techniques d'AA ont démontré leur potentiel pour améliorer le diagnostic, la prédiction de traitement et la personnalisation des soins apportés aux patients.
Plus particulièrement, le Deep Learning (DL) a montré des résultats impressionnants dans plusieurs applications, telles que l'analyse et la reconnaissance d'images médicales. Ces algorithmes peuvent détecter avec précision des anomalies, aider au diagnostic précoce de maladies comme le cancer et aider les radiologues à faire des interprétations plus précises.
Cependant, la grande quantité et types de données disponibles sur les patients et les diverses questions scientifiques liées à la médecine posent plusieurs défis dans le domaine d'AA. Ces défis sont liés à l'hétérogénéité des données disponibles, à leur aspect temporel, à la présence de valeurs manquantes, au manque d'étiquettes, au déséquilibre des classes, à la grande dimension, etc.
En plus de traiter chaque type de données de manière spécifique, mes travaux actuels et futurs concernent deux défis principaux :

  • Interprétabilité : Les modèles DL sont considérés comme des modèles "boîte noire". Dans le domaine de la santé, l'interprétabilité est nécessaire, et il est essentiel de comprendre comment un modèle fournit un diagnostic ou une recommandation de traitement pour qu'il soit adopté.
  • Intégration de données hétérogènes : l'intégration de différents types de données omiques (génomiques, protéomiques, etc.) avec des données cliniques, des images, du texte et des signaux est une tâche complexe en raison des variations dans les formats, les échelles et les sources de données. Assurer la compatibilité des données et gérer les données et les sources manquantes représentent des défis pour l'AA.

Projets de recherche récents

  • 2024-2034: IHU PROMETHEUS: PRecisiOn MedicinE for healTHcare associatEd and commUnity acquired Sepsis (Coordinateur : Djillali Anane (UVSQ, APHP), Responsable UEVE : Farida Zehraoui). Le futur centre mondial, intégrant la recherche, la formation et la prise en charge des patients, vise à réduire la mortalité et les séquelles du sepsis au cours de la prochaine décennie. Le sepsis est la complication la plus grave des infections et le centre a trois objectifs scientifiques principaux. Le premier objectif est de comprendre les interactions entre l'hôte et les agents pathogènes, en élucidant la progression d'une simple infection vers le sepsis. En outre, le centre vise à développer et à valider une plateforme de test rapide. Il vise aussi à faire progresser la médecine personnalisée. Des sources de données hétérogènes comprenant des données omiques, des DME, des images et des signaux seront disponibles.
  • 2021-2025: DeepIntegrOmics : End-to-End Deep learning for Precision Medicine through Metagenomics and cost-sensitive data integration (Coordinateur : Jean-Daniel ZUCKER, Responsable IBISC : Blaise Hanczar). Ce projet vise à développer des modèles de pronostic ou diagnostic basé sur la métagénomique. Il se concentrera sur l'utilisation de l'apprentissage profond pour la médecine de précision en utilisant plusieurs sources de données omiques.
  • 2021-2025 : Projet de collaboration scientifique entre IBISC (AROBAS) et Sanofi. Ce projet implique Blaise Hanczar et Farida Zehraoui (AROBAS, IBISC) ainsi que (Sanofi). Co-responsables : Blaise Hanczar et Farida Zehraoui. Ce projet permettra de financer la thèse cifre de Aurélien Beaude. L'un des enjeux est de développer et d'explorer l'intérêt de l'utilisation d'approches d'apprentissage profond interprétables pour l'identification de biomarqueurs et la stratification de patients. Co-encadrement avec Blaise Hanczar et Franck Auge de la thèse Cifre d’Aurélien Beaude.
  • 2016-2020 : Projet de collaboration scientifique entre IBISC (AROBAS-IRA2) et Visiomed Group. Ce projet a impliqué Nadia Abchiche-Mimouni (IRA2, IBISC), Etienne Colle (IRA2, IBISC) et Farida Zehraoui (AROBAS, IBISC) ainsi que François Teboul (Visiomed Group). Co-responsables : Nadia Abchiche-Mimouni et Farida Zehraoui. Ce projet a permis le financement du stage de master 2 et de la thèse Cifre de Sendi Naziha. L'un des enjeux de ce projet est de concevoir un système évolutif qui permettra au patient atteint d'hypertension artérielle de se prendre en charge, en proposant une prise en charge adaptée à différents profils de patients. Co-encadrement avec Nadia Abchiche-Mimouni de la thèse cifre de Naziha Sendi. 
  • Depuis mars 2017 : Projet de collaboration scientifique entre IBISC (Farida Zehraoui, Nadia Abchiche-Mimouni) et le CHSF (Pascal Goube et Senda Nouilli). Ce projet a permis le financement du stage de Master 2 de Gilles Bellido. Co-responsables : Nadia Abchiche-Mimouni et Farida Zehraoui. L'objectif général de ce projet était d'améliorer la prise en charge des patients par le biais des consultations semi-urgentes mises en place au CHSF en faisant coopérer différentes expertises et types de connaissances (données patients et connaissances du domaine médical). Co-encadrement avec Nadia Abchiche-Mimouni de plusieurs stagiaires de Master 2 et 2ème année ingénieur.

Encadrement de thèses

Thèses soutenues
  • Aurélien Beaude : "Developing and exploring the interest of interpretable Deep Learning approaches in the field of multi-omics data. Application on the MMRF CoMMpass database ". Co-encadrement avec Blaise Hanczar (directeur) et Franck Auge. Thèse Cifre (Collaboration avec Sanofi). 2021-2024.
  • Constance Creux : "Algorithmes de deep learning pour l'identification, la classification et la prédiction de la fonction des ARN non-codants impliqués dans le cancer de la vessie ". Co-encadrement avec Fariza Tahi (IBISC) (directrice) et François Radvanyi (Institut Curie). 2021-2024.
  • Tina Issa  : "Multiobjective optimization and feature selection in deep learning". Co-encadrement avec Eric Angel (directeur). 2019-2024.
  • Victoria Bourget  : "Apprentissage profond pour la prédiction de phénotypes à partir de données d'expression de gènes ". Co-encadrement avec Blaise Hanczar (directeur). 2019-2022.
  • Naziha Sendi : "Approche individualisée pour l'auto-gestion de l'hypertension artérielle". Co-encadrement avec Nadia Abchiche-Mimouni (IBISC), Etienne Colle (IBISC) (directeur) et François Teboul (VISIOMED). L'encadrement scientifique de cette thèse Cifre a été principalement assuré par Nadia Abchiche et moi-même. 2017- 2020
  • Ludovic Platon : "Prédiction et classification à grande échelle des ARN non-codants. Application à l'identification des ARN impliqués dans le déterminisme sexuel chez les plantes". Co-encadrement avec Abdelhafid Bendahmane (IPS2) et Fariza Tahi (IBISC). 2015-2019.

Thèses en cours
  • Charlotte Job : "Identification de cibles thérapeutiques à partir de données de séquençage ARN à l’échelle de la cellule unique à l’aide de réseaux de neurones profond biologiquement interprétables". Co-encadrement avec Blaise Hanczar (IBISC, directeur) et Jérémy Grignard (Servier). Thèse Cifre (Collaboration avec Servier). Thèse qui a débuté en janvier 2025.
  • Laura Isabella Forero : "SENSE: Semantic-based graph nEural Networks from multiomics data for SEpsis". Co-encadrement avec Nacéra Seghouani (directrice, LISN) et Henri-Jean Garchon(PU-PH, inserm, UVSQ). Thèse qui a débuté en octobre 2024.
  • Giulia Perciballi : "Apprentissage profond interprétable pour la détection de biomarqueurs multi-sources et la stratification des patients". Co-encadrement avec Edi Prifti (directeur, IRD) et Jean-Daniel Zucker (IRD). Thèse dans le cadre du projet ANR DeepIntegrOmics qui a débuté en février 2024.

Enseignements

J’effectue mon service statutaire au département d’informatique de l'université d'Evry, Paris-Saclay.
Actuellement j'assure principalement des cours d'analyse de données et d'apprentissage automatique en Master 1 et Master 2 dans toutes les filières du département d’informatique (GENIOMHE, MIAGE et CNS).
J'ai également mis en place de nouveaux cours comme : "Decision systems for personalized medicine", "Advanced machine learning for computational biology and personalized medicine" et "Deep Learning for precision medicine".
De plus, j'assure chaque année le suivi pédagogique d'étudiants en MIAGE apprentissage (L3, M1 et M2) ainsi que le tutorat de stages de M2 (CILS, GENIOMHE, MIAGE initial, CNS) qui se déroulent en entreprise.

Responsabilités

Responsabilités Pédagogiques
Les responsabilités des dernières années sont listées ci-dessous :
  • Co-responsable du M1 informatique (parcours CILS et ASR) de 2016 à 2018
  • Responsable du M1 MIAGE Initial depuis l'année 2019 (rédaction de la nouvelle maquette du parcours M1 MIAGE ILW en 2020)
Conseils de composantes et de laboratoires
  • Membre élu du Conseil de l'UFR SFA depuis 2019
  • Membre nommé au conseil du laboratoire IBISC depuis 2020
  • Membre élu au conseil du laboratoire IBISC (entre 2017 et 2020)

Autre
  • Co-responsable du projet fédérateur du laboratoire IBISC intitulé : "Médecine Personnalisée" depuis 2020

Publications récentes

La liste complète des publications sur google Scholar se trouve ici.

Revues internationales à comité de lecture
  • Constance Creux, Farida Zehraoui, François Radvanyi, Fariza Tahi. "MMnc: Multi-modal representation for non-coding~RNA class prediction and annotation". Bioinformatcs, 2025.
  • T. Issa, E. Angel and F. Zehraoui. "Biobjective Feature Selection and Architecture Optimization for Deep Neural Networks". Plos One Journal, 19 (7). 2024.
  • C. Creux, F. Zehraoui, F. Radvanyi and F. Tahi. "Comparison and benchmark of deep learning methods for non-coding RNA classification". PLOS Computational Biology, 20 (9). 2024.
  • A. Beaude, M. Rafiee Vahid, F. Augé, F., Zehraoui, B. Hanczar, AttOmics: attention-based architecture for diagnosis and prognosis from omics data. Bioinformatics, 39(Supplement 1), i94-i102, 2023.
  • C. Creux, F. Zehraoui, B. Hanczar, F. Tahi A3SOM, abstained explainable semi-supervised neural network based on the self-organizing map. Plos one 18 (5), e0286137, 2023.
  • G. Postic, C. Tav, L. Platon, F. Zehraoui, F. Tahi. IRSOM2: a web server for predicting bifunctional RNAs. Nucleic Acids Research, gkad381. 2023.
  • V. Bourgeais, F. Zeharoui, B. Hanczar. GraphGONet: a self-explaining graph-based neural network encapsulating the Gene Ontology for phenotypeprediction on gene expression. Bioinformatics, 2022.
  • V. Bourgeais, F. Zeharoui, B. Hanczar. Deep GONet: Self-explainable deep neural network based on Gene Ontology for phenotypeprediction from gene expression data. BMC bioinformatics 22, 455, 2021.
  • B. Hanczar, F. Zehraoui, T. Issa, M. Arles. Biological interpretation of deep neural network for phenotype prediction based on gene expression. BMC bioinformatics 21 (1), 1-18, 2020.
  • A. Boukelia, A. Boucheham, M. Belguidoum, M. Batouche, F. Zehraoui, F. Tahi. A Novel Integrative Approach for Non-coding RNA Classification Based on Deep Learning. Current Bioinformatics 15 (4), 338-348, 2020.
  • B. Hanczar, M. Henriette, T. Ratovomanana, F. Zehraoui. Phenotypes prediction from gene expression data with deep multilayer perceptron and unsupervised pre-training. Int J Biosci Biochem Bioinform 8, 125-31, 2018.
  • L. Platon, F. Zehraoui, A. Bendahmane, F. Tahi. IRSOM, a reliable identifier of ncRNAs based on supervised Self-Organizing Maps with rejection. Bioinformatics, 2018.
  • A.Boucheham, V. Sommard, F. Zehraoui, A. Boualem, M. Batouche, A. Ben- dahmane, D. Israeli and F.Tahi. IpiRId : Integrative approach for piRNA predic- tion using genomic and epigenomic data. PLOS ONE, 2017.
  • V.D. Tran, S. Tempel, B. Zerath, F. Zehraoui, F. Tahi. miRBoost : Boosting support vector machines for microRNA precursor classification. RNA 21 :25. 2015.
  • M. Heinonen, O. Guipaud, F. Milliat, V. Buard, B. Micheau, G. Tarlet, M. Ben- deritter, F. Zehraoui, F.d’Alché-Buc. Detecting time periods of differential gene expression using Gaussian processes : an application to endothelial cells exposed to radiotherapy dose fraction. Bioinformatics 31(5) : 728-735, 2015.

Conférences et workshops internationaux
  • A. Beaude, M. Rafiee Vahid, F. Augé, F., Zehraoui, B. Hanczar, AttOmics: attention-based architecture for diagnosis and prognosis from omics data. ECCB/ISMB, 2023. Published in Bioinformatics.
  • L. Amgoud, N. Abchiche-Mimouni, F. Zehraoui. Explainable Ensemble Classification Model based on Argumentation. In 22nd International Conference on Autonomous Agents and Multiagent Systems (AAMAS), 2023. Short Paper.
  • V. Bourgeais, F. Zeharoui, B. Hanczar. Deep GONet : Self-explainable deep neural network based on Gene Ontology for phenotype prediction from gene expression data. 19th Asia Pacific Bioinformatics Conference (APBC), 2021.
  • N. Sendi, N. Abchiche-Mimouni, F. Zehraoui. Towards a transparent deep ensemble method based on multiagent argumentation. 23rd International Conference on Knowledge-Based and Intelligent Information (KES) & Engineering Systems. Procedia Computer Science (159), 271-280, 2019.
  • N. Sendi, N. Abchiche-Mimouni, F. Zehraoui, F. Teboul. Transparent deep ensemble method based argumentation for classification. EXTRAAMAS@AAMAS. 3-21, 2019.
  • L. Platon, F. Zehraoui, F. Tahi. Localized multiple sources self-organizing map. International Conference on Neural Information Processing, 648-659, 2018.
  • L. Platon, F. Zehraoui, A. Bendahmane, F. Tahi. IRSOM, a reliable identifier of ncRNAs based on supervised Self-Organizing Maps with rejection. European Conference on Computational Biology (ECCB), September 2018. Actes publiés dans la revue Bioinformatics.
  • B. Hanczar, M. Henriette, T. Ratovomanana , F. Zehraoui. Phenotypes pre- diction from gene expression data with deep multilayer perceptron and unsuper- vised pre-training. 6th International Conference on Computer Engineering and Bioinformatics ICCEB. October 2017.
  • L. Platon, F. Zehraoui, F.Tahi. Self-Organizing Maps with supervised layer. In Proceedings of the 12th International Workshop on Self-Organizing Maps and Learning Vector Quantization, Clustering and Data Visualization (WSOM+), June 2017.

Conférences et ateliers nationaux
  • C. Creux, F. Zehraoui, B. Hanczar, F.Tahi. Classifying and interpreting data with incomplete labels. Junior Conference on Data Science and Engineering (JCDME), septembre 2022.
  • V. Bourgeais, F. Zeharoui, B. Hanczar. Deep GONet : Self-explainable deep neural network based on Gene Ontology for phenotype prediction from gene expression data. Conférence Francophone d’Apprentissage Automatique CAp 2021, Saint-Etienne, France, 2021.
  • Mona Mayouf, Amel Hamrioui, Insaf Setirtra, Farida Zehraoui, Blaise Hanczar. La classification automatique des images histologiques du cancer du sein : entre les méthodes basées segmentation et les méthodes basées RNC. Société Francophone de Classification SFC18. Paris, France, 2018.
  • L. Platon, F. Zehraoui, F.Tahi. Supervised Self-Organizing Maps with reject options. Junior Conference on Data Science and Engineering (JCDSE), septembre 2017.