AROB@S

Farida Zehraoui

Qui suis-je ?

Maître de Conférences

Equipe AROB@S, Laboratoire  IBISC,
Département d'informatique, Université d'Evry, Paris-Saclay
Bâtiment IBGBI, 23 Boulevard de France, 91037 Evry, FRANCE
Téléphone : (+33) 1 64 85 34 64
Email: zehraoui at ibisc.univ-evry.fr

Sujets de recherche

Mon domaine de recherche est l'intelligence artificielle (IA), plus particulièrement, l'apprentissage automatique. Mes activités de recherche actuelles s'articulent principalement autour de deux domaines d'application : bioinformatique des ARN non-codants et médecine personnalisée. Cependant, en biologie comme en médecine, pour développer des modèles d'apprentissage automatique efficaces et utiles, plusieurs défis restent à relever. Ces défis sont liés à la nature complexe des données disponibles, leur hétérogénéité, leur aspect temporel, la présence de valeurs manquantes, le manque d'étiquettes, le déséquilibre de classes, la grande dimension, le besoin d'expliquer/interpréter les prédictions, etc. Dans mes travaux de recherche, je me suis intéressée à plusieurs problématiques :

  • Prise en compte de l'hétérogénéité des données en proposant des modèles multi-sources
  • Proposition de modèles semi-supervisés pour pallier au manque de données
  • Explication et interprétation des modèles d'apprentissage automatique, en particulier d'apprentissage profond (Deep Learning) en intégrant les connaissances du domaine et en combinant l'apprentissage automatique avec des méthodes d'IA symbolique
  • Prise en compte de l'aspect temporel des données en proposant des modèles adaptés (réseaux récurrents)
  • Sélection de variables basée sur l'optimisation multi-objectif pour traiter le problème de grande dimension dans les données

Projets de recherche récents

  • 2021-2025 : Projet ANR AAPG 2021. DeepIntegrOmics : End-to-End Deep learning for Precision Medicine through Metagenomics and cost-sensitive data integration (Coordinateur : Jean-Daniel ZUCKER, Responsable IBISC : Blaise Hanczar). Ce projet vise à développer des modèles de pronostic ou diagnostic basé sur la métagénomique. Il se concentrera sur l'utilisation de l'apprentissage profond pour la médecine de précision en utilisant plusieurs sources de données omiques.
  • 2021-2025 : Projet de collaboration scientifique entre IBISC (AROBAS) et Sanofi. Ce projet implique Blaise Hanczar et Farida Zehraoui (AROBAS, IBISC) ainsi que (Sanofi). Co-responsables : Blaise Hanczar et Farida Zehraoui. Ce projet permettra de financer la thèse cifre de Aurélien Beaude. L'un des enjeux est de développer et d'explorer l'intérêt de l'utilisation d'approches d'apprentissage profond interprétables pour l'identification de biomarqueurs et la stratification de patients. Co-encadrement avec Blaise Hanczar et Franck Auge de la thèse Cifre d’Aurélien Beaude.
  • 2016-2020 : Projet de collaboration scientifique entre IBISC (AROBAS-IRA2) et Visiomed Group. Ce projet a impliqué Nadia Abchiche-Mimouni (IRA2, IBISC), Etienne Colle (IRA2, IBISC) et Farida Zehraoui (AROBAS, IBISC) ainsi que François Teboul (Visiomed Group). Co-responsables : Nadia Abchiche-Mimouni et Farida Zehraoui. Ce projet a permis le financement du stage de master 2 et de la thèse Cifre de Sendi Naziha. L'un des enjeux de ce projet est de concevoir un système évolutif qui permettra au patient atteint d'hypertension artérielle de se prendre en charge, en proposant une prise en charge adaptée à différents profils de patients. Co-encadrement avec Nadia Abchiche-Mimouni de la thèse cifre de Naziha Sendi. 
  • Depuis mars 2017 : Projet de collaboration scientifique entre IBISC (Farida Zehraoui, Nadia Abchiche-Mimouni) et le CHSF (Pascal Goube et Senda Nouilli). Ce projet a permis le financement du stage de Master 2 de Gilles Bellido. Co-responsables : Nadia Abchiche-Mimouni et Farida Zehraoui. L'objectif général de ce projet était d'améliorer la prise en charge des patients par le biais des consultations semi-urgentes mises en place au CHSF en faisant coopérer différentes expertises et types de connaissances (données patients et connaissances du domaine médical). Co-encadrement avec Nadia Abchiche-Mimouni de plusieurs stagiaires de Master 2 et 2ème année ingénieur.

Encadrement de thèses

Thèses soutenues
  • Naziha Sendi : "Approche individualisée pour l'auto-gestion de l'hypertension artérielle" (septembre 2017- décembre 2020). Co-encadrement avec Nadia Abchiche-Mimouni (IBISC), Etienne Colle (IBISC) (directeur) et François Teboul (VISIOMED). L'encadrement scientifique de cette thèse Cifre a été principalement assuré par Nadia Abchiche et moi-même.
  • Ludovic Platon : "Prédiction et classification à grande échelle des ARN non-codants. Application à l'identification des ARN impliqués dans le déterminisme sexuel chez les plantes.", (octobre 2015-janvier 2019). Co-encadrement avec Abdelhafid Bendahmane (IPS2) et Fariza Tahi (IBISC).

Thèses en cours
  • Aurélien Beaude : "Developing and exploring the interest of interpretable Deep Learning approaches in the field of multi-omics data. Application on the MMRF CoMMpass database ". Co-encadrement avec Blaise Hanczar (directeur) et Franck Auge. Thèse Cifre (Collaboration avec Sanofi) qui a débuté en décembre 2021.
  • Constance Creux : "Algorithmes de deep learning pour l'identification, la classification et la prédiction de la fonction des ARN non-codants impliqués dans le cancer de la vessie ". Co-encadrement avec Fariza Tahi (IBISC) (directrice) et François Radvanyi (Institut Curie). Thèse qui a débuté en octobre 2021.
  • Tina Issa  : "Multiobjective optimization and feature selection in deep learning". Co-encadrement avec Eric Angel. Thèse qui a débuté en octobre 2019. Victoria Bourget  : "Apprentissage profond pour la prédiction de phénotypes à partir de données d'expression de gènes ". Co-encadrement avec Blaise Hanczar (directeur). Thèse qui a débuté en octobre 2019.

Enseignements

J’effectue mon service statutaire au département d’informatique de l'université d'Evry, Paris-Saclay.
Actuellement j'assure principalement des cours d'analyse de données et d'apprentissage automatique en Master 1 et Master 2 dans toutes les filières du département d’informatique (GENIOMHE, MIAGE et CNS).
J'ai également mis en place de nouveaux cours comme : "Decision systems for personalized medicine", "Advanced machine learning for computational biology and personalized medicine" et "Deep Learning for precision medicine".
De plus, j'assure chaque année le suivi pédagogique d'étudiants en MIAGE apprentissage (L3, M1 et M2) ainsi que le tutorat de stages de M2 (CILS, GENIOMHE, MIAGE initial, CNS) qui se déroulent en entreprise.

Responsabilités

Responsabilités Pédagogiques
Les responsabilités des dernières années sont listées ci-dessous :
  • Co-responsable du M1 informatique (parcours CILS et ASR) de 2016 à 2018
  • Responsable du M1 MIAGE Initial depuis l'année 2019 (rédaction de la nouvelle maquette du parcours M1 MIAGE ILW en 2020)
Conseils de composantes et de laboratoires
  • Membre élu du Conseil de l'UFR SFA depuis 2019
  • Membre nommé au conseil du laboratoire IBISC depuis 2020
  • Membre élu au conseil du laboratoire IBISC (entre 2017 et 2020)

Autre
  • Co-responsable du projet fédérateur du laboratoire IBISC intitulé : "Médecine Personnalisée" depuis 2020

Publications récentes

La liste complète des publications sur google Scholar se trouve ici.

Revues internationales à comité de lecture
  • V. Bourgeais, F. Zeharoui, B. Hanczar. GraphGONet: a self-explaining graph-based neural network encapsulating the Gene Ontology for phenotypeprediction on gene expression. Bioinformatics, 2022.
  • V. Bourgeais, F. Zeharoui, B. Hanczar. Deep GONet: Self-explainable deep neural network based on Gene Ontology for phenotypeprediction from gene expression data. BMC bioinformatics 22, 455, 2021.
  • B. Hanczar, F. Zehraoui, T. Issa, M. Arles. Biological interpretation of deep neural network for phenotype prediction based on gene expression. BMC bioinformatics 21 (1), 1-18, 2020.
  • A. Boukelia, A. Boucheham, M. Belguidoum, M. Batouche, F. Zehraoui, F. Tahi. A Novel Integrative Approach for Non-coding RNA Classification Based on Deep Learning. Current Bioinformatics 15 (4), 338-348, 2020.
  • B. Hanczar, M. Henriette, T. Ratovomanana, F. Zehraoui. Phenotypes prediction from gene expression data with deep multilayer perceptron and unsupervised pre-training. Int J Biosci Biochem Bioinform 8, 125-31, 2018.
  • L. Platon, F. Zehraoui, A. Bendahmane, F. Tahi. IRSOM, a reliable identifier of ncRNAs based on supervised Self-Organizing Maps with rejection. Bioinformatics, 2018.
  • A.Boucheham, V. Sommard, F. Zehraoui, A. Boualem, M. Batouche, A. Ben- dahmane, D. Israeli and F.Tahi. IpiRId : Integrative approach for piRNA predic- tion using genomic and epigenomic data. PLOS ONE, 2017.
  • V.D. Tran, S. Tempel, B. Zerath, F. Zehraoui, F. Tahi. miRBoost : Boosting support vector machines for microRNA precursor classification. RNA 21 :25. 2015.
  • M. Heinonen, O. Guipaud, F. Milliat, V. Buard, B. Micheau, G. Tarlet, M. Ben- deritter, F. Zehraoui, F.d’Alché-Buc. Detecting time periods of differential gene expression using Gaussian processes : an application to endothelial cells exposed to radiotherapy dose fraction. Bioinformatics 31(5) : 728-735, 2015.

Conférences et workshops internationales
  • V. Bourgeais, F. Zeharoui, B. Hanczar. Deep GONet : Self-explainable deep neural network based on Gene Ontology for phenotype prediction from gene expression data. 19th Asia Pacific Bioinformatics Conference (APBC), 2021.
  • N. Sendi, N. Abchiche-Mimouni, F. Zehraoui. Towards a transparent deep ensemble method based on multiagent argumentation. 23rd International Conference on Knowledge-Based and Intelligent Information (KES) & Engineering Systems. Procedia Computer Science (159), 271-280, 2019.
  • N. Sendi, N. Abchiche-Mimouni, F. Zehraoui, F. Teboul. Transparent deep en- semble method based argumentation for classification. EXTRAAMAS@AAMAS. 3-21, 2019.
  • L. Platon, F. Zehraoui, F. Tahi. Localized multiple sources self-organizing map. International Conference on Neural Information Processing, 648-659, 2018.
  • L. Platon, F. Zehraoui, A. Bendahmane, F. Tahi. IRSOM, a reliable identifier of ncRNAs based on supervised Self-Organizing Maps with rejection. European Conference on Computational Biology (ECCB), September 2018. Actes publiés dans la revue Bioinformatics.
  • B. Hanczar, M. Henriette, T. Ratovomanana , F. Zehraoui. Phenotypes pre- diction from gene expression data with deep multilayer perceptron and unsuper- vised pre-training. 6th International Conference on Computer Engineering and Bioinformatics ICCEB. October 2017.
  • L. Platon, F. Zehraoui, F.Tahi. Self-Organizing Maps with supervised layer. In Proceedings of the 12th International Workshop on Self-Organizing Maps and Learning Vector Quantization, Clustering and Data Visualization (WSOM+), June 2017.

Conférences et ateliers internationaux
  • V. Bourgeais, F. Zeharoui, B. Hanczar. Deep GONet : Self-explainable deep neural network based on Gene Ontology for phenotype prediction from gene expression data. Conférence Francophone d’Apprentissage Automatique CAp 2021, Saint-Etienne, France, 2021.
  • Mona Mayouf, Amel Hamrioui, Insaf Setirtra, Farida Zehraoui, Blaise Hanczar. La classification automatique des images histologiques du cancer du sein : entre les méthodes basées segmentation et les méthodes basées RNC. Société Francophone de Classification SFC18. Paris, France, 2018.
  • L. Platon, F. Zehraoui, F.Tahi. Supervised Self-Organizing Maps with reject options. Junior Conference on Data Science and Engineering (JCDSE), septembre 2017.