Stage de fin d'étude - NLP médicaments - Paris

Internship
Paris
No remote
Posted on 10-22-2021

Fondation de l'AP-HP

La Fondation de l’AP-HP est une fondation hospitalière qui a pour objectif de soutenir l’organisation des soins, le personnel hospitalier et la recherche au sein des 38 hôpitaux qui composent l’AP–HP.

More informations
  • Website
  • Unknown
  • Between 50 and 250 employees
  • Others
Impact study
Fondation de l'AP-HP did not yet communicate its impact measurement.
Read more

L’ Assistance Publique - Hôpitaux de Paris (AP - HP) est un établissement public de santé et le centre hospitalier universitaire - CHU - de la région Ile-de-France, reconnu mondialement pour sa recherche. Le pôle Innovation et Données (ID) s’inscrit au sein de la Direction des Systèmes d’Information.

Sa mission ? 🎯Réaliser les projets digitaux innovants au sein de l’hôpital.

Ses projets phares ?

🚀 Construire le plus large entrepôt public de données de santé en Europe! Le projet vise à valoriser les données produites à l’AP-HP pour la recherche, l’innovation et le pilotage des soins, tout en protégeant les données patient. L’Entrepôt de Données de Santé, c’est déjà +8 millions de patients dont les données sont structurées et référencées sur une plateforme Big Data dédiée.

🙋‍♀️🙋‍♂Accélérer l’activité de leur Lab numérique qui met à disposition des expertises et un environnement de développement de solutions innovantes pour les professionnels de santé et les patients !

🔬Monter une plateforme Bio-Informatique centrale pour assister les pôles de biologie de l’ AP-HP dans leurs besoins informatiques (gestion du séquençage, déploiement de ressources de calcul).

🌼Développer et déployer au niveau national les outils de collecte et d’analyse épidémiologique des données relatives aux maladies rares.


L’Entrepôt des Données de Santé (EDS) de l’AP-HP centralise les données collectées à l’AP-HP pour les mettre à disposition de projets de recherche ou de pilotage. Les données textuelles contenues dans les documents cliniques contiennent en particulier de nombreuses informations d’intérêt, comme par exemple des indications sur les médicaments préscripts, dispensés et administrés à chaque patient. La présence de ces informations sous forme de texte libre limite leur utilisation. Des algorithmes de Natural Language Processing permettent néanmoins d’extraire automatiquement une partie de ces informations des 70 millions de comptes rendus de l’EDS.

Au sein de l’équipe data science de la DSI et en lien étroit avec ses partenaires académiques, vous aurez pour mission de poursuivre le développement et la validation de modèles de NLP permettant l’extraction automatique des données médicamenteuses depuis les comptes rendus cliniques. Vous serez associé.e à des campagnes d’annotation et à l’entraînement de nouveaux modèles de machine learning.

Missions principales :

  • Définition du besoin utilisateur relatif à un modèle de NLP d’extraction des données médicamenteuses depuis les comptes rendus cliniques;
  • Participation à une campagne d’annotation des comptes rendus cliniques ;
  • Développement et validation d’algorithmes de NLP;
  • Participation à la mise en production des algorithmes de NLP à l’EDS ;
  • Communication des résultats;
Profile

Requis :

  • Expertise en analyse de bases de données (SQL);
  • Expertise en Python;
  • Expertise en statistiques ;
  • Expertise en machine learning - NLP (spaCy, etc.);

Apprécié :

  • Connaissance des problématiques fonctionnelles hospitalières (structures, processus) et des métiers de la santé ;
  • Connaissance du monde de la recherche ;

Travail en équipe :

  • Esprit d’équipe et fort sens du relationnel
  • Autonomie, rigueur, méthode
  • Curiosité et capacité d’adaptation et d’anticipation
  • Adhésion aux valeurs du service public et intérêt prononcé pour le domaine de la santé