Data scientist

short term contract
Paris
Posted on 10-22-2021

Assistance Publique - Hôpitaux de Paris - DSI

Réaliser les projets digitaux innovants au sein de l’hôpital.

More informations
  • Website
  • Unknown
  • Between 50 and 250 employees
  • Others
Read more

L’ Assistance Publique - Hôpitaux de Paris (AP - HP) est un établissement public de santé et le centre hospitalier universitaire - CHU - de la région Ile-de-France, reconnu mondialement pour sa recherche. Le pôle Innovation et Données (ID) s’inscrit au sein de la Direction des Systèmes d’Information.

Sa mission ? 🎯Réaliser les projets digitaux innovants au sein de l’hôpital.

Ses projets phares ?

🚀 Construire le plus large entrepôt public de données de santé en Europe! Le projet vise à valoriser les données produites à l’AP-HP pour la recherche, l’innovation et le pilotage des soins, tout en protégeant les données patient. L’Entrepôt de Données de Santé, c’est déjà +8 millions de patients dont les données sont structurées et référencées sur une plateforme Big Data dédiée.

🙋‍♀️🙋‍♂Accélérer l’activité de leur Lab numérique qui met à disposition des expertises et un environnement de développement de solutions innovantes pour les professionnels de santé et les patients !

🔬Monter une plateforme Bio-Informatique centrale pour assister les pôles de biologie de l’ AP-HP dans leurs besoins informatiques (gestion du séquençage, déploiement de ressources de calcul).

🌼Développer et déployer au niveau national les outils de collecte et d’analyse épidémiologique des données relatives aux maladies rares.


Au sein de l’équipe data science de la DSI, vous aurez pour mission de développer, valider et maintenir des algorithmes et librairies scientifiques facilitant l’exploitation des données de biologie et de médicament de l’Entrepôt des Données de Santé (EDS). Ces travaux se feront en étroite collaboration avec les experts de ces disciplines au travers de groupes de travail. Les projets de recherche actuellement en cours ou sur le point d’être lancés en oncologie, psychiatrie ou relativement au covid19 seront en particulier associés.

Après vous être familiarisé.e avec la base de données de l’EDS et ses spécificités, vous étudierez la qualité des données structurées relatives à la biologie et aux médicaments (stabilité temporelle de la collecte, dérive temporelle des terminologies utilisées, complétude et vraisemblance des données, détection automatique d’anomalies, etc.). Vous développerez et maintiendrez des librairies scientifiques Python de qui seront co-développées en lien avec la communauté d’utilisateurs. Pour enrichir la base de données en utilisant les données textuelles des comptes rendus, vous contribuerez également au développement et à la mise en production de modèles de natural language processing (NLP) qui extrairont des comptes rendus cliniques des variables d’intérêt liées à la biologie et au médicament. Vous serez amené.e à contribuer à des articles scientifiques valorisant d’un point de vue académique ces différents travaux.

Missions principales :

  • Description statistique des données de biologie et de médicament intégrées à l’EDS;
  • Développement, validation et maintenance de librairies scientifique écrites en Python facilitant l’analyse des données de biologie et de médicament ;
  • Développement de modèles de natural language processing pour extraire des données de médicament ou de biologie des comptes rendus cliniques ;
  • Développement de modèles de machine learning (ML) pour la détection d’anomalie;
  • Soutien aux projets de recherche en oncologie, psychiatrie et liés au covid19 relativement à leur utilisation des données de biologie et de médicament;
Profile

Pré-requis

  • Diplôme d’ingénieur avec spécialisation sur les enjeux de traitement de données massives

Savoir-faire requis:

  • Expertise en statistiques ;
  • Expertise en développement Python/R ;
  • Expertise en analyse de bases de données (SQL) ;
  • Expertise en développement de modèles de machine learning (Tensorflow, Pytorch etc.) ;
  • Expertise en calcul distribué et en data management (Spark, Scala, etc.) ;
  • Expertise en traitement automatiques des langues (NLP) ;

Connaissances appréciées :

  • problématiques fonctionnelles hospitalières (structures, processus) et des métiers de la santé (dont la recherche sur données et la recherche clinique) ;
  • capacité à lire la littérature scientifique et à contribuer à des articles scientifiques ;
  • standards d’interopérabilité du domaine de la santé (FHIR, OMOP, CDA, HL7, CIM, Snomed, LOINC…)
  • connaissance du RGPD et de la réglementation liée à la recherche sur données et la recherche clinique

Qualités requises :

  • Esprit d’équipe et fort sens du relationnel
  • Autonomie, rigueur, méthode
  • Curiosité et capacité d’adaptation et d’anticipation
  • Adhésion aux valeurs du service public et intérêt prononcé pour le domaine de la santé
Take time to define THE meaningful jobs that would really suit you!
Chargement...
Professions associated with the job