Data scientist - oncology - Paris

short term contract
Paris
Posted on 01-21-2022

Fondation de l'AP-HP

La Fondation de l’AP-HP est une fondation hospitalière qui a pour objectif de soutenir l’organisation des soins, le personnel hospitalier et la recherche au sein des 38 hôpitaux qui composent l’AP–HP.

More informations
  • Website
  • Unknown
  • Between 50 and 250 employees
  • Others
Impact study
Fondation de l'AP-HP did not yet communicate its impact measurement.
Read more

Avec ses 800 services hospitaliers couvrant 84 spécialités et avec plus de 4 000 projets de recherche en cours, l’AP-HP est une institution reconnue dans le monde médical pour la qualité et la compétence de ses professionnels de santé, exerçant dans nos 39 hôpitaux.
Travailler à l’AP-HP c’est poursuivre un intérêt général dans un grand service public et venir en appui nos 100 000 professionnels pour que soit assurée la meilleure prise en charge possible des 10 millions de patients par an qui sont accueillis dans nos hôpitaux.
L’AP-HP est le 1er Groupe Hospitalo-Universitaire européen et fait partie des 3 plus importants groupes hospitaliers mondiaux.
Nos équipes participent directement à l’effort de consolidation de ce haut niveau d’excellence médicale. Pour cela, chaque collaborateur de la Direction des Systèmes d’Information de l’AP-HP s’engage à :

  1. s’investir quotidiennement pour atteindre ses objectifs placer son intégrité et celle de l’institution au premier plan,
  2. travailler en équipe,
  3. fournir le meilleur service pour nos utilisateurs finaux qu’ils soient professionnel de santé ou patient,
  4. faire preuve de diplomatie en toute circonstance,
  5. respecter sans condition les règles de confidentialité inhérentes à nos activités.

La Direction des Systèmes d’Information :

  1. Intègre des logiciels/progiciels,
  2. Développe des applications,
  3. Teste et qualifie des produits,
  4. Développe des méthodes et outils de traitement de données massives,
  5. Construit des architectures et assure une urbanisation optimale des applications informatiques,
  6. Pilote des infrastructures complexes : serveurs, stockage, réseaux de haute performance.

Ce que vous ferez dans notre équipe contribuera directement au bon fonctionnement de l’AP-HP pour assurer notre Priorité N°1 : fournir le meilleur service à nos patients et nos professionnels !


Equipe Data science

L’équipe Data Science développe une offre de services en analyse de données au sein du pôle Innovations et Données. Elle travaille en particulier sur l’Entrepôt des Données de Santé (EDS) de l’AP-HP ainsi que sur les données de la banque nationale des maladies rares (BNDMR) et de la plateforme bio-informatique.

Les missions de l’équipe data science sont:

  • La préparation de jeux de données adaptés à des besoins spécifiques (bibliothèques logicielles de pre-processing, structuration de challenges, construction d’échantillons représentatifs, etc.) ;
  • Le développement d’algorithmes permettant d’extraire des variables exploitables pour la recherche, le pilotage et l’innovation à partir des données issues du soin ;
  • L’élaboration de stratégies de protections de la vie privée (pseudonymisation des textes, anonymisation de différentes catégories de données, etc.) ;
  • Le développement de modèles statistiques et d’indicateurs avancés à des fins de recherche ou de pilotage ;
  • La mise en production de modèles statistiques pour les différents utilisateurs de l’entrepôt de données de santé, de la banque nationale des maladies rares et de la plateforme bio-informatique ;
  • Le développement de partenariats académiques et l’animation de la communauté de data science ;

Votre mission

Au sein de l’équipe Data Science, vous aurez pour mission de développer, valider et déployer des algorithmes permettant d’extraire à partir des données massives de l’EDS (documents cliniques, données administratives, de biologie, etc.) des variables pertinentes pour réaliser des études en oncologie. Des algorithmes de Natural Language Processing seront en particulier développés ainsi que des bibliothèques logicielles matérialisant la définition de variables d’intérêt épidémiologique. Des indicateurs de qualité seront définis et calculés afin de permettre un monitoring étroit des nouvelles variables définies.

Après vous être familiarisé.e avec les bases de données, vous commencerez par consolider au sein de bibliothèques logicielles (Python) certains développements méthodologiques issues de recherches récentes. Vous définirez ensuite de nouveaux algorithmes et méthodes d’extraction de variable en lien étroit avec des experts référents (oncologues, épidémiologistes, experts données, etc.). Votre travail se fera en interaction avec de nombreux acteurs gravitant autour de l’EDS : les différentes équipes du Pôle Innovation et Données, les cliniciens-chercheurs référents, les partenaires de l’AP-HP (Universités, INSERM, Inria, etc.). Chaque année des objectifs précis seront établis en lien avec la/le responsable hiérarchique.

Vos missions principales seront:

  • Le développement et la validation d’une bibliothèque logicielle de qualité scientifique permettant d’extraire des variables d’intérêt pour les études en oncologie à partir des données massives de l’EDS (Python, Spark) ;
  • Le développement et la validation de modèles de machine learning (ML) en particulier en NLP ;
  • La mise en production de pipelines d’extraction de variables ;
  • Une contribution à la standardisation de la modélisation des données au format OMOP ;
  • La participation à des projets de recherche et le développement de partenariats académiques ;
  • L’animation d’écosystèmes open-source ;
Profile

Idéalement, vous..

  • Avez un diplôme d’ingénieur ou équivalent (bac+5, master2) en data science ;
  • Adhérez aux valeurs du service public et vous êtes passionné.e par le domaine de la santé ;
  • Avez un niveau d’anglais courant ;

Vous avez un savoir faire dans plusieurs de ces domaines :

  • Expertise en traitement automatiques des langues (NLP) ;
  • Expertise en statistiques ;
  • Expertise en analyse de bases de données (SQL) ;
  • Expertise en développement de modèles de machine learning (Tensorflow, Pytorch etc.) ;
  • Expertise en calcul distribué et en data management (Spark, Scala, etc.) ;
  • Expertise en développement Python ;
  • Connaissance des problématiques hospitalières (structures, processus) et des métiers de la santé ;

Et humainement ?

  • Des qualités d’autonomie, de flexibilité et de responsabilité
  • Curieux, dynamique et créatif, avec une réelle envie de faire preuve d’innovation
  • Esprit d’équipe et la volonté de prendre part à une aventure collective
  • Sens de l’écoute, du résultat et de la qualité