Data scientist - Paris

short term contract
Paris
Posted on 12-17-2021

Assistance Publique - Hôpitaux de Paris - DSI

Réaliser les projets digitaux innovants au sein de l’hôpital.

More informations
  • Website
  • Unknown
  • Between 50 and 250 employees
  • Others
Read more

Avec ses 800 services hospitaliers couvrant 84 spécialités et avec plus de 4 000 projets de recherche en cours, l’AP-HP est une institution reconnue dans le monde médical pour la qualité et la compétence de ses professionnels de santé, exerçant dans nos 39 hôpitaux.
Travailler à l’AP-HP c’est poursuivre un intérêt général dans un grand service public et venir en appui nos 100 000 professionnels pour que soit assurée la meilleure prise en charge possible des 10 millions de patients par an qui sont accueillis dans nos hôpitaux.
L’AP-HP est le 1er Groupe Hospitalo-Universitaire européen et fait partie des 3 plus importants groupes hospitaliers mondiaux.
Nos équipes participent directement à l’effort de consolidation de ce haut niveau d’excellence médicale. Pour cela, chaque collaborateur de la Direction des Systèmes d’Information de l’AP-HP s’engage à :

  1. s’investir quotidiennement pour atteindre ses objectifs placer son intégrité et celle de l’institution au premier plan,
  2. travailler en équipe,
  3. fournir le meilleur service pour nos utilisateurs finaux qu’ils soient professionnel de santé ou patient,
  4. faire preuve de diplomatie en toute circonstance,
  5. respecter sans condition les règles de confidentialité inhérentes à nos activités.

La Direction des Systèmes d’Information :

  1. Intègre des logiciels/progiciels,
  2. Développe des applications,
  3. Teste et qualifie des produits,
  4. Développe des méthodes et outils de traitement de données massives,
  5. Construit des architectures et assure une urbanisation optimale des applications informatiques,
  6. Pilote des infrastructures complexes : serveurs, stockage, réseaux de haute performance.

Ce que vous ferez dans notre équipe contribuera directement au bon fonctionnement de l’AP-HP pour assurer notre Priorité N°1 : fournir le meilleur service à nos patients et nos professionnels !


Equipe Data science

L’équipe data science créée en 2020 vise à structurer les compétences en analyse de données au sein du pôle Innovations et Données. Elle travaille en particulier sur l’Entrepôt des Données de Santé (EDS) de l’AP-HP ainsi que sur les données de la banque nationale des maladies rares (BNDMR) et de la plateforme bio-informatique.
Les missions de l’équipe data science sont:

  • La préparation de jeux de données adaptés à des besoins spécifiques (librairies de pre-processing, structuration de challenges, construction d’échantillons représentatifs etc.) ;
  • L’élaboration de stratégies de protections de la vie privée (pseudonymisation des textes, anonymisation de différentes catégories de données, confidentialité différentielle etc.) ;
  • Le développement de modèles statistiques et d’indicateurs avancés à des fins de recherche ou de pilotage ;
  • La mise en production de modèles statistiques pour les différents utilisateurs de l’entrepôt de données de santé, de la banque nationale des maladies rares et de la plateforme bio-informatique ;
  • Le développement de partenariats académiques et l’animation de la communauté de data science

Votre mission

Au sein de l’équipe datascience, vous aurez pour mission de proposer et de développer des modèles d’analyse de données répondant aux attentes des équipes du pôle Innovations & Données ainsi qu’à la communauté de chercheurs travaillant sur les différentes bases de données du pôle.
Après vous être familiarisé.e avec les bases de données du pôle et en particulier l’EDS, vous contribuerez à l’effort transversal afin d’améliorer la richesse et la qualité des données intégrées et leur documentation.
Pour enrichir la base de données par des données structurées, vous contribuerez au développement et à la mise en production de modèles de NLP qui extrairont des comptes rendus médicaux des données d’intérêt.
Pour faciliter la prise en main de la base par les équipes de recherche, vous serez amené.e à développer des scripts de data management ou des librairies python de pre-processing ainsi que des outils logiciels. Vous travaillerez également à améliorer les processus de pseudonymisation/anonymisation actuellement utilisés à l’EDS et au sein de la BNDMR.
Votre travail se fera en interaction avec de nombreux acteurs gravitant autour de l’EDS : les équipe SI Recherche et SI Pilotage du pôle, l’équipe technique en charge de la Plateforme Méga Données pour la mise en production des modèles et librairies développés, les différentes équipes de recherche de l’AP-HP, les datascientists de l’AP-HP et partenaires externes (Sorbonne Université, Université de Paris, INRIA, etc.).
Vous interviendrez dans le cadre de groupes de travail pluridisciplinaires pour définir et implémenter de nouveaux services pour la communauté de recherche en datascience (mise à disposition de modèles pré-entraînés, datasets annotés, outils pour améliorer l’intégrité de la recherche etc.).
Chaque année des objectifs précis seront établis en lien avec la/le responsable hiérarchique.

Vos missions principales seront:

  • La réalisation d’analyses diverses sur les bases de données du pôle Innovations et Données ;
  • Le développement de modèles de machine learning (ML), en particulier en NLP;
  • La mise en production de modèles de ML;
  • Le développement de librairies de pre-processing adaptées au contexte de l’AP-HP ;
  • Une contribution à la conception et au développement des applications d’aide à la recherche (visualisation, outils de sélection de cohortes etc.);
  • Une contribution à la standardisation de la modélisation des données au format OMOP ;
  • Le développement des algorithmes de pseudonymisation/anonymisation ;
  • Le développement de partenariats académiques ;
  • L’animation d’écosystèmes open-source et data science
    Vos activités viseront principalement à structurer, enrichir, standardiser les données de l’EDS dans le domaine de la cancérologie
Profile

Idéalement, vous..

  • Avez un diplôme d’ingénieur ou équivalent (bac+5, master2) en data science ;
  • Avez au moins 2-3 ans d’expérience professionnelle dans le domaine de la data science, ou un doctorat portant sur des thématiques proches ;
  • Adhérez aux valeurs du service public et vous êtes passionné.e par le domaine de la santé ;
  • Avez un niveau d’anglais courant ;

Vous avez un savoir faire dans plusieurs de ces domaines :

  • Expertise en traitement automatiques des langues (NLP) ;
  • Expertise en statistiques ;
  • Expertise en analyse de bases de données (SQL) ;
  • Expertise en développement de modèles de machine learning (Tensorflow, Pytorch etc.) ;
  • Expertise en calcul distribué et en data management (Spark, Scala, etc.) ;
  • Expertise en développement Python ;
  • Expertise en déploiement de modèles statistiques/de machine learning ;
  • Connaissance des problématiques hospitalières (structures, processus) et des métiers de la santé ;

Et humainement ?

  • Des qualités d’autonomie, de flexibilité et de responsabilité
  • Curieux, dynamique et créatif, avec une réelle envie de faire preuve d’innovation
  • Esprit d’équipe et la volonté de prendre part à une aventure collective
  • Sens de l’écoute, du résultat et de la qualité