Data science engineer collaboration Inria - AP-HP Health Data Warehouse (EDS) - Paris

short term contract
Paris
Posted on 04-30-2022

Assistance Publique - Hôpitaux de Paris - DSI

Réaliser les projets digitaux innovants au sein de l’hôpital.

More informations
  • Website
  • Unknown
  • Between 50 and 250 employees
  • Others
Read more

Avec ses 800 services hospitaliers couvrant 84 spécialités et avec plus de 4 000 projets de recherche en cours, l’AP-HP est une institution reconnue dans le monde médical pour la qualité et la compétence de ses professionnels de santé, exerçant dans nos 39 hôpitaux.
Travailler à l’AP-HP c’est poursuivre un intérêt général dans un grand service public et venir en appui nos 100 000 professionnels pour que soit assurée la meilleure prise en charge possible des 10 millions de patients par an qui sont accueillis dans nos hôpitaux.
L’AP-HP est le 1er Groupe Hospitalo-Universitaire européen et fait partie des 3 plus importants groupes hospitaliers mondiaux.
Nos équipes participent directement à l’effort de consolidation de ce haut niveau d’excellence médicale. Pour cela, chaque collaborateur de la Direction des Systèmes d’Information de l’AP-HP s’engage à :

  1. s’investir quotidiennement pour atteindre ses objectifs placer son intégrité et celle de l’institution au premier plan,
  2. travailler en équipe,
  3. fournir le meilleur service pour nos utilisateurs finaux qu’ils soient professionnel de santé ou patient,
  4. faire preuve de diplomatie en toute circonstance,
  5. respecter sans condition les règles de confidentialité inhérentes à nos activités.

La Direction des Systèmes d’Information :

  1. Intègre des logiciels/progiciels,
  2. Développe des applications,
  3. Teste et qualifie des produits,
  4. Développe des méthodes et outils de traitement de données massives,
  5. Construit des architectures et assure une urbanisation optimale des applications informatiques,
  6. Pilote des infrastructures complexes : serveurs, stockage, réseaux de haute performance.

Ce que vous ferez dans notre équipe contribuera directement au bon fonctionnement de l’AP-HP pour assurer notre Priorité N°1 : fournir le meilleur service à nos patients et nos professionnels !


Collaboration avec Inria

Le poste sera localisé à mi-temps entre Inria Saclay sur le campus de l’Ecole polytechnique et le site de la DSI de l’AP-HP (Hôpital Rothschild). L’embauche sera réalisée par le centre de recherche Inria Saclay – Île-de-France. Créé en 2008, il accueille 450 scientifiques et 60 membres des services d’appui à la recherche. Les scientifiques sont organisés en 28 équipes de recherche dont 23 sont communes avec des partenaires du plateau de Saclay.

Le centre Inria Saclay - Île-de-France est un acteur essentiel de la recherche en sciences du numérique sur le plateau de Saclay. Il porte les valeurs et les projets qui font l’originalité d’Inria dans le paysage de la recherche : l’excellence scientifique, le transfert technologique, les partenariats pluridisciplinaires avec des établissements aux compétences complémentaires aux nôtres, afin de maximiser l’impact scientifique, économique et sociétal d’Inria.

Contexte et atouts du poste

L’équipe Inria a été fortement impliquée dans le pilotage de la crise sanitaire du Covid-19 au sein de l’AP-HP. Cette implication a été matérialisée par un travail intense sur plus de 2 mois avec l’Entrepôt de Données de Santé (EDS) de l’AP-HP. L’équipe a mis en place des outils logiciels en Python servant à la réalisation d’un dashboard web qui était quotidiennement transmis au sein de l’AP-HP. L’objectif de ce poste d’ingénieur à l’interface entre data science et recherche clinique est de poursuivre ce travail entre Inria et l’EDS de l’AP-HP.

Cette video parle du travail réalisé et donne les bases du projet: https://www.youtube.com/watch?v=9uuFGByFSok

Voici une autre communication sur le suet : https://www.inria.fr/fr/scikiteds

Mission confiée

La librairie Python développée durant la crise Covid s’appuie sur un base SQL (de type postgres ou PySpark/HIVE) au format standard OMOP. Ce schéma de base de données est un standard du monde médical permettant la potentielle réutilisation du code à grande échelle, y compris sur le Health Data Hub. La librairie et le dashboard sont basés sur le stack de Python scientifique Numpy, Scipy, Pandas, Koalas, Matplotlib, Plotly et scikit-learn. La librairie est testée avec pytest et l’intégration continue se fait avec Gitlab-CI.

Objectifs:

  • Reprise et généralisation sur d’autres thématiques médicales des librairies développées durant la crise sanitaire. L’objectif est de mettre le code en open-source (utilisation par les hôpitaux ayant standardisé leurs données au format OMOP).
  • Création de briques logicielles transversales pour la data-quality / data management / enrichissement de données (ex : pipelines NLP/validateur des extractions, outil d’annotation de données)
  • Développer des briques de visualisation de données pour Cohort360 (logiciel de repérage de patients): sankey plot, pyramide des âges, etc.
  • Développer des briques d’exploration de données pour le pilotage

En termes de code déjà publique qui servira de base:

  • le code de la librairie covid19-python développée par l’équipe Inria
  • le GitHub de l’AP-HP, dont la librairie eds-nlp: https://github.com/aphp/edsnlp

Principales activités

Principales activités:

  • Analyser les besoins de l’AP-HP
  • Proposer des solutions logiciels
  • Développer des programmes en Python et possiblement web
  • Tester, modifier jusqu’à valider les outils développés
  • Animer une communauté d’utilisateurs cliniciens
Profile

Compétences techniques :

  • Python
  • Git
  • Numpy, Scipy, Scikit-Learn, Matplotlib, Pandas
  • SQL

Langues : Français et Anglais courant