Data Engineer - Medical Imaging (OPERANDI project) - Paris

short term contract
Paris
38000 - 55000€ (Annual)
Posted on 07-29-2022

Assistance Publique - Hôpitaux de Paris - DSI

Réaliser les projets digitaux innovants au sein de l’hôpital.

More informations
  • Website
  • Unknown
  • Between 50 and 250 employees
  • Others
Read more

Avec ses 800 services hospitaliers couvrant 84 spécialités et avec plus de 4 000 projets de recherche en cours, l’AP-HP est une institution reconnue dans le monde médical pour la qualité et la compétence de ses professionnels de santé, exerçant dans nos 39 hôpitaux.
Travailler à l’AP-HP c’est poursuivre un intérêt général dans un grand service public et venir en appui nos 100 000 professionnels pour que soit assurée la meilleure prise en charge possible des 10 millions de patients par an qui sont accueillis dans nos hôpitaux.
L’AP-HP est le 1er Groupe Hospitalo-Universitaire européen et fait partie des 3 plus importants groupes hospitaliers mondiaux.
Nos équipes participent directement à l’effort de consolidation de ce haut niveau d’excellence médicale. Pour cela, chaque collaborateur de la Direction des Systèmes d’Information de l’AP-HP s’engage à :

  1. s’investir quotidiennement pour atteindre ses objectifs placer son intégrité et celle de l’institution au premier plan,
  2. travailler en équipe,
  3. fournir le meilleur service pour nos utilisateurs finaux qu’ils soient professionnel de santé ou patient,
  4. faire preuve de diplomatie en toute circonstance,
  5. respecter sans condition les règles de confidentialité inhérentes à nos activités.

La Direction des Systèmes d’Information :

  1. Intègre des logiciels/progiciels,
  2. Développe des applications,
  3. Teste et qualifie des produits,
  4. Développe des méthodes et outils de traitement de données massives,
  5. Construit des architectures et assure une urbanisation optimale des applications informatiques,
  6. Pilote des infrastructures complexes : serveurs, stockage, réseaux de haute performance.

Ce que vous ferez dans notre équipe contribuera directement au bon fonctionnement de l’AP-HP pour assurer notre Priorité N°1 : fournir le meilleur service à nos patients et nos professionnels !


La mission de votre équipe

Afin de permettre le développement de projets de recherche innovants, en particulier dans le domaine de l’intelligence artificielle, l’AP–HP a mis en place une plateforme Big Data, infrastructure informatique propre, intégrant des capacités de stockage et de calcul pour l’exploitation sécurisée et performante des données de santé dont elle est dépositaire. Cette plateforme héberge notamment l’entrepôt de données de santé (EDS) de l’AP-HP.

L’Entrepôt de Données de Santé (EDS) de l’AP-HP intègre des données administratives et médicales de plus de 8 millions de patients hospitalisés ou venus en consultation au sein des 39 établissements de l’AP-HP (20 millions de dossiers médicaux, plus de 10 millions de diagnostics, 181 millions de résultats de laboratoires…). Cet entrepôt permet d’améliorer le pilotage de l’activité hospitalière et de faire avancer la recherche scientifique dans le domaine de la santé en favorisant la réalisation d’études sur données, la mise en place d’essais cliniques et le développement d’algorithmes d’aide à la décision.

La Plateforme Big Data de l’AP-HP compte actuellement +20 machines pour le cluster Hadoop (5To RAM, +850 Cores, 1.8Po d’espace disque), de machines GPU (24 Nvidia P40, 12 NVIDIA V100), de 10 machines dédiées aux environnements Jupyter pour l’analyse de données, et de nombreuses autres machines applicatives.

Votre équipe, le domaine « Plateforme Big Data », a pour mission l’intégration des données de santé massives et complexes (données structurés, textes, imagerie, voix, signaux physiologiques, etc.) et leur utilisation à grande échelle, de manière performante, ergonomique et sécurisée dans le respect des principes et règles de gouvernance des données définis par l’AP-HP. Dans le domaine de l’imagerie médicale, les images sont majoritairement produites dans les plus de 20 services de radiologie de l’APHP et stockés dans un PACS Centrale APHP, géré par le pôle imagerie de la DSI.

Vos missions

Au sein de l’équipe en charge de la Plateforme mégadonnées de l’APHP, vous serez recruté dans le cadre du projet OPERANDI. Le projet OPERANDI, Optimisation et amélioration de l’efficacité des thérapies ciblées par radionucléides dans les cancers digestifs par imagomics, coordonné par le Pr Valérie Vilgrain, est lauréat de l’appel à projet Recherche Hospitalo-Universitaire en santé (RHU) – Appel à projets – vague 5 – 2021.

Le projet OPERANDI vise à l’élaboration d’algorithmes d’intelligence artificielle basés sur l’imagerie multi-échelle prédictive et pronostique, au développement d’une approche holistique de la thérapie guidée simultanément par TEP-IRM, au décodage des phénomènes de radio-résistance et de réponse tumorale aux traitements et à l’évaluation de nouvelles combinaisons de médicaments et radiopharmaceutiques, ceci dans le but d’améliorer la sélection, le traitement et le suivi des patients.

Vous serez directement intégré dans l’équipe Imagerie de la plateforme mégadonnées. Tout en bénéficiant de l’ensemble des expertises et compétences de la plateforme mégadonnées, vous devez compléter et mettre en œuvre l’ensemble des composants nécessaire à la collecte et l’exploitation des données d’imageries prévues dans le projet RHU OPERANDI. Cela sera réalisé au travers de développements spécifiques, d’intégration d’outils pré-existants et libres ainsi que d’outils et logiciels mis à disposition par les partenaires académiques ou industriels du projet. Afin d’accompagner au mieux la réalisation du projet, vous serez en charge de mettre en œuvre le suivi et le cadrage du projet technique en interagissant avec les médecins, chercheurs, industriels, ingénieurs, data-scientist du projet.

Vous intervenez dans le cadre de groupes de travail pluridisciplinaires visant la définition de nouvelles fonctionnalités et vous réaliserez le test et la validation des nouvelles fonctionnalités implémentées avant leur mise en production. Par ailleurs, vous participez à l’assistance à la mise en œuvre et à la maintenance en condition opérationnelle des outils développés.

En tant que data engineer spécialisé en imagerie médicale, vous :

  • Rédiger des cahiers des charges, spécifications fonctionnelles et techniques ainsi que des dossiers d’architecture technique ;
  • Concevoir et développer des outils (sélection de cohortes de patients, modélisation, algorithmes d’analyse, méthodes statistiques, visualisation, etc.) adaptés au contexte du cluster big data ;
  • Contribuer à la mise en place de pipelines de traitement et d’analyse de données d’imagerie médicales radiologiques (DICOM) et anatomocytopathologies (Lame virtuelle);
  • Optimisation de la performance des outils dans un contexte big data (Hadoop / Spark) ;
  • Rédiger la documentation technique ainsi que la documentation utilisateur ;
  • Dans le cadre des développements réalisés en Open Source, participer à l’animation de la communauté autour des projets créés par la résolution de bugs, la gestion des suggestions de modification du code (Pull/Request) ou encore la gestion des propositions d’améliorations ;
  • Intervenir sur la conception d’outils pour l’annotation de données médicales d’imagerie, textuelles, physiologiques et autres, et ce, afin de permettre aux chercheurs d’entraîner des modèles de Machine Learning/Deep Learning en lien avec l’émergence de l’Intelligence Artificielle à l’AP-HP ;
  • Assurer la sécurisation des applications ou outils développés ;
  • Réaliser une veille technique dans son domaine d’activité et un transfert de compétence au sein de l’équipe.
Profile

Vous avez un savoir faire dans un de ces domaines :

  • Expertise en Programmation Informatique (Windows & UNIX)
  • Bonne maîtrise des langages Python/R et de bash
  • Maîtrise des architectures et de l’écosystème Big Data (Hadoop, Hive, HBase, Spark, Kafka, …)
  • Bonnes connaissances des bases de données Oracle, Postgresql ou MySQL et langages associés (sql)
  • Bonne maîtrise des données d’imagerie médicales radiologiques (DICOM, NIFTI …)
  • Bonne maîtrise des données d’imagerie médicales anatomocytopathologiques (SVS, NDPI, MRXS, …)
  • Connaissance approfondie en méthodes de développement logiciel (méthodes agile), méthodes d’analyse et de modélisation (Kanban, UML …)
  • Connaissance des méthodologies devops et des outils associés (Docker, Kubernetes, Jenkins…)
  • Connaissance des outils de versionning (gitlab
  • Connaissance des outils d’intégration & de déploiement continue (CI/CD)
  • Connaissances en méthode de conduite de projet (planification, reporting, analyse de risques, …)

Idéalement, vous avez des connaisances …

  • du modèle de donnée OMOP et du standard d’interopérabilité HL7-FHIR
  • en administration d’environnements Linux
  • des problématiques fonctionnelles hospitalières (structures, processus) et des métiers de la santé
  • en droit des données informatiques
  • des bonnes pratiques de sécurité informatique ;
  • de la réglementation informatique et libertés ;

Et une expérience concernant le travail en équipe,

  • Concevoir et évaluer un projet / un processus relevant de son domaine de compétence ;
  • Identifier, analyser, prioriser et synthétiser les informations relevant de son domaine d’activité ;
  • Animer / communiquer / motiver au sein d’une équipe projet ;
  • Capacité à animer des réunions courtes, en imposant une préparation et un compte rendu ;
  • Rédiger et mettre en forme des notes, documents et /ou rapports, relatifs à son domaine de compétence ;
  • Concevoir et rédiger une documentation spécifique à son domaine de compétence ;
  • S’exprimer en public ;