Data Engineer - Medical Imaging - Paris

Short-term contract
Paris
Health
38000 - 55000€ (Annual)
Posted on 01-31-2022
This job is no longer available.

Fondation de l'AP-HP

La Fondation de l’AP-HP est une fondation hospitalière qui a pour objectif de soutenir l’organisation des soins, le personnel hospitalier et la recherche au sein des 38 hôpitaux qui composent l’AP–HP.

More information
  • Website
  • Unknown
  • Between 50 and 250 employees
  • Health
Impact study
Fondation de l'AP-HP did not yet communicate its impact measurement.
Read more

Avec ses 800 services hospitaliers couvrant 84 spécialités et avec plus de 4 000 projets de recherche en cours, l’AP-HP est une institution reconnue dans le monde médical pour la qualité et la compétence de ses professionnels de santé, exerçant dans nos 39 hôpitaux.
Travailler à l’AP-HP c’est poursuivre un intérêt général dans un grand service public et venir en appui nos 100 000 professionnels pour que soit assurée la meilleure prise en charge possible des 10 millions de patients par an qui sont accueillis dans nos hôpitaux.
L’AP-HP est le 1er Groupe Hospitalo-Universitaire européen et fait partie des 3 plus importants groupes hospitaliers mondiaux.
Nos équipes participent directement à l’effort de consolidation de ce haut niveau d’excellence médicale. Pour cela, chaque collaborateur de la Direction des Systèmes d’Information de l’AP-HP s’engage à :

  1. s’investir quotidiennement pour atteindre ses objectifs placer son intégrité et celle de l’institution au premier plan,
  2. travailler en équipe,
  3. fournir le meilleur service pour nos utilisateurs finaux qu’ils soient professionnel de santé ou patient,
  4. faire preuve de diplomatie en toute circonstance,
  5. respecter sans condition les règles de confidentialité inhérentes à nos activités.

La Direction des Systèmes d’Information :

  1. Intègre des logiciels/progiciels,
  2. Développe des applications,
  3. Teste et qualifie des produits,
  4. Développe des méthodes et outils de traitement de données massives,
  5. Construit des architectures et assure une urbanisation optimale des applications informatiques,
  6. Pilote des infrastructures complexes : serveurs, stockage, réseaux de haute performance.

Ce que vous ferez dans notre équipe contribuera directement au bon fonctionnement de l’AP-HP pour assurer notre Priorité N°1 : fournir le meilleur service à nos patients et nos professionnels !


La mission de votre équipe

Afin de permettre le développement de projets de recherche innovants, en particulier dans le domaine de l’intelligence artificielle, l’AP–HP a mis en place une plateforme Big Data, infrastructure informatique propre, intégrant des capacités de stockage et de calcul pour l’exploitation sécurisée et performante des données de santé dont elle est dépositaire. Cette plateforme héberge notamment l’entrepôt de données de santé (EDS) de l’AP-HP.

L’Entrepôt de Données de Santé (EDS) de l’AP-HP intègre des données administratives et médicales de plus de 8 millions de patients hospitalisés ou venus en consultation au sein des 39 établissements de l’AP-HP (20 millions de dossiers médicaux, plus de 10 millions de diagnostics, 181 millions de résultats de laboratoires…). Cet entrepôt permet d’améliorer le pilotage de l’activité hospitalière et de faire avancer la recherche scientifique dans le domaine de la santé en favorisant la réalisation d’études sur données, la mise en place d’essais cliniques et le développement d’algorithmes d’aide à la décision.

La Plateforme Big Data de l’AP-HP compte actuellement +20 machines pour le cluster Hadoop (15To RAM, +1500 Cores, 1.8Po d’espace disque), de machines GPU (16 V100, 24 P40 Nvidia), de dizaines de machines dédiées aux environnements Jupyter pour l’analyse de données, et de nombreuses autres machines applicatives.

Votre équipe, le domaine « Plateforme Big Data », a pour mission l’intégration des données de santé massives et complexes (données structurés, textes, imagerie, voix, signaux physiologiques, etc.) et leur utilisation à grande échelle, de manière performante, ergonomique et sécurisée dans le respect des principes et règles de gouvernance des données définis par l’AP-HP. Dans le domaine de l’imagerie médicale, les images sont majoritairement produites dans les plus de 20 services de radiologie de l’APHP et stockés dans un PACS Centrale APHP, géré par le pôle imagerie de la DSI.

Vos missions

L’équipe Imagerie de la plateforme BigData est en charge de la collecte et de la mise à disposition des données d’imagerie. Elle accompagne les projets de recherche en imagerie médicale, en participant à l’élaboration du plan de gestion de la données et en mettant en place l’ensemble des ressources et outils nécessaire à sa résolution. Dans ce contexte, l’équipe réalise le développement de solutions spécifiques comme le serveur PACS SPHERE (https://github.com/aphp/SPHERE) ou des logiciels de dé-identification, d’analyse de données, de transformation de formats, etc. L’équipe est aussi impliquée dans plusieurs projets de co-développement et d’intégration d’outils d’IA pour annoter automatiquement les images médicales (https://www.aphp.fr/actualite/lap-hp-et-imageens-creent-un-modele-de-collaboration-pour-la-structuration-et-la).

Au sein de l’équipe en charge de la Plateforme données massives de l’APHP, vous participerez au cadrage et au développement d’outils et logiciels répondant aux attentes des médecins et chercheurs pour l’exploitation de données massives d’imagerie médicale (majoritairement au format DICOM). Avec l’ensemble des collaborateurs de la plateforme vous réaliserez un développement adapté aux environnement de recherches de la plateforme BigData.

En tant que data engineer spécialisé en imagerie médicale, vous :

  • Réaliserez la définition des besoins et accompagnerez les chefs de projets et les data-scientist dans la création d’outils d’exploitation des données
  • Développerez, industrialiserez et maintiendrez des outils dédiés au traitement de données d’imagerie
  • Industrialiserez le code de transformation et livraison des données et en assurerez sa performance globale
  • Aiderez à l’implémentation de standards et normes de mise à disposition des données
  • Mettrez en place des outils permettant l’enrichissement des données (analyse, annotation, etc)
  • Travaillerez en collaboration avec des partenaires industriels dans le cadre des différents projets de recherche
Profile

Vous avez un savoir faire dans un de ces domaines :

  • Vous maitrisez des langages de programmation suivants :

    • Python
    • Scala / Java (appréciée)
  • Vous avez de bonne connaissance sur les base de données :

    • distribuées (HIVE, HBase, etc.)
    • relationnelles (PostgreSQL, Oracle, etc.)
  • Vous avez de bonne connaissance du traitement des données massives et des technologies Big Data dont :

    • Spark
    • Hadoop
    • HDFS
    • CEPH (appréciée)
    • Kafka (appréciée)
  • Vous avez de bonne connaissance des librairies de traitement d’image (pydicom, itk, vtk, scikit, pil, pytorch …)
  • Vous avez de bonne connaissance des outils de workflow/orchestration de pipeline (airflow, dagster …)
  • Vous avez des connaissances sur les différents formats de stockage suivants :

    • Avro
    • Parquet
    • ORC
    • SequenceFile
  • Vous avez des connaissances en méthodes de développement logiciel (Méthodologie agile, qualification, recette, mise en production, maintenance opérationnelle, pilotage, …)
  • Vous maitrisez les systèmes d’exploitation serveur UNIX
  • Vous avez de bonnes connaissances des méthodologies DevOps et des outils associés (Docker, Kubernetes, GitLab …)

Idéalement, vous..

  • Avez un diplôme d’ingénieur ou équivalent (bac+4/5, master2) en informatique ou sciences avec formation complémentaire en informatique
  • Connaissez les standards en imagerie médicale (DICOM, HL7-FHIR, OMOP, …)
  • Avez des connaissances des bonnes pratiques de sécurité informatique et de la réglementation informatique et libertés
  • Adhérez aux valeurs du service public et vous avez un intérêt prononcé pour le domaine de la santé
  • Avez un niveau d’anglais courant

Et humainement ?

  • Capacité à appréhender des enjeux liés à la recherche, à l’analyse de données et aux technologies de machine learning/deep learning, notamment dans le domaine de la santé (santé publique, imagerie médicale, épidémiologie, …)
  • Esprit d’équipe et la volonté de prendre part à une aventure collective
  • Sens de l’écoute, du résultat et de la qualité
  • Des qualités d’autonomie, de flexibilité et de responsabilité
  • Curieux, rigoureux, dynamique et créatif, avec un réel envie de faire preuve d’innovation
  • Être ouvert aux nouvelles technologies dans votre domaine