Machine learning engineer - Paris

short term contract
Paris
Posted on 08-10-2022

Assistance Publique - Hôpitaux de Paris - DSI

Réaliser les projets digitaux innovants au sein de l’hôpital.

More informations
  • Website
  • Unknown
  • Between 50 and 250 employees
  • Others
Read more

Avec ses 800 services hospitaliers couvrant 84 spécialités et avec plus de 4 000 projets de recherche en cours, l’AP-HP est une institution reconnue dans le monde médical pour la qualité et la compétence de ses professionnels de santé, exerçant dans nos 39 hôpitaux.
Travailler à l’AP-HP c’est poursuivre un intérêt général dans un grand service public et venir en appui nos 100 000 professionnels pour que soit assurée la meilleure prise en charge possible des 10 millions de patients par an qui sont accueillis dans nos hôpitaux.
L’AP-HP est le 1er Groupe Hospitalo-Universitaire européen et fait partie des 3 plus importants groupes hospitaliers mondiaux.
Nos équipes participent directement à l’effort de consolidation de ce haut niveau d’excellence médicale. Pour cela, chaque collaborateur de la Direction des Systèmes d’Information de l’AP-HP s’engage à :

  1. s’investir quotidiennement pour atteindre ses objectifs placer son intégrité et celle de l’institution au premier plan,
  2. travailler en équipe,
  3. fournir le meilleur service pour nos utilisateurs finaux qu’ils soient professionnel de santé ou patient,
  4. faire preuve de diplomatie en toute circonstance,
  5. respecter sans condition les règles de confidentialité inhérentes à nos activités.

La Direction des Systèmes d’Information :

  1. Intègre des logiciels/progiciels,
  2. Développe des applications,
  3. Teste et qualifie des produits,
  4. Développe des méthodes et outils de traitement de données massives,
  5. Construit des architectures et assure une urbanisation optimale des applications informatiques,
  6. Pilote des infrastructures complexes : serveurs, stockage, réseaux de haute performance.

Ce que vous ferez dans notre équipe contribuera directement au bon fonctionnement de l’AP-HP pour assurer notre Priorité N°1 : fournir le meilleur service à nos patients et nos professionnels !


Les algorithmes de data science à l’Entrepôt des Données de Santé

Les données massives de l’Entrepôt de Données de Santé (EDS) contiennent de très nombreuses informations d’intérêt pour améliorer les connaissances médicales et optimiser le système de santé, mais celles-ci sont souvent présentes de manière diffuse (i.e. l’information est déduite à partir de nombreuses données) et non-structurée (i.e. sous la forme de textes, d’images, de signaux). Il apparaît nécessaire de pré-traiter les données à large échelle et à l’aide d’algorithmes de data science dédiés avant de pouvoir répondre aux questions posées par les utilisateurs de l’EDS. De nombreux algorithmes de Natural Language Processing (NLP) sont en particulier développés, validés et mis en production pour rendre possible l’exploitation des dizaines de millions de comptes rendus cliniques présents dans l’EDS (par exemple la détection automatique du layout des PDF, la pseudonymisation des textes, l’extraction de variables structurées à partir des textes, l’entraînement de modèles de machine learning à large échelle, etc.).

Les équipes

Les équipes Data Science et Plateforme du Pôle Innovation et Données collaborent pour développer, valider puis mettre en production des algorithmes de pré-traitement des données. Pour chaque algorithme, un équipe projet est constituée qui associe également des utilisateurs (chercheurs, cliniciens, etc.) qui travaillent dans le cadre d’études pilotes.

Votre mission

Votre travail consistera dans un premier temps à consolider la pipeline d’intégration et de pré-traitement des données textuelles. Vous travaillerez à l’interface entre les data engineers de l’équipe Plateforme et les data scientists de l’équipe Data Science afin de vous assurer que les algorithmes développés puissent être mis en production à large échelle tout en utilisant les modèles statistiques de l’état de l’art. Vous gérerez la synchronisation des développement, l’industrialisation des algorithmes et leur documentation technique et fonctionnelle. Dans un second temps, vous étendrez ces missions à des algorithmes analysant d’autres catégories de données (biologie, parcours patient, méta-données d’imagerie, etc.).

Profile

Idéalement, vous…

  • Avez un diplôme d’ingénieur ou équivalent (bac+5, master 2) en data science/data ingénierie ;
  • Adhérez aux valeurs du service public et vous êtes passionné.e par le domaine de la santé ;

…et vous avez un savoir faire dans plusieurs de ces domaines

  • Expertise en développement Python, Scala ;
  • Expertise en analyse de bases de données, familiarité avec le framework Spark ;
  • Industrialisation et mise en production de modèles de machine learning ;

Et humainement ?

  • Des qualités d’autonomie, de flexibilité et de responsabilité
  • Curieux, dynamique et créatif, avec une réelle envie de faire preuve d’innovation
  • Esprit d’équipe et la volonté de prendre part à une aventure collective
  • Sens de l’écoute, du résultat et de la qualité