Data engineer - Paris

Long term
Paris
Posted on 01-31-2022

Assistance Publique - Hôpitaux de Paris - DSI

Réaliser les projets digitaux innovants au sein de l’hôpital.

More informations
  • Website
  • Unknown
  • Between 50 and 250 employees
  • Others
Read more

Avec ses 800 services hospitaliers couvrant 84 spécialités et avec plus de 4 000 projets de recherche en cours, l’AP-HP est une institution reconnue dans le monde médical pour la qualité et la compétence de ses professionnels de santé, exerçant dans nos 39 hôpitaux.
Travailler à l’AP-HP c’est poursuivre un intérêt général dans un grand service public et venir en appui nos 100 000 professionnels pour que soit assurée la meilleure prise en charge possible des 10 millions de patients par an qui sont accueillis dans nos hôpitaux.
L’AP-HP est le 1er Groupe Hospitalo-Universitaire européen et fait partie des 3 plus importants groupes hospitaliers mondiaux.
Nos équipes participent directement à l’effort de consolidation de ce haut niveau d’excellence médicale. Pour cela, chaque collaborateur de la Direction des Systèmes d’Information de l’AP-HP s’engage à :

  1. s’investir quotidiennement pour atteindre ses objectifs placer son intégrité et celle de l’institution au premier plan,
  2. travailler en équipe,
  3. fournir le meilleur service pour nos utilisateurs finaux qu’ils soient professionnel de santé ou patient,
  4. faire preuve de diplomatie en toute circonstance,
  5. respecter sans condition les règles de confidentialité inhérentes à nos activités.

La Direction des Systèmes d’Information :

  1. Intègre des logiciels/progiciels,
  2. Développe des applications,
  3. Teste et qualifie des produits,
  4. Développe des méthodes et outils de traitement de données massives,
  5. Construit des architectures et assure une urbanisation optimale des applications informatiques,
  6. Pilote des infrastructures complexes : serveurs, stockage, réseaux de haute performance.

Ce que vous ferez dans notre équipe contribuera directement au bon fonctionnement de l’AP-HP pour assurer notre Priorité N°1 : fournir le meilleur service à nos patients et nos professionnels !


La mission de votre équipe

La Banque Nationale de Données Maladies Rares (BNDMR) est un projet prioritaire du Plan National Maladies Rares 2 (PNMR 2), et reconduit par le PNMR3, financés par le ministère de la Santé. L’AP-HP a été missionnée par la Direction Générale de l’Offre de Soins pour assurer la maitrise d’œuvre de la BNDMR.

Ses objectifs sont :
• De faire avancer les connaissances sur les maladies rares en France (histoire naturelle des maladies, modes de prise en charge, description de la demande de soins, adéquation de l’offre de soins, économie de la santé, recherche non interventionnelle sur données, etc. ;
• De favoriser l’identification des patients susceptibles d’être inclus dans des essais cliniques ;
• De permettre une meilleure coordination entre les structures maladies rares (filières, centres de référence, centre de compétence, etc.).

La cellule opérationnelle est composée d’un directeur, ainsi que de 16 professionnels spécialisés en systèmes d’information et/ou conduite de projet et/ou en exploitation de données/santé publique. La cellule opérationnelle a également recours, ponctuellement, à des prestations externes, des stagiaires et des apprentis.

HIERARCHIQUE

Chief Data Officer

FONCTIONNELLES

• Equipes Data, sous la responsabilité du Data Architect
• Fonctionnelle et Techniques de la Cellule opérationnelle BNDMR
• Référente médicale BNDMR
• Professionnels de santé et porteurs de projet
• Laboratoires de recherche publics et privés.

ACTIVITES

L’équipe Data de la BNDMR se compose comme suit :
• Une Chief Data Officer
• Un Data Architect
• Un Référent Data
• Un Senior Data Scientist
• Une Data Manageuse

Dans une perspective d’exploitation et de valorisation des données des maladies rares, la CO BNDMR met en place un Entrepôt de Données de Santé (EDS) qui intègre les données issues de BaMaRa, la base de données de déclaration des activités de soins dans les centres maladies rares.

Comme socle technique de ce projet, la BNDMR a investi dans deux nouvelles machines dont un serveur de calcul avec GPU qui seront intégrées dans le cluster Kubernetes de l’AP-HP.

L’EDS BNDMR cible se base sur un écosystème en plusieurs couches data : raw data layer dans laquelle sont déposées les sources non transformées, un bus de datamarts et enfin une datavisualisation.

Les choix du modèle de données, l’architecture technique et l’outil de data visualisation de l’EDS ont été qualifiés et validés par le Data Architect. La feuille de route pour la mise en production reste conditionnée par l’évolution de l’infrastructure de l’équipe et le passage vers un environnement Kubernetes pour le déploiement et l’exploitation de ses applicatifs.
Dans ce contexte, et sous la responsabilité du Data Architect, nous recherchons un data engineer avec des compétences en DataOps pour assurer les missions suivantes :

Missions DataOps:

• Containerisation et orchestration (Docker, Kubernetes)
• Industrialisation des processus en CI/CD (Gitlab)
• Monitoring et administration de bases de données (PostgreSQL, MongoDB)

Missions Data engineer:

• Participer à la mise en place, l’évolution et la maintenance des datamart.
• Designer des data pipelines et gérer toutes l’intégration des flux de données
• Gestion de l’ETL as a script via Python
• Orchestration & monitoring des pipelines ETL (Airflow ou Gitlab, en cours de prototypage)

Profile

Profil

• De formation bac+4/5 en Informatique (école d’ingénieur ou université) dans un domaine lié à la Data, vous avez une première expérience (alternance ou 1er emploi) dans le domaine de l’administration des technologies big data ou BI.
• Adhésion aux valeurs du service public et intérêt prononcé pour le domaine de la santé

Compétences

• Solides compétences en programmation et en automatisation dans un environnement Linux
• Bonne expertise sur les technologies « DataOps » Docker, Gitlab (versionning et CI/CD), Kubernetes, Airflow
• Expérience avec l’administration des bases de données (SQL [PostgreSQL], NoSQL [MongoDB])
• Bonnes compétences en Python (incl. Pandas) et SQL
• Bases en Réseaux
• Connaissances des différents formats de fichier de données standard (JSON, XML, CSV …).

Connaissances associées

• Notions d’architecture data de type BI (datawarehousing, ETL/ELT, datamarts) et des problématiques associées : modélisations en formes normales et dimensionnelle, historisation, gestion des données de référence.
• Connaissances ou intérêt pour la data visualisation en BI (Cognos)
• Curiosité pour le métier de la santé et les données associées
• Sensibilité aux pratiques régies par le RGPD et des orientations et doctrines CNIL sur la protection des données de santé

Qualités requises

• Capacité à maîtriser rapidement les nouvelles technologies
• Aptitude à travailler en équipe, à s’adapter aux contraintes
• Autonomie et sens de la responsabilité
• Sens de l’organisation, rigueur et respect des délais
• Confidentialité : soumis au secret professionnel dans le cadre des données à gérer

Chez nous, vous aurez des avantages…

  • Equipe dynamique et projets passionnants
  • RTTs, télétravail, remboursement 50% sur le transport, cantine et comité d’entreprise