Biostatisticien (H/F) - Paris

Long term
Paris
Posted on 10-06-2021

Assistance Publique - Hôpitaux de Paris - DSI

Réaliser les projets digitaux innovants au sein de l’hôpital.

More informations
  • Website
  • Unknown
  • Between 50 and 250 employees
  • Others
Read more

L’Assistance Publique - Hôpitaux de Paris (AP - HP) est un établissement public de santé, centre hospitalier universitaire (CHU) d’Île-De-France. Ses missions sont le soin, la recherche et l’enseignement. À dimension internationale, il est constitué de 39 hôpitaux, organisés en 12 groupes hospitaliers. Accueillant plus de 7 millions de patients par an, son budget annuel est près de 7,2 milliards d’euros.

La Direction des Systèmes d’Information (DSI) a pour mission d’assister le Directeur Général de l’Assistance publique - hôpitaux de Paris dans la conception, le pilotage et la mise en œuvre de la politique du système d’information de l’AP-HP. Elle est rattachée au secrétariat général de l’AP-HP. Le budget d’investissement géré est de près de 70 M€ et le budget d’exploitation est de 125 M€. Le nombre d’agents de la DSI centrale en équivalents temps pleins est de 370.

Le département WIND, organisé en quatre pôles, au sein de la DSI pilote les projets d’innovation et de structuration des données médicales.


La mission de votre équipe

La Banque Nationale de Données Maladies Rares (BNDMR) est un projet prioritaire du Plan National Maladies Rares 2 (PNMR 2), et reconduit par le PNMR3, financés par le ministère de la Santé. L’AP-HP a été missionnée par la Direction Générale de l’Offre de Soins pour assurer la maitrise d’œuvre de la BNDMR.

Ses objectifs sont :
• De faire avancer les connaissances sur les maladies rares en France (histoire naturelle des maladies, modes de prise en charge, description de la demande de soins, adéquation de l’offre de soins, économie de la santé, recherche non interventionnelle sur données, etc. ;
• De favoriser l’identification des patients susceptibles d’être inclus dans des essais cliniques ;
• De permettre une meilleure coordination entre les structures maladies rares (filières, centres de référence, centre de compétence, etc.).

La cellule opérationnelle est composée d’un directeur, ainsi que de 15 professionnels spécialisés en systèmes d’information et/ou conduite de projet et/ou en exploitation de données/santé publique. La cellule opérationnelle a également recours, ponctuellement, à des prestations externes, des stagiaires et des apprentis.

Votre mission

Dans le contexte de la forte augmentation des données de la BNDMR, et de l’appariement de cette base aux données de l’Assurance Maladie (SNDS), et de l’Entrepôt de Données de Santé (EDS) de l’AP-HP, l’équipe Data BNDMR cherche :

- D’une part à harmoniser et à industrialiser ses process de préparation et d’exploitation des données de la BNDMR à des fin d’analyses biostatistiques
- D’autre part à renforcer ses capacités à répondre aux projets et demandes d’analyses émanant des différents partenaires.

Afin d’atteindre ces objectifs, nous recherchons un ingénieur en biostatistique avec une compétence et une expérience avérée en data management pour assurer les missions suivantes :

Data Management

  • Mettre en place les différents scripts d’extraction, de préparation et de transformation des données pour les analyses statistiques

  • Définir une structure fiable, documentée et harmonisée pour les différents scripts/packages à usages réguliers par les membres de l’équipe

  • Produire des statistiques descriptives et restituer des résultats sous forme graphique

    Biostatistique

  • Participer à l’élaboration des protocoles d’études et aux choix méthodologiques (design, objectifs, critère de jugement, population d’étude, plan d’analyse statistique…).

  • Réaliser des analyses statistiques en lien avec des projets internes ou en partenariat avec des laboratoires publics/privés

  • Réaliser des analyses statistiques sur des bases de données complexes auxquelles la BNDMR sera appariée (SNDS, EDS, PMSI)

  • Valoriser les résultats en contribuant à des publications scientifiques, posters et abstracts


Vous êtes

Ingénieur/Master2 (ENSAI, Santé publique, Biostatistique, analyse et traitement informatique de données biomédicales…)

Avec les compétences suivantes

  • Maîtrise indispensable des outils d’analyse de données (R et/ou Python)
  • Maîtrise indispensable des systèmes de gestion des bases de données relationnelles (SGBDR PostgreSQL) ; une expérience avec un SGBD NoSQL (MongoDB) serait un plus
  • Expérience avérée du travail collaboratif et reproductible (Gitlab)
  • Expérience avérée en techniques de data management (manipulation de plusieurs sources, chainage, typage automatique des variables, gestion des libellés, bibliothèque de formats, sous-populations, gestion des données manquantes …)
  • Expérience avérée en méthodes statistiques appliquées aux sciences de la vie (descriptives, univariées, multivariées, analyse longitudinale, régression linéaire, régression logistique, modèles de survie, …)
  • Expérience avérée en méthodes statistiques multivariées : PCA, PLS/PLS multi bloc, analyse canonique généralisée, méthode de sélection des variables (lasso, réseau élastique, importance de la variable en projection)
  • La maîtrise des méthodes d’apprentissage automatique (Random Forest, Naive Bayes Classifier, SVM…) serait un plus
  • Une première expérience dans la manipulation des données afin de repérer des évènements dans des grands volumes de data, des séries temporelles et si possible, dans un environnement de données de santé, serait un plus
  • La connaissance des bases de données du SNDS (SNIIRAM, PMSI, EGB …) serait un plus
  • Bon niveau d’anglais (oral et écrit)

et idéalement, avec …

  • Intérêt pour les études épidémiologiques
  • Connaissances ou intérêt pour les principes d’ETL et outils BI
  • Sensibilité aux pratiques régies par le RGPD et des orientations et doctrines CNIL sur la protection des données de santé

et vous êtes reconnu pour les qualités suivantes:

  • Aptitude à travailler en équipe, à s’adapter aux contraintes
  • Sens de l’organisation, rigueur et respect des délais
  • Confidentialité : soumis au secret professionnel dans le cadre des données à gérer