Stage - détection d'anomalie, correction bias collecte - Paris

Internship
Paris
Posted on 07-20-2021

Assistance Publique - Hôpitaux de Paris - DSI

Réaliser les projets digitaux innovants au sein de l’hôpital.

More informations
  • Website
  • Unknown
  • Between 50 and 250 employees
  • Others
Read more

L’Assistance Publique - Hôpitaux de Paris (AP - HP) est un établissement public de santé, centre hospitalier universitaire (CHU) d’Île-De-France. Ses missions sont le soin, la recherche et l’enseignement. À dimension internationale, il est constitué de 39 hôpitaux, organisés en 12 groupes hospitaliers. Accueillant plus de 7 millions de patients par an, son budget annuel est près de 7,2 milliards d’euros.

La Direction des Systèmes d’Information (DSI) a pour mission d’assister le Directeur Général de l’Assistance publique - hôpitaux de Paris dans la conception, le pilotage et la mise en œuvre de la politique du système d’information de l’AP-HP. Elle est rattachée au secrétariat général de l’AP-HP. Le budget d’investissement géré est de près de 70 M€ et le budget d’exploitation est de 125 M€. Le nombre d’agents de la DSI centrale en équivalents temps pleins est de 370.

Le département WIND, organisé en quatre pôles, au sein de la DSI pilote les projets d’innovation et de structuration des données médicales.


L’Entrepôt des Données de Santé (EDS) de l’AP-HP centralise les données collectées dans le cadre du soin à l’AP-HP pour les mettre à disposition de projets de recherche ou de projets visant à améliorer le pilotage de l’activité hospitalière. Les données présentes dans l’EDS sont celles qui ont été collectées par les équipes de soin dans certaines applications du SI clinique (SIC) de l’AP-HP, dont en particulier le dossier patient informatisé (DPI) ORBIS. Le SIC des 39 hôpitaux de l’AP-HP est en constante évolution, et le déploiement d’ORBIS est par exemple réalisé module par module, parfois hôpital par hôpital mais également service par service. De plus, le déploiement d’un module ne signifie pas toujours son utilisation effective par les équipes de soin, qui peuvent souvent utiliser des applications historiques durant une période de transition. Comprendre et rendre actionnable par les équipes de recherche cette évolution du SIC de l’AP-HP est un pré-requis de nombreuses recherches sur données, afin en particulier de corriger le biais de collecte induit qui représente l’une des principales limites de ce type de base de données (“données de vie réelle”).

Au sein de l’équipe data science de la DSI, vous aurez pour mission de poursuivre le développement et la validation d’une base de connaissances décrivant le déploiement des principales applications du SIC de l’AP-HP. Cette base de connaissance pourra être actionnée par les datascientists utilisateurs de l’EDS. Elle sera alimentée par une analyse automatisée des données présentes dans l’EDS afin de calculer des indicateurs caractérisant l’utilisation effective du SIC. Ces indicateurs pourront également permettre de détecter des anomalies dues par exemple à des changements de configuration des logiciels du SIC. Votre travail se fera en étroite collaboration avec les autres membres de l’équipe data science, en particulier ceux en charge de structurer les librairies python de datascience ainsi qu’avec les autres équipes du pôle Innovation et Données et certains cliniciens-chercheurs.

A la fin de votre stage, vous serez amené.e à communiquer vos résultats sous plusieurs formats : une base de connaissance actionnable depuis une librairie python, une documentation scientifique communiquée aux équipes de recherche utilisatrices, et éventuellement une communication sous forme de webinar.

Missions principales :

  • Définition du besoin utilisateur relatif à une base de connaissance centralisant les indicateurs de déploiement et d’utilisation du SIC;
  • Revue de littérature relative à la structuration d’une telle base de connaissance à des fins de recherche;
  • Développement d’indicateurs, calculés automatiquement sur la base de données de l’EDS, caractérisant l’utilisation effective des applications du SIC ;
  • Validation des performances des indicateurs calculés ;
  • Mise en production de la base de connaissance au sein des librairies de data science de l’EDS;
  • Communication des résultats;

Requis :
• Expertise en python (pandas, pyspark, librairies de visualisation plotly ou altair) ;
• Expertise en statistique ;

Apprécié :
• Connaissance des problématiques fonctionnelles hospitalières (structures, processus) et des métiers de la santé ;
• Connaissance du monde de la recherche ;

Travail en équipe :
• Concevoir et évaluer un projet / un processus relevant de son domaine de compétence ;
• Identifier, analyser, prioriser et synthétiser les informations relevant de son domaine d’activité ;
• Animer / communiquer / motiver au sein d’une équipe projet ;
• Capacité à animer des réunions courtes, en imposant une préparation et un compte rendu ;
• Rédiger et mettre en forme des notes, documents et /ou rapports, relatifs à son domaine de compétence ;
• Concevoir et rédiger une documentation spécifique à son domaine de compétence ;
• S’exprimer en public ;