Entrepreneurship in the territories: is it the right time?

Exploration causale et explicabilité des relations entre variables dans les Bilans Carbone® : vers une compréhension fine et vérifiable des émissions organisationnelles Qui sommes-nous ?
Le Laboratoire d’Informatique de Paris 6 (LIP6 – Sorbonne Université) est une unité de recherche de référence en intelligence artificielle explicable et en modélisation probabiliste. En partenariat avec l’Association pour la Transition Bas Carbone (ABC), structure pionnière du Bilan Carbone® en France, nous développons des outils scientifiques et opérationnels pour accompagner les organisations dans leur transition bas carbone.
Contexte scientifique et opérationnel
Le Bilan Carbone® est une méthode de comptabilité des gaz à effet de serre (GES) développée en France depuis 2004 pour aider les organisations à évaluer et à réduire leurs émissions. Chaque source d’émission repose sur une donnée d’activité (DA) et un facteur d’émission (FE), dont la précision et la disponibilité dépendent du contexte sectoriel et de la qualité des données collectées. Cette variabilité entraîne une forte hétérogénéité dans la qualité des bilans réalisés. Pour y remédier, l’Association pour la transition Bas Carbone (ABC) a constitué une base de données nationale (OCCF) regroupant des Bilans Carbone® et Bilans GES réglementaires. Cette base constitue une ressource unique pour étudier la structure, la cohérence et les déterminants des émissions des organisations françaises. Des travaux exploratoires menés au LIP6 (Sorbonne Université) ont permis de produire des statistiques descriptives et d’identifier des dépendances statistiques entre variables. Ce stage propose d’approfondir cette analyse en mobilisant les approches de causalité, d’explicabilité et de raisonnement bayésien afin de mieux comprendre les mécanismes sous-jacents à la production et à la variabilité des Bilans Carbone®.
Cadre théorique
Causalité et inférence structurelle
Les approches causales, initiées par Judea Pearl et développées dans la lignée de la « causal revolution » (Causality : Models, Reasoning, and Inference, 2000), visent à dépasser la simple corrélation pour identifier des relations de cause à effet. Elles reposent sur la modélisation des dépendances via des graphes causaux dirigés (DAGs) et sur 1 des opérateurs d’intervention (do-calculus), permettant de répondre à des questions du type : que se passerait-il si une variable changeait? Dans le contexte du Bilan Carbone®, cela permet d’étudier l’effet causal du secteur d’activité, de la taille ou du périmètre organisationnel sur la structure et la répartition des émissions.
Apprentissage de structure causale
L’apprentissage de structure causale vise à inférer la forme du graphe causal directement à partir des données. Deux grandes familles d’approches coexistent :
Ces algorithmes permettent de révéler les dépendances structurelles entre postes d’émission, secteurs d’activité, intensité énergétique et émissions totales. Ils peuvent ensuite être validés ou ajustés par des experts métier, garantissant un équilibre entre rigueur statistique et interprétation domain-specific.
Réseaux bayésiens
Les réseaux bayésiens, formalisés par Pearl (1985), Lauritzen & Spiegelhalter (1988), offrent un cadre probabiliste pour représenter les dépendances conditionnelles entre variables. Ils permettent la prédiction, la simulation, mais aussi l’inférence causale lorsqu’ils sont combinés avec des hypothèses structurelles. Appliqués à la base OCCF, ces réseaux peuvent révéler les interactions latentes entre les postes d’émission, les catégories d’activité et les variables organisationnelles. Ils servent également de base à la simulation de bilans hypothétiques et à la détection d’anomalies.
Explicabilité et intelligence artificielle interprétable
L’explicabilité (Explainable Artificial Intelligence, ou XAI) est devenue une exigence majeure pour les modèles d’apprentissage automatique utilisés dans des domaines sensibles ou décisionnels. Les méthodes comme LIME (Local Interpretable Model-agnostic Explanations, Ribeiro et al., 2016) ou SHAP(SHapley Additive exPlanations, Lundberg & Lee, 2017) permettent de visualiser et d’interpréter la contribution des variables à la décision d’un modèle. Dans le cadre du Bilan Carbone®, ces approches permettront d’expliquer pourquoi un modèle estime une incohérence dans un bilan ou attribue un certain poids à une catégorie d’émission renforçant la transparence et la vérifiabilité des analyses.
Objectifs du stage
L’objectif principal du stage est d’intégrer les outils de causalité explicable dans l’analyse des Bilans Carbone® afin de :
Questions de recherche
Vos missions
Sous la supervision d’un chercheur en apprentissage causal et d’un référent métier de l’ABC, vous serez amené·e à :
2. Apprentissage causal et inférence structurelle :
3. Explicabilité et visualisation
4. Score de qualité explicable
Résultats attendus
Avantages:
Bibliographie sélective

Sensibiliser et faire monter en compétences tous les acteurs aux enjeux climat et plus particulièrement ceux liés à la comptabilité carbone. Porter et diffuser la méthodologie du Bilan Carbone(r)
SSE organization
This structure is based on a principle of solidarity and social utility: its management is democratic and participative, and its profit-making potential is limited. It may be an association, cooperative, foundation, mutual or ESUS company.
💡 Need to strengthen your profile to match perfectly to this job?
This training might interest you: Lance ta carrière dans la tech en te formant au métier de data analyst!
Discover all the resources to inspire and guide you in the world of positive impact. Testimonials, analyses, job descriptions and skills of tomorrow, everything you always wanted to know without daring to ask.






You no longer thrive in your work, and you plan to change profession to find more meaning in your professional life? Discover the resources to help you think about a retraining project and find your way.