Détail de l'offre

Stage : IA causale et transport optimal pour évaluation robuste F/H (2026-164052)

Mise en ligne le 03/03/2026

EDF Principales caractéristiques de l'offre d'emploi
Type de contrat :
Stage
Niveau de formation :
BAC +4 / BAC +5
Expérience :
Débutant
Spécialité(s) :
DATA - Mathématiques appliquées - Statistiques
Pays / Région :
France / Ile-de-France
Ville :
EDF LAB PARIS SACLAY

Description de l'offre

La transition énergétique impose le déploiement de nouvelles offres (tarification dynamique, pilotage de la charge) pour encourager la sobriété et la flexibilité. Pour évaluer l'efficacité de ces offres, EDF mène des expérimentations pilotes sur des échantillons de clients volontaires. Cependant, ces volontaires ne sont pas toujours représentatifs de la population française (biais d'auto-sélection : plus sensibles à l'écologie, mieux équipés, etc.). Le défi majeur est la validité externe : comment garantir que les économies d'énergie observées sur le pilote seront reproductibles lors d'un déploiement national ?
Ce stage s'inscrit en amont d'un projet de thèse ambitieux visant à coupler l'Inférence Causale, le Transport Optimal et la théorie PAC-Bayésienne pour certifier ces estimations.

 

Intégré(e) au département SEQUOIA (Services, Economie, Questions hUmaines, Outils innovants et IA) d'EDF R&D, et en collaboration avec des experts académiques, vous explorerez comment les mathématiques du Transport Optimal peuvent corriger les biais de distribution entre une population "pilote" et une population "cible".
L'objectif est de développer une chaîne de traitement algorithmique capable d'estimer l'effet causal d'un tarif "Heures Pleines / Heures Creuses" sur une population cible, en n'ayant observé cet effet que sur une population source biaisée.

1. État de l'art hybride (Mois 1-2)

• Assimilation des concepts clés de l'inférence causale (Cadre Potential Outcomes, ATE/CATE, Transportabilité).
• Montée en compétence sur le Transport Optimal et ses applications récentes en adaptation de domaine.
• Étude de la librairie Python Python Optimal Transport développée par l'équipe de Rémi Flamary.


2. Constitution du "Bac à Sable" de données (Mois 2)
• Prise en main du jeu de données CER Smart Metering Project (Données réelles de consommation irlandaise avec allocation aléatoire de tarifs).
• Création de scénarios de biais : Vous simulerez des situations de "Shift" réalistes.
o Source (Pilote) : Sous-échantillonner les données pour ne garder que certaines catégories (ex: foyers à revenus élevés ou forte consommation).
o Cible (Réel) : Le reste de la population.
• L'objectif est de voir si l'on peut retrouver l'effet réel (connu grâce au caractère aléatoire initial du jeu CER) à partir de la source biaisée.

3. Implémentation et Benchmarking (Mois 3-4-5)
•Mise en oeuvre des méthodes classiques de re-pondération (Inverse Propensity Weighting - IPW).
• Développement d'une méthode innovante basée sur le Transport Optimal pour aligner les distributions source et cible
• Comparaison des performances : La méthode par OT est-elle plus robuste que l'IPW lorsque le biais est fort?
4. Ouverture vers les garanties théoriques (Mois 6)

•Première exploration théorique : Comment quantifier l'incertitude de notre estimation ?

•Introduction aux bornes PAC-Bayésiennes : : peut-on utiliser le coût de transport calculé pour borner l'erreur de de généralisation?

Profil souhaité

Étudiant(e) en M2 Mathématiques Appliquées, Statistiques, Machine Learning ou École d'Ingénieur (X, ENS, ENSAE, Mines, Centrale...).


•Fortes compétences en Python (numpy, pandas, scikit-learn, PyTorch).


•Connaissance ou curiosité pour l'un des domaines suivants : Inférence Causale, Transport Optimal, Théorie de l'apprentissage.


•Goût pour la recherche : Ce stage est conçu comme une pré-thèse. Le candidat idéal souhaite poursuivre en doctorat CIFRE.

Informations Complémentaires


Lieu : EDF Lab Paris-Saclay (Palaiseau) / Télétravail possible à raison de 2 jours

Encadrement :
Laurent BOZZI (Ingénieur-Chercheur Senior), mail : laurent.bozzi@edf.fr
Philippe CHARPENTIER (Ingénieur-Chercheur Expert), mail : philippe.charpentier@edf.fr

Merci d’envoyer un C.V et une lettre de motivation sur ces deux e-mails.


•Indemnité : Selon grille EDF (stage fin d'études).

 

Bibliographie Indicative pour le Stagiaire
1. Flamary, R., et al. (2021). POT: Python Optimal Transport. Journal of Machine Learning Research.
2. Pearl, J., & Bareinboim, E. (2014). External Validity: From Do-Calculus to Transportability Across Populations. Statistical Science.
3. Redko, I., Courty, N., et al. (2019). Optimal Transport for Domain Adaptation.
4. Colnet, B., et al. (2020). Causal inference methods for combining

Ces offres pourraient vous intéresser :