Le Data Innovation Lab à la R&D d'EDF
LABORATOIRE
Le DIL ou Data Innovation Lab est un dispositif transverse R&D où sont réalisés des travaux en data science en fonction de la maturité des sujets et des besoins métiers (Datathon, Data Shaker, Use cases, Socle) appuyés par de l’expertise R&D (Data Scientists, Data Engineers) et des méthodes de point en Intelligence Artificielle.
Il apporte agilité et souplesse dans les projets et les problématiques traitées : de quelques semaines à 6 mois maximum pour un sujet, piloté d’une façon dynamique (par une approche « Think Big, Start Small & Fail fast »).

Basé sur un modèle collaboratif innovant, le Data Innovation Lab a débuté par une période d’incubation qui a permis de renforcer la méthodologie et les pratiques proposées. Le Lab a travaillé sur des cas d'usage avec les métiers du Groupe. Chaque année, à travers les projets qui y sont associés, le DIL définit de nouveaux sujets et de nouveaux défis. Comme des travaux autour de nouvelles méthodes d’apprentissage (deep learning, reinforcement learning, transfer learning, …) qui sont en plein essor dans l’IA.
Transcription
L'intelligeant artificielle au cœur du Date Innovation Lab !
Consommation énergétique, éthique et souveraineté : comment résoudre les problèmes soulevés par l'IA ? Découvrez dans cette vidéo la présentation du Data Innovation Lab où des datascientists et experts métiers utilisent les technologies d'IA pour résoudre ces problèmes.
(Durée : 2:56)
Votre navigateur ne prend pas en compte le javascript.
Pour vous permettre d'accéder à l'information, nous vous proposons de consulter la vidéo L'intelligeant artificielle au cœur du Date Innovation Lab ! dans un nouvel onglet.
[Dans ce reportage, Didier Roustan, directeur de programme à la R&D d’EDF, présente les travaux menés au Data Innovation Lab sur l’intelligence artificielle. Il revient sur les usages possibles des IA génératives, leurs limites, leur consommation énergétique et les enjeux de souveraineté.]
Didier Roustan : Inutile de rappeler que les progrès en matière d’intelligence artificielle nous bluffant absolument tous les jours. Tous les jours, de nouveaux modèles sont publiés en open source. Notre rôle à la R&D d’EDF, c’est de les tester et de déterminer pour quels cas d’usage ils sont les plus adaptés.
Ici, au Data Innovation Lab, nous réunissons des datascientists et des experts métiers pour tenter de résoudre les problèmes qui peuvent l’être grâce à l’IA.
Big data !
Didier Roustan : À la R&D d’EDF, nous utilisons de nombreuses techniques d’intelligence artificielle. C’est vrai qu’en ce moment, on parle énormément d’IA générative. Leur capacité de générer du texte en langage naturel, des images ou des vidéos est impressionnante. Les directions métier se sont emparées de ces solutions parce qu’elles sont accessibles et faciles à mettre en oeuvre.
Nous qualifions des solutions en open source hébergées sur nos serveurs. Il n’est pas question d’envoyer des documents sensibles à traduire ou à résumer par une solution dont on ne connaît ni la provenance ni sur quel serveur elle fonctionne.
Les IA génératives sont-elles gourmandes en énergie ?
Didier Roustan : Le secteur du numérique devrait observer une très forte croissance dans les années à venir. RTE (Réseau Transport Électrique) prévoit une augmentation de la consommation électrique de ce secteur de 15 térawattheures à moyen terme, l’équivalent de la production de deux tranches nucléaires. Aux États-Unis, on évoque même le chiffre de 200 térawattheures, ce qui est tout à fair considérable.
Pourquoi en arrive-t-on à ces chiffres astronomiques ? La consommation de ChatGPT est évaluée à 500 mégawattheures par jour, soit l’équivalent d’une ville de 40 000 habitants. Et ça n’est rien par rapport à l’énergie qu’il a fallu dépenser à la naissance de ChatGPT pour le nourrir, car ces solutions ont besoin d’un très grand volume de données pour apprendre.
Ces besoins énergétiques, comme les problématiques d’éthique et de souveraineté, nous concernent au premier chef, et nous avons besoin de construire des solutions digitales sobres.
Peut-on faire confiance aux IA génératives ?
Didier Roustan : En fait, on évoque plutôt les hallucinations des IA génératives. Ces petites bêtes ont tendance à inventer des réponses qui n’existent pas. Au-delà de la plaisanterie, se pose la question de l’utilisation des IA génératives, qui exposent des réponses qui semblent crédibles en citant des sources qui n’existent pas.
Une compagnie aérienne canadienne a été condamnée à rembourser un billet à un client, malgré le refus du service client, tout simplement parce que le bot conversationnel avait donné son accord précédemment.
La R&D d’EDF travaille sur des outils et des méthodes qui permettent de contrôler le comportement des IA. En somme, des IA qui contrôlent des IA.
En savoir plus sur edf.fr
Les acteurs du DIL
-
Data Scientists R&D
- Expertise Data Science
- Machine Learning
- Deep Learning
- Data viz…
-
Chercheur « apprenti »
- Bagage mathématiques et/ou statistiques
-
Partenaires (académiques, start-up…)
- Expertise ou moyen spécifique complémentaire de ceux de la R&D
-
Direction Système d’Information
- Accès aux données ou plateformes métiers
-
Pilote métier
- Expression des besoins
- Logique métier
- Business model
Le Data Innovation Lab met à disposition des méthodes, outils et expertises pour les chercheurs qui désirent utiliser la Datascience afin de valoriser l'ensemble des données que produit l'entreprise.