4 enseignements sur l'environnement et des pistes e-commerce

Si je devais retenir 2 choses du livre blanc de DataForGood sur les défis de l’IA, et plus sur le volet « enjeux environnementaux », se serait probablement la consommation énergétique des serveurs et le cycle de vie des équipements. Les stratégies ecommerce afin de répondre à l'injonction contradictoire IA/RSE restent à inventer. Je ne livre ici que des ébauches perfectibles mais qui, je l'espère, susciteront des étincelles !

Je suis tombé sur une ressource géniale en écoutant Lou Welgryn et Théo Alves Da Costa dans le podcast Techologie. Ces 2 personnes sont co-présidents de Data for Good. En 2023, cette association a publié le livre blanc "Les grands défis de l’IA générative".

En tant que chef de projet, une grande partie de mon travail s'apparente au fait d'avoir un rôle de consultant ecommerce. Aujourd'hui, en tant qu'entreprise, vous êtes nombreux à vous questionner sur votre stratégie digitale et/ou numérique, les enjeux de l'intelligence artificielle appliquée au ecommerce et comment conjuguer tout ça dans votre démarche RSE.

IA + eCommerce + RSE = Noeuds au cerveau

Je me lance donc dans un exercice périlleux : une réflexion permettant d'apporter de l'eau à votre moulin ecommerce tout en vous livrant les fabuleux enseignements environnementaux de ce livre blanc (encore merci Data for Good). Let's go guys!

Sommaire

Matérialité du numérique et de l'intelligence artificielle
Impacts directs de l'IA générative
Difficulté pour évaluer les impacts
Pistes de réduction des impacts
Conclusion

Matérialité du numérique et de l'intelligence artificielle

Consommation électrique et cycle de vie des équipements

Les services numériques, y compris l'IA générative, reposent sur des équipements informatiques dont la production et le fonctionnement consomment de l'énergie, entraînant des impacts environnementaux significatifs.

La consommation électrique des serveurs hébergeant ces services, souvent situés dans des data centers à travers le monde, varie en fonction des modes de production de l'électricité, influençant leur intensité carbone.

Par exemple, l'impact environnemental d'un modèle d'IA peut être presque dix fois plus élevé aux États-Unis qu'en France, en raison des différences dans le mix électrique.

En France, chaque kwh d'énergie utilisé pour entrainer une IA revient à émettre 57 gCO2eq.

...aux Etats-Unis 522, en Chine 766. (source Ademe)

Cependant, l'impact environnemental ne se limite pas à la consommation d'énergie. Le cycle de vie des équipements, de l'extraction des matières premières à la fin de vie, joue également un rôle crucial.

La fabrication des serveurs, en particulier des composants tels que les GPU, a une empreinte carbone notable. Les estimations actuelles se concentrent principalement sur les émissions de gaz à effet de serre, mais une évaluation plus complète inclurait la raréfaction des ressources naturelles, la consommation et la pollution de l'eau, la diminution de la biodiversité, et la pollution de l'air.

L’impact environnemental de la fabrication d’un serveur servant à l’entraînement de modèle d’IA se situe autour de 3 700 kg CO2 eq, pour une durée de vie d’environ 6 ans.

Ça fait quoi 3700 kg CO2 eq ? Amusez-vous à comparer sur le site ImpactCO2.

Source : https://impactco2.fr/comparateur?value=3700

Pour comprendre l'impact environnemental de l'IA générative, il est donc crucial de considérer à la fois la consommation électrique, influencée par le mix énergétique des différents pays, et le cycle de vie complet des équipements numériques, qui englobent plusieurs critères environnementaux au-delà des seules émissions de CO2.

Mais, j'y peux quoi avec mon site ecommerce, est-ce vraiment mon métier ?

En tant qu'entreprise, votre site ecommerce doit évoluer dans un environnement de plus en plus complexe où il faut aller vite, être compétitif et se différencier. Vous ne voulez ni rater le train de l'intelligence artificielle ni la correspondance en direction de la RSE. Alors laissez-moi vous donner un conseil de consultant ecommerce...

Vous pourriez par exemple réserver l'intelligence artificielle pour l'opérationnalisation de votre RSE sur votre site ecommerce. Quesaco ? (Précisons avant de poursuivre qu'un acte d'achat, peu importe l'approche, reste polluant.)

Par exemple, vous pourriez proposer à l'étape livraison de votre tunnel de vente un mode de livraison "intelligent" (voir mon article "3 actions pour mon site ecommerce et ma stratégie digitale - RSE") . En tenant compte par exemple de la situation géographique de la personne, des données trafic, de la météo, du type de véhicule, etc., vous pourriez déterminer le mode (retrait, livraison, etc.) et le délai le plus efficace environnementalement parlant.

Lisez notre article "3 actions pour mon site ecommerce et ma stratégie digitale - RSE"

"En tant que dirigeant ou responsable de site ecommerce, vous allez devoir trancher une question : "les approches opérationnelles RSE sur un site ecommerce sont-elles un frein au business ou pas ?"

Lire l'article

Dans le calcul, intégrez le coût environnemental (CO2 dans un premier temps, puis eau, etc.) de vos requêtes d'IA lors de l'utilisation par le client mais aussi lors du développement par votre équipe (et les prestataires tiers cf. le livre blanc).

A la fin vous devez avoir permis d'économiser à vos clients plus de CO2 eq que ce que vous en avez engagé ! Le commerce doit se réinventer sur la base de vos compétences métier avec en ligne de mire votre RSE.

Impacts directs de l'IA générative

Les impacts directs de l’IA générative sont principalement liés à l'extraction des ressources, la fabrication, le transport, et la consommation d’électricité des équipements numériques utilisés. Les phases d’entraînement et d’inférence (utilisation par le public) des modèles d’IA, comme les modèles de langage de type GPT et BLOOM (open-source), consomment une quantité significative d'énergie et de ressources informatiques.

L’entraînement des modèles de langage, tel que GPT-3, nécessite d’énormes ressources en serveurs et en données, conduisant à une consommation élevée d'énergie et à des émissions de CO2. Le nombre de paramètres de ces modèles a considérablement augmenté, ce qui a accentué leur impact environnemental.

GPT-1 utilisait 120 millions de paramètres, GPT-3 175 milliards, GPT-4 en utiliserait 1750 milliards.

Phase d'entrainement (et de développement)

L'impact environnemental de l’entraînement de GPT-3 a été estimé à 552 tonnes de CO2eq et 1287 MWh, en raison de l'utilisation intensive de 10 000 GPUs pendant une période d'environ 15 jours.

En revanche, le modèle BLOOM (entrainé en France), grâce à des serveurs plus efficaces et une électricité à faible intensité carbone, présente un impact carbone 18 fois inférieur (30 tonnes équivalent CO2) et une consommation électrique 3 fois inférieur (433 MWh) à celui de GPT-3.

200 AR Paris/New-York + consommation de 270 ménages français pendant 1 an = 15 jours d'entrainement ChatGPT-3

Cependant, ces estimations restent limitées et sous-estimées, car elles ne tiennent pas compte de nombreux autres facteurs comme la consommation résiduelle (switch, routers, serveur de stockage de données) des data centers (690 MWh soit +60% dans le cas de Bloom) et la fabrication des équipements (50 tonnes CO2 eq soit + 65% dans le cas de Bloom).

La phase de développement de modèle d'IA générative est également à prendre en compte car en réalité il y a un certain nombre de tests, évaluations et corrections qui ont lieu pendant l’entraînement.

Au final, dans le cas Bloom, l'estimation la plus complète arriverait à 123 tonnes CO eq, soit 4 fois plus que la première estimation.

Phase d'inférence (utilisation par le public)

La phase d'inférence, où les modèles sont utilisés par les utilisateurs finaux, consomme également des ressources mais sur une plus longue période.

Par exemple, l'utilisation de ChatGPT avec GPT-3 consommerait environ 25,3 GWh par mois, avec un impact carbone annuel de 122 351 tonnes de CO2eq, bien supérieur à celui de l’entraînement.

L'inférence peut ainsi avoir un impact plus important en raison du grand nombre d'utilisateurs. Les estimations de ces impacts sont cruciales pour comprendre l'empreinte environnementale complète des modèles d’IA générative, même si elles sont souvent difficiles à établir de manière précise.

13 millions d'utilisateurs réalisant 15 requêtes par jour traitées par 3 617 serveurs HGX A100 et un total de 28 936 GPUs

Ça c'était pour ChatGPT-3...

Mais, j'y peux quoi avec mon commerce, mes ventes en ligne, mon rôle dans tout ça ?

Nous voyons donc que la phase d'inférence est bien plus "polluante" que la phase d'entrainement (200 fois plus dans le cas GPT-3 si nous ramenons à l'année). Cela signifie que moins votre "commerce" sollicitera une intelligence artificielle moins il polluera.

Mon regard de consultant ecommerce : qu'on l'aime ou qu'on ne l'aime pas, l'intelligence artificielle s'impose dans nos vies personnelles et professionnelles et dans le ecommerce. Toutefois, adoptez là en connaissance de cause et éduquez-vous.

Aiguisez votre savoir-faire ecommerce en utilisant judicieusement et de manière juste l'IA : son utilisation doit permettre des gains environnementaux et sociétaux (et ce n'est pas gagné si on en croit Cathy O'Neil dans son livre "Algorithmes : la bombe à retardement" ne datant pourtant pas d'hier).

Livre à lire "Algorithmes : la bombe à retardement" de Cathy O'Neil

Ce livre explore la manière dont certains algorithmes de big data sont de plus en plus utilisés de manière à renforcer les inégalités préexistantes. Le livre a été largement commenté et a remporté le prix Euler Book Prize.

Soyons lucide. Nous sommes dans un récit de société où la consommation est le maître mot. Cette consommation ne s'arrêtera pas tant qu'il y aura un brin de ressources. On peut être révolté, acheter d'occasion, manger bio, etc., globalement à l'échelle mondiale nous avons un problème sur lequel vous avez un moyen d'action fort : la sensibilisation au niveau de l'achat.

Par exemple, proposez des projets de compensation (carbone mais pas que, locaux, etc.) dans votre tunnel de commande tout en étant transparent sur les limites de ces dispositifs.

Trouvez une approche disruptive en créant de la valeur sur la vertuosité de vos clients dans leur processus d'achat : gamification sur la longévité, l'entretien, la réparation, la reprise, le don, etc. Proposez-leur des "partenariats" avec des entreprises comme myCO2 pour susciter les prises de conscience.

Vous vous dites que c'est un aveu de faiblesse que de sous-entendre le rôle "pollueur" de vos clients ? Pour certains, ils le savent mais comme vous, n'ont pas les outils et les solutions. Pour les autres, votre démarche RSE vous impose moralement de le faire.

Vous vous dites que c'est un frein au commerce ? Inscrivez vos produits dans la qualité, de ceux qui peuvent durer plusieurs années et être recyclé, être réparé sans imposer un renouvellement. Vos consommateurs ne sont-ils pas prêts à payer plus cher un produit "sérieux", un service sur-mesure ?

Votre intelligence doit vous mettre sur ce chemin.

L'intelligence artificielle peut (mais ne doit pas forcément) vous y aider et ne le fera pas à votre place avec le "tact" éthique et environnemental qu'il nous est impératif d'injecter dans nos activités.

Difficulté pour évaluer les impacts

Évaluer les impacts écologiques de l'IA générative est complexe. La chaîne de valeur de la technologie inclut de nombreux paramètres, comme l'utilisation des serveurs et les effets indirects. Les spécificités de l'IA générative, notamment la taille des modèles et la durée d'entraînement, ajoutent des défis. L'opacité des acteurs et la transparence limitée sur les émissions liées aux GPU rendent difficile une estimation complète des impacts environnementaux.

Manque de transparence des acteurs privés de l'IA

Les acteurs de l'IA manquent souvent de transparence sur les jeux de données mise en place et les méthodes d'entraînement des modèles. Alors que certaines données sont publiées pour la recherche, la plupart des informations restent inaccessibles. Les entreprises privées partagent de moins en moins de détails à mesure que l'IA générative se démocratise. Les fournisseurs de cloud font des efforts pour réduire leur impact, mais l'information reste insuffisante pour une évaluation granulaire.

Des méthodologies incomplètes

Les méthodologies actuelles de mesure des impacts environnementaux se concentrent principalement sur les émissions de carbone, négligeant d'autres critères comme l'extraction des ressources et la consommation d'eau.

Les effets indirects et les rebonds, comme l'augmentation de la consommation due à l'efficacité accrue, sont souvent ignorés. Il est crucial de développer des méthodologies plus complètes pour évaluer et réduire les impacts environnementaux de l'IA générative, en tenant compte de tous les aspects de la chaîne de production et d'utilisation.

Mais, j'y peux quoi (encore) !

Sur cet aspect en tant qu'expert ecommerce, je proposerai de partir du principe que j'ai abordé un peu plus haut : l'utilisation de l'IA doit être compenser par les gains RSE proposés à vos clients (ou même vos salariés, fournisseurs, etc.).

Et comme comparer le coût de l'IA aux gains potentiels ne semble pas être une partie de crapette un soir d'été au camping, si vous voulez vous engager dans la voie de l'IA (en toute connaissance de cause) il faut vous baser sur la littérature scientifique existante et appliquer un "gros" pourcentage d'erreur.

Vous pourriez par exemple vous dire que si vous pensez polluer à hauteur de 1, vous comptez 2, et que si vous pensez faire compenser à hauteur de 2, vous comptez 1.

Par exemple, vous pensez implémenter une fonctionnalité ecommerce de pré-fidélisation par la relance de panier abandonné. Cette fonctionnalité vous permettrait de proposer un produit ayant un meilleur score RSE que ce que votre client a mis dans son panier et ce, en vous basant sur un score de "sensibilité" environnementale de votre client (attention rgpd).

Vous avez établi que cette fonctionnalité coûterait à chaque utilisation (incluant le développement)) environ 3 kg CO2 eq. Vous partez donc sur un coût de 6 kg CO2 eq pour tenter de pallier les manquements des méthodologies de calcul. En parallèle, vous avez établi que si votre client achète le produit avec les services que vous proposez (livraison bas carbone, projet de compensation, etc.), vous lui faites économiser 8 kg CO2 eq par rapport à un achat conventionnel (celui qu'il a abandonné dans son panier). Vous retenez donc un gain de 4 kg CO2 eq.

Votre analyse avant de vous lancer, vous montre donc que vous dépensez 6 pour faire gagner 4. Soit vous abandonnez cette idée de fonctionnalité soit vous faites en sorte de l'équilibrer. Soit vous pensez que pour faire cela vous n'avez pas besoin d'une API d'IA et qu'un bon développeur ayant des compétences solides en algorithmique fera l'affaire !

Attention ! A la table des sujets trendy, l'IA s'invite et remplace souvent des termes jugés "has been" mais toujours d'actualité (transition digitale, algorithme, etc.) !

Pistes de réduction des impacts

La sobriété numérique est la meilleure solution pour réduire l'empreinte environnementale des technologies d'IA. Cela implique une prise de conscience des impacts, suivie d'actions de mitigation par les utilisateurs, entreprises et employés.

Les data scientists, les développeurs, les responsables de projet, etc., doivent convaincre leurs collègues et hiérarchie de l'importance des enjeux climatiques, puis intégrer des mesures techniques pour minimiser ces impacts.

La sobriété passe par l'utilisation de l'open-source, la transparence sur les impacts environnementaux et une sélection stricte des clients. Pour les utilisateurs finaux, limiter l'usage des technologies et être conscient de leurs impacts est crucial, car la technologie la plus sobre est celle que l'on ne crée pas.

Utilisation

Durant la phase d'utilisation des modèles, les principes de réduction de l'impact environnemental et des coûts sont primordiaux. L'infrastructure doit être optimisée en fonction de la proximité des utilisateurs et du mix énergétique des data centers, avec la France comme un choix optimal en Europe en raison de son faible taux de carbone.

Pour les traitements par lots, il est possible de choisir le data center et le moment de l'exécution pour optimiser la consommation énergétique. Toutefois, une généralisation non contrôlée de ces pratiques pourrait augmenter la demande et l'impact environnemental global. Une coopération stratégique globale entre tous les acteurs est donc nécessaire pour optimiser ces usages.

Rôle de la direction des entreprises

L'IA générative offre de nombreuses opportunités économiques, mais son adoption par les entreprises reste freinée par des préoccupations sur le fonctionnement, la protection des données et les performances économiques.

Les entreprises, sensibilisées aux enjeux énergétiques, doivent intégrer la sobriété numérique dans leur stratégie RSE, soutenue par les dirigeants. Ces derniers doivent être formés pour comprendre l'impact environnemental des technologies et prendre des décisions éclairées.

Un exemple de cette approche est le "label dirigeant numérique" de la SNCF, qui vise à sensibiliser les dirigeants aux enjeux technologiques et environnementaux. La sobriété numérique ne signifie pas renoncer à l'IA, mais l'utiliser de manière responsable et réfléchie.

Liste de recommandations non exhaustive

En tant que développeurs, responsable de projet, décideur ou entrepreneur, vous pourriez appliquer les recommandations suivantes :

Questionner l’utilité du projet	Estimer les impacts du projet
Évaluer la finalité d’un projet	Limiter les usages aux finalités souhaitées
Optimiser l’infrastructure en ayant recours à des solutions fonctionnant et/ou hébergées sur des data centers français	Prendre en compte le critère environnemental dans l’encadrement des IA génératifs
Limiter la démultiplication des services qui augementent l’impact environnemental	Rendre transparent l’usage des modèles à des fins publicitaires / politiques, notamment contre le greenwashing
Recourir à des APIs comme CO2.js, EcoIndex ou Grid Intensity CLI pour améliorer l’impact environnemental des développements	Privilégier les calculs lourds qu’aux cas d’usages critiques, et préférer l’utilisation de résultats déjà calculés pour les usages moins importants
Recourir à du caching de résultats déjà calculés pour servir des demandes équivalentes	Veiller des plateformes comme https://huggingface.co/ pour disposer d’outils open-source pour l’analyse des biais par exemple ou pour faire des tests moins gourmand/polluant (https://huggingface.co/zero-gpu-explorers)

Conclusion

L'approche de cet article vous plaît ? Restez informé.

Nous transmettons notre expérience en agence web sous le prisme de la transversalité afin que vous puissiez en tirer des bénéfices concrets pour votre entreprise. Ne ratez rien en lisant nos articles !

Je reste en contact !

Sources

https://issuu.com/dataforgood/docs/dataforgood_livreblanc_iagenerative_v1.0?fr=sZGE0MjYyNjE5MTU :

https://issuu.com/dataforgood/docs/dataforgood_livreblanc_iagenerative_v1.0?fr=sZGE0MjYyNjE5MTU

https://www.luigisbox.fr/blog/ia-ecommerce/ :

https://www.luigisbox.fr/blog/ia-ecommerce/

Techologie - #83 Bombes carbones et usages de la data et de l'IA avec Lou Welgryn et Théo Alves Da Costa (google.com) :

Techologie - #83 Bombes carbones et usages de la data et de l'IA avec Lou Welgryn et Théo Alves Da Costa (google.com)

https://dataforgood.fr/iagenerative/ :

https://dataforgood.fr/iagenerative/

https://www.experts-et-decideurs.fr/vie-entreprise/gestion-entreprise/compensation-carbone-principes-et-limites/ :

https://www.experts-et-decideurs.fr/vie-entreprise/gestion-entreprise/compensation-carbone-principes-et-limites/

https://huggingface.co/ :

https://huggingface.co/

https://developers.thegreenwebfoundation.org/ :

https://developers.thegreenwebfoundation.org/

https://github.com/cnumr/ecoindex_api :

https://github.com/cnumr/ecoindex_api

Frédéric Blancheton

Chef de projet digital chez Appy, agence web à Toulouse. 10 ans en tant qu'intégrateur, chef de projet puis directeur technique. Passionné par l'environnement.

IA et numérique responsable : 4 enseignements sur l'environnement et des pistes e-commerce