Comment créer un ChatGPT privé à l'aide d'une technologie open source ? Téléchargez notre livre blanc gratuit.

Ademe : comment utiliser le NLP pour clarifier des termes, des expressions et des concepts

Ademe : comment utiliser le NLP pour clarifier des termes, des expressions et des concepts

220 000

articles analysés

50,000

tweets analysés

8 semaines

d'implémentation

50

sujets identifiés

Construisez votre projet avec nous

Qui est l'ADEME ?

L'Ademe participe à la mise en œuvre des politiques publiques dans les domaines de l'environnement, de l'énergie et du développement durable. Pour leur permettre de progresser dans leur démarche environnementale, l'agence apporte expertise et conseil aux entreprises, aux collectivités locales, aux pouvoirs publics et au grand public.

Analyses linguistiques et statistiques pour mieux communiquer sur l'économie circulaire

La multiplicité des sujets que recouvre l'économie circulaire rend la communication difficile, même pour l'un de ses principaux défenseurs : L'ADEME. Pour soutenir la mission de l'ADEME, Lettria a mis à disposition son expertise linguistique et son savoir-faire en NLP pour mesurer la compréhension des enjeux de l'économie circulaire par les citoyens.

Quelques mots sur l'ADEME

L'Agence pour la transition énergétique (anciennement Agence de l'environnement et de la maîtrise de l'énergie ou ADEME) participe à la mise en œuvre des politiques publiques dans les domaines de l'environnement, de l'énergie et du développement durable. Afin de leur permettre de progresser dans leur démarche environnementale, l'agence apporte aux entreprises, aux collectivités locales, aux pouvoirs publics et au grand public expertise et conseil. Elle participe également au financement de projets, de la recherche à la réalisation, dans les domaines suivants : gestion des déchets, préservation des sols, efficacité énergétique et énergies renouvelables, qualité de l'air et lutte contre le bruit.L'ADEME est un établissement public placé sous la tutelle du ministère de l'Écologie, du Développement durable et de l'Énergie et du ministère de l'Enseignement supérieur et de la Recherche.

Où et comment mesurer la connaissance de l'économie circulaire chez les citoyens ?

En tant qu'acteur clé de l'économie circulaire, l'ADEME dispose d'un pouvoir d'influence certain sur l'économie circulaire auprès des multiples parties prenantes impliquées, dont le grand public. Afin de s'assurer de la bonne compréhension des messages qu'elle diffuse, l'agence a souhaité améliorer la clarté des termes, expressions et concepts liés à l'économie circulaire. La mission a nécessité de passer par trois étapes :

  • Évaluer les raisons pour lesquelles certains termes, expressions et concepts peuvent être source de confusion et/ou d'incompréhension pour les cibles des actions de communication de l'ADEME.
  • Explorer les alternatives possibles en s'inspirant des termes, expressions et concepts utilisés à l'étranger, en réfléchissant avec les citoyens, en sollicitant les entreprises et les associations dans une réflexion commune.
  • Recommander les évolutions sémantiques à mener pour améliorer la bonne perception des messages, à travers un nouveau lexique permettant la bonne adhésion du public cible aux actions et aux objectifs affichés par l'ADEME.

Collecte et analyse d'un corpus de textes pour mesurer la compréhension des enjeux

Grâce à une technologie de collecte de données ouverte, nos équipes ont pu mener leurs recherches sur un corpus de textes varié composé de presse spécialisée, d'articles généraux et de réseaux sociaux. Une fois les données collectées auprès de différentes sources sur plusieurs années, nous avons mis en place un traitement lourd des données avant de procéder à une analyse sémantique approfondie. Ce travail visait ainsi à mettre en évidence les mots / expressions liés à l'économie circulaire pour lesquels un travail de clarification était nécessaire.

Les sciences du langage et la linguistique au service de l'analyse sémantique

L'objectif du projet était de mesurer le degré de complexité de 58 termes utilisés afin non seulement d'évaluer leur caractère terminologique mais aussi de faciliter une meilleure compréhension de leurs usages.Après concertation avec l'équipe du projet, nous avons commencé par créer un corpus de textes sur lequel nous avons mené notre recherche. Parmi les sources concernées par l'étude, nous avons veillé à sélectionner des médias spécialisés et grand public (Journal de l'Environnement, 20 Minutes) ainsi que des réseaux sociaux (Twitter) et des bases de données documentaires (Wikipédia).Plus de 300 000 articles ont ensuite été analysés par machine, comprenant plus de 36 millions de mots.

Différentes étapes ont ensuite été franchies pour étudier ces corpus:

  • Afin d'appliquer certaines méthodes de traitement du langage naturel (NLP) et d'en faciliter l'exploitation, notamment l'étude de l'occurrence des lemmes (forme canonique d'un mot), nous avons d'abord nettoyé le texte brut. Le résultat final est un texte peu lisible par un lecteur humain, mais qui rend le traitement beaucoup plus efficace pour les modèles de langage.
  • Les occurrences des mots-clés au sein des corpus pour mesurer leur adoption par la population.
  • Le word vectoring et l'analyse de similarité pour mettre en évidence les synonymes de chaque mot-clé afin de déterminer si le contexte d'utilisation est bien celui de l'économie circulaire. Typiquement dans certaines sources, le mot " sobriété " (listé parmi les termes à étudier) n'était généralement pas lié au thème de l'économie circulaire et nécessite donc une vigilance dans l'observation de son occurrence.
  • L'étude contextuelle pour expliquer les différents usages des mots-clés (la distance sémantique d'un corpus à l'autre, mais aussi à l'intérieur d'un même corpus et entre un et plusieurs mots-clés), à compléter par une analyse de la distance contextuelle des mots-clés et de leur variabilité sémantique.
  • Lettria a ensuite complété ces analyses par une étude similaire sur le réseau social Twitter (word count, sentimental analysis, etc.) afin d'avoir une vision plus approfondie de l'adoption des termes de l'économie circulaire par le grand public au fil des années.

Cette série d'analyses nous a permis de donner un score d'adoption pour chacun des mots clés de la liste et de fournir ainsi une métrique de compréhension pour prioriser les mots à étudier. Plus le score était faible, plus il était important de clarifier la définition de ces termes et/ou d'utiliser des mots différents pour mieux signifier les enjeux clés associés et ainsi mieux communiquer sur le sujet de l'économie circulaire auprès du grand public.

Les prochaines étapes de notre collaboration

Après cette première phase d'analyse réalisée par Lettria, l'ADEME a pu orienter ses travaux vers une comparaison internationale des bonnes pratiques et une enquête de terrain auprès des citoyens, avant de formaliser un lexique de l'ensemble des nouveaux termes recommandés et de les intégrer dans sa stratégie de communication.

Callout

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique. Duis cursus, mi quis viverra ornare, eros dolor interdum nulla, ut commodo diam libero vitae erat. Aenean faucibus nibh et justo cursus id rutrum lorem imperdiet. Nunc ut sem vitae risus tristique posuere.

This is some text inside of a div block.
This is some text inside of a div block.
This is some text inside of a div block.
This is some text inside of a div block.

What are the key results?

What are the next steps?

Créez votre pipeline NLP gratuitement
Commencez ->