Cet article a été rédigé en collaboration avec les experts de NLP Town, qui nous ont soutenus dans l’élaboration de notre propre outil d’analyse.

Les robots vont-ils conquérir le monde ? Peu probable. Cependant, la NLP (le traitement du langage naturel, plus communément appelé Natural Language Processing) est bien partie pour.

Au cours des dernières années, une technologie qui était encore hésitante a progressé à une vitesse fulgurante, jusqu’à être maintenant intégrée dans plusieurs des services que nous utilisons quotidiennement.

Pour que nous en parlions aujourd’hui, il faut évidemment qu’il y ait un lien avec la participation citoyenne. En facilitant le traitement de texte à grande échelle, la NLP offre un immense potentiel pour les villes et les gouvernements qui veulent utiliser les commentaires des citoyens pour informer la prise de décision. Dans cet article, nous présentons ce qu’est que la NLP, ce qu’elle pourrait signifier pour la participation des citoyens et ce à quoi vous pouvez vous attendre dans les années à venir.

NLP, késako?

Le traitement du langage naturel est une forme d’intelligence artificielle qui permet aux ordinateurs de traiter des données complexes qui n’étaient auparavant compréhensibles que par les humains. La NLP est une branche de l’intelligence artificielle qui se concentre sur le langage naturel, c’est-à-dire le langage écrit et parlé par les humains. Pour faire court, cette technologie analyse, comprend et produit du texte. Voici quelques exemples où la NLP est utilisée aujourd’hui :

  • Les traducteurs de texte tels que Google Translate ou Deepl s’appuient sur l’apprentissage automatique pour mieux comprendre le texte et fournir une traduction pertinente allant au-delà de la simple traduction mot par mot.
  • La classification automatisée est utilisée par la plupart des fournisseurs d’email pour décider quels emails sont envoyés dans votre dossier spam.
  • Les algorithmes de machine-learning (apprentissage automatisé) sont utilisés pour prédire le texte que vous allez taper et pour suggérer des mots dans les textes ou les e-mails.
Le NLP en action : la fonctionnalité Smart Compose de GMail prédit le texte que les utilisateurs s’apprêtent à écrire, facilitant ainsi la rédaction de messages.

Dans le contexte de la prise de décision publique, la NLP s’applique essentiellement à l’analyse de texte. La technologie peut traiter des textes beaucoup plus rapidement que les humains, ce qui signifie qu’elle peut rapidement et facilement extraire des informations significatives de grandes quantités de données. Une ville qui a recueilli des milliers de contributions de citoyens sur une plate-forme de participation est donc ainsi en mesure de regrouper facilement les idées et de voir immédiatement quels sont les thèmes principaux dont les citoyens ont parlé, mais aussi quels sont les principaux arguments utilisés et où se trouvent les idées dans toute la ville.

Mettre en place un processus de NLP

La NLP repose sur un secret bien gardé : la qualité de la technologie et des résultats repose essentiellement sur le raisonnement humain qui la sous-tend. Cela signifie qu’il est essentiel d’apporter le plus grand soin à la mise en place des techniques de traitement du langage naturel. Les descriptions initiales sur lesquelles vous construisez les algorithmes et les bases de données sur lesquelles vous les entraînez auront une influence définitive sur les résultats futurs.

Dans le contexte des plateformes de participation citoyenne, voici deux questions auxquelles il est nécessaire de porter une attention particulière lors de la construction de vos algorithmes :

  • Quel est le contexte ? De quoi parle le texte – s’agit-il d’un livre de recettes ou d’une discussion sur la politique ? S’agit-il d’un long texte formel ou de courts tweets comprenant des abréviations et des émojis ?
  • Quelles sont les informations que vous souhaitez obtenir ? Les objectifs peuvent être multiples : certains algorithmes résument les sujets, d’autres analysent les tendances émotionnelles, d’autres encore identifient les emplacements géographiques mentionnés par les idées….

Une fois choisie la méthodologie qui correspond le mieux à vos besoins, il est encore nécessaire de l’affiner. Les paramètres utilisés dans les algorithmes NLP doivent être adaptés au contexte et au type de language que vous allez utiliser. Selon le contexte, les mots peuvent avoir des significations différentes. Pensez par exemple au mot “noyau”: son sens est complètement différent selon si l’on parle de nourriture ou bien de formation politique. De plus, les utilisateurs peuvent écrire ou parler différemment selon le contexte : un article de journal ne sera pas écrit sur le même ton et n’utilisera pas le même vocabulaire que des tweets.

Une fois que les algorithmes sont construits et qu’ils sont entraînés sur des bases de données fiables, il est nécessaire de comparer les résultats obtenus avec ceux d’une analyse manuelle (et donc presque entièrement exacte). Une fois que les résultats obtenus par les algorithmes ressemblent aux résultats manuels, l’algorithme est prêt à être utilisé. On mesure le taux de resemblances pour évaluer la précision des algorithmes.

La NLP a beau être un outil très puissant, ce n’est évidemment pas une technologie parfaite. Il est impossible de mettre aveuglément en œuvre les résultats qui en ressortent. Une précision de 100% est presque impossible à atteindre, ce qui signifie qu’il existe toujours un risque de faire des erreurs et donc de tirer des conclusions erronées. Par conséquent, le résultat de la technologie NLP devrait idéalement être considéré comme un point de départ, nécessitant une certaine vérification manuelle associée à du bon sens. Si vous intégrez des algorithmes de NLP à une plateforme, il est extrêmement utile de demander des retours à vos utilisateurs afin d’ajuster et affiner les algorithmes.

L’intelligence artificielle dans le contexte de l’engagement citoyen

Le principal défi des projets de participation citoyenne n’est pas de recueillir l’avis des citoyens : c’est de l’analyser. Avec peu de temps et de compétences techniques à leur disposition, les administrations manquent de ressources pour analyser les contributions recueillies ; en conséquence, des informations précieuses se perdent en chemin. En facilitant le traitement des contributions citoyennes et faisant ressortir les idées clefs, la NLP pourrait aider les gouvernements à prendre des décisions mieux informées tout en économisant temps et argent.

Afin d’aider les gouvernements à relever ce défi, nous avons intégré notre propre technologie NLP à la plate-forme CitizenLab, donnant ainsi aux administrations un lieu centralisé pour collecter, modérer et analyser les idées des citoyens. La technologie que nous avons mise en œuvre comporte quatre volets principaux visant à réduire l’effort requis pour le traitement des données.

  • La classification : afin de donner un contexte général au débat, l’administration définit des thèmes à appliquer aux commentaires (mobilité, bien-être, sécurité…). Chaque contribution est ensuite automatiquement classée selon ces thèmes.
  • La similarité : Chaque contribution postée est comparée à toutes les autres contributions existantes. Plus les commentaires ont de mots en commun, plus ils se ressemblent – à condition que le sens de ces mots soit le même. Cela évite les doublons et permet aux administrateurs de regrouper les utilisateurs en fonction de la similitude de leurs commentaires pour découvrir des tendances et des idées intéressantes. Il se peut ainsi que toutes les personnes âgées d’un certain quartier parlent de leur besoin d’infrastructures plus vertes et mieux adaptées, alors que les jeunes citoyens d’un autre quartier expriment un besoin de plus de logements sociaux.
Classification d’idées citoyennes sur la plateforme de Rueil-Malmaison
  • La REN : La reconnaissance des entités nommées est un type de NLP qui relie des mots ou des groupes de mots à une autre entité – dans notre cas, en reconnaissant les lieux mentionnés dans les commentaires et en les localisant sur une carte. La REN permet de transformer un nom de rue ou de ville en coordonnées géographiques mais aussi d’identifier des ” points chauds ” géographiques comme un parc, une église ou un hôpital et d’y ajouter un emplacement.
  • Le Résumé : la NLP est capable de détecter les mots ou phrases clés qui reviennent le plus souvent dans les contributions et de mettre en évidence les idées principales, donnant aux administrateurs une vue d’ensemble des discussions.
Idées localisées sur une carte à Rueil-Malmaison

Nos prochaines étapes

La NLP est un domaine en rapide évolution, qui offre de nombreuses possibilités pour améliorer la participation citoyenne et la prise de décisions.

Dans le contexte de la participation citoyenne, les développements les plus prometteurs sont l’analyse des sentiments, l’analyse des arguments et la typologie. L’analyse des sentiments permet d’analyser rapidement les sentiments dominants dans un corpus de texte – dans un contexte de discussion en ligne, elle permet ainsi de comprendre comment sont perçues certaines propositions et comment les sentiments varient selon les groupes d’utilisateurs. L’analyse des arguments permet d’analyser des discussions; chaque contribution est classifiée comme argument pour, contre ou neutre, et l’algorithme les regroupe en conséquence. Ainsi, dans le cadre d’une discussion sur Twitter qui parlerait d’une nouvelle loi, il serait possible de voir quels sont les principaux arguments pour et contre cette loi, et lesquels dominent le débat. Enfin, une analyse typologique identifie le type de texte qui est présent. S’agit-il d’une suggestion, d’une question, d’une plainte, d’une réponse à un commentaire précédent… Tous ces détails supplémentaires aideront les administrations à mieux percevoir ce que disent les citoyens et à adapter leur réponse en conséquence.

Pour CitizenLab, le prochain pas à franchir est d’élargir la portée de nos technologies NLP actuelles. Aujourd’hui, notre produit se concentre sur l’apport écrit des citoyens. À l’avenir, cette même technologie pourrait s’appliquer à d’autres types de contributions : plans stratégiques des villes, budgets municipaux, discours des décideurs locaux, ordres du jour et décisions des conseils municipaux, articles de presse…. Un citoyen voulant proposer une idée relative aux pistes cyclables sur la plateforme participative de sa commune pourrait également y découvrir ce qui a été dit par les élus à ce sujet, ce qui a été prévu lors de la dernière réunion du conseil municipal et à quoi ressemblent les données actuelles sur le cyclisme.

Enfin, l’un des principaux défis auxquels nous sommes confrontés est le facteur humain derrière la technologie. Les gouvernements sont un secteur où il peut être difficile et lent de mettre en œuvre le changement. Nous savons que la meilleure des plateformes avec les algorithmes les plus puissants n’aura un impact que si elle est véritablement comprise et adoptée par les fonctionnaires. Afin de nous attaquer ce défi, nous avons reçu récemment une subvention de Nesta dans le cadre de son programme d’intelligence collective. Ce programme octroie 20.000£ à des projets de recherche sur l’intelligence collective dans le monde entier. Nous utiliserons les fonds pour étudier comment l’intelligence artificielle est actuellement utilisée dans les gouvernements et comment elle influence la prise de décisions. Si le sujet vous intéresse, nous avons écrit plus longuement sur cette opportunité dans cet article.

Si vous avez des commentaires ou des questions sur notre travail, n’hésitez pas à nous contacter ! Nous sommes toujours à la recherche de suggestions pour améliorer notre produit et nous serions ravis de discuter d’idées ou de nouvelles études de cas.

Pour recevoir régulièrement des informations sur CitizenLab et le secteur civictech, abonnez-vous à notre newsletter.