CATCH

Ce projet vise à utiliser les méthodes de l'intelligence artificielle, pour exploiter automatiquement les témoignages, exprimés sur les réseaux sociaux, suite à un accident industriel et à ses conséquences sur le plan environnemental et sanitaire.

Contexte et objectifs

Le projet CATCH, pour « Compréhension Automatique de Témoignages de Capteurs Humains », a été construit suite à l’incendie de Lubrizol et de NL Logistique. Suite à cet évènement, de nombreux habitants de Rouen et ses environs ont été victimes de désagréments, tels que des odeurs très fortes ou des symptômes de santé pouvant laisser suspecter des effets nocifs.

L’objectif du projet CATCH est de suivre la réaction des normands face à un problème de qualité de l'air, en analysant les messages écrits sur les réseaux sociaux par des internautes. Son but est de caractériser et, si possible, de prévoir les types de ressentis humains. Pour cela, le projet CATCH utilise les principes de calcul de l’intelligence artificielle (IA) pour exploiter et analyser des témoignages citoyens dans le cadre d’une catastrophe ou d’une situation de crise.

Description du projet

Le projet CATCH utilise les sciences des données et l’IA, en l’occurrence ici des réseaux sociaux, pour prendre en compte et exploiter automatiquement la multitude de témoignages humains relatifs à un accident industriel et à ses conséquences sur le plan environnemental et sanitaire. Ces témoignages permettront de restituer sous forme graphique et/ou cartographique les signalements géolocalisés, notamment odorants.

Par ailleurs, la multitude de témoignages citoyens permet de rendre compte de la situation perçue et réelle et de suivre la propagation et l’évolution des phénomènes dans le temps. Ces messages permettent aussi de détecter la présence (ou l'absence) d’une ou de plusieurs émotions pré-identifiées (surprise, peur, colère, tristesse, dégoût...).

Le but est de mesurer l’impact des évènements sur le côté psychologique de la population, écouter pour mieux informer en adaptant la communication en fonction du contexte et ainsi améliorer la communication entre les pouvoirs publics et la population normande.

Durée

Ce projet a démarré le 1er septembre 2021 pour une durée initiale de 24 mois. Il s'est achevé en 2024.

Livrables attendus

Des lots de données collectées (signalements et tweets bruts)
Une convention d'annotation
Un corpus de tweets annotés
Des modèles d'analyse de signalements olfactifs
Un prototype de démonstration

Résultats

Malik, Usman & Bernard, Simon & Pauchet, Alexandre & Chatelain, Clement & Picot-Clemente, Romain & Cortinovis, Jérôme. (2024). Pseudo-Labeling With Large Language Models for Multi-Label Emotion Classification of French Tweets. IEEE Access. PP. 1-1. 10.1109/ACCESS.2024.3354705. https://www.researchgate.net/publication/377421253_Pseudo-labeling_with_Large_Language_Models_for_Multi-label_Emotion_Classification_of_French_Tweets