Aller au contenu principal
Accueil
MDesigner.org

Navigation principale

  • Accueil
  • Formations
    • Communication et Marketing
    • Intelligence Artificielle et Technologies
    • Relations Internationales et Interculturalités
  • Recherche
    • Narration et Discours
    • Pédagogie et Théâtre
    • Créativité Computationnelle
  • Évènements
    • Calendrier ÆØΞΣ
    • Sessions ÆØΞΣ

Fil d'Ariane

  1. Accueil

La compréhension computationnelle des récits : Une synthèse des travaux de recherche

La compréhension computationnelle des récits : Une synthèse des travaux de recherche

Le storytelling et la transmission des récits sociétaux permettent aux êtres humains de communiquer, de se connecter et de se comprendre mutuellement, ainsi que le monde qui les entoure. Les narratifs peuvent être définis comme des comptes-rendus oraux, visuels ou écrits d'événements et d'acteurs interconnectés, évoluant généralement selon une certaine notion de temps.

Aujourd’hui, l’information est principalement véhiculée via des canaux de communication en ligne, tels que les réseaux sociaux et les blogs. Par conséquent, la manière même de transmettre un récit est passée de structures autonomes (comme les livres) à des structures plus fragmentées, comme les plateformes sociales, où les événements d’une histoire se construisent à travers de multiples sources en ligne.

Les conversations en ligne omniprésentes peuvent donner naissance à des narratifs sophistiqués, capables d’influencer l’interprétation collective des sentiments culturels, des attitudes, des valeurs, ainsi que des événements et faits géopolitiques. Ainsi, les récits sont désormais utilisés comme outils stratégiques pour façonner l’opinion publique, promouvoir des idéologies ou diffuser de la propagande, ce qui en fait des objets d’étude cruciaux pour identifier des thèmes, intentions et objectifs au sein de différentes communautés (y compris adverses).

Cependant, détecter et analyser des narratifs fragmentés, extraire leurs composantes thématiques et temporelles, ou repérer des techniques de cadrage rhétorique reste un défi sans automatisation à grande échelle. Ce problème peut être abordé grâce aux technologies de compréhension du langage naturel (NLU).

L’objectif de cet article est de documenter et discuter des méthodes permettant de construire, extraire et détecter efficacement des narratifs en ligne évolutifs. Sa contribution novatrice réside dans la compilation formelle et l’analyse approfondie de ces technologies, ainsi que dans une discussion détaillée sur les défis de recherche ouverts, concernant :

  • La définition des narratifs en ligne,

  • Leur identification,

  • Leur construction,

  • Leur génération,

  • Leur représentation.

À notre connaissance, il n’existe actuellement aucune documentation formelle organisant et explorant de manière approfondie les domaines de recherche sur la compréhension des narratifs et leurs enjeux.

L’existence des narratifs (des récits d'événements interconnectés formant une histoire) et l’art de raconter des histoires ont été des éléments essentiels dans la création d’expériences humaines universelles à travers trois périodes distinctes de communication dans l’histoire, en plus des récits antérieurs à l’écriture. Les narratifs ont façonné la manière dont les humains ont :

  • Créé des langues pour communiquer et se connecter (ère de la tradition orale),

  • Enregistré et interprété leur environnement (ère de l’alphabétisation),

  • Diffusé l’information à grande échelle via les médias électroniques (ère de l’information).

Les médias électroniques ont révolutionné les méthodes permettant aux utilisateurs de construire des communautés en ligne et de partager massivement des informations.

L’explosion des données narratives en ligne

Aujourd’hui, le web regorge de données (images, vidéos, textes non structurés), permettant une diffusion massive de narratifs via divers canaux de communication]. Cette abondance de données et l’analyse des narratifs en ligne peuvent servir à :

  • Garantir des environnements en ligne sûrs pour partager des informations fiables,

  • Fournir des renseignements critiques aux agences de défense géopolitique.

Cependant, une grande partie des narratifs partagés en ligne ont des intentions malveillantes, souvent liées à des campagnes de propagande. Les médias numériques et les méthodes informatiques avancées accélèrent la diffusion d’informations biaisées, trompeuses ou fausses. Ces campagnes visent à :

  • Cibler des audiences larges,

  • Stimuler l’engagement (réactions, partages),

  • Influencer l’opinion publique.

Les médias d’information peuvent amplifier ces messages en relayant sans discernement des contenus malveillants [5]. Face à ces enjeux, l’identification des narratifs existants et évolutifs devient un problème de recherche crucial.

Méthodes computationnelles pour l’analyse des narratifs

Nous nous intéressons aux méthodes automatisées capables de :

  1. Collecter et enchaîner des informations clés pour construire des narratifs évolutifs,

  2. Détecter et extraire des narratifs existants.

Les progrès en Compréhension du Langage Naturel (NLU) permettent aux systèmes informatiques de mieux saisir les expériences humaines, comme les narratifs partagés. Ces technologies alimentent des systèmes intégrés capables de :

  • Comprendre,

  • Extraire,

  • Générer des structures narratives, qu’elles soient autonomes (livres, films) ou fragmentées (posts sur les réseaux sociaux, blogs, articles).

Défis des narratifs fragmentés

Si les narratifs autonomes (complets en eux-mêmes) restent populaires, les utilisateurs se tournent davantage vers des sources comme Twitter et Reddit pour s’informer sur l’actualité. Les narratifs fragmentés émergent naturellement de ces flux d’information, où les événements sont rapportés par des millions d’utilisateurs [19], [108], [149].

Cependant, la reconstruction chronologique de ces narratifs est complexe en raison :

  • De la disparité des sources,

  • Des thèmes évolutifs,

  • Des lacunes dans les chaînes d’événements.

Exemple : La prise d’otages dans une synagogue au Texas (janvier 2022) a été rapportée via de multiples sources en ligne, nécessitant une extraction et un ordonnancement chronologique pour former un récit cohérent (Figure 1).

Méthodes de recherche et construction narrative

Les étapes clés incluent :

  1. Acquisition des données : Extraction d’événements pertinents (via modélisation dynamique de sujets, résumés d’articles, filtrage d’information).

  2. Construction narrative : Ordonnancement des événements (détection de relations causales, analyse des transitions temporelles).

Contrairement au journalisme automatisé (génération de contenus originaux par IA), la construction narrative ne crée pas de nouveaux contenus, mais organise des informations existantes pour former des séquences logiques, améliorant ainsi les moteurs de recherche traditionnels.

Contributions de cet article

  1. Définition des composants structurels des narratifs (entités, relations sémantiques, intrigues).

  2. Organisation des méthodes existantes en NLU et RI (Recherche d’Information) en une hiérarchie claire.

  3. Analyse des projets clés dans :

    • L’extraction et la génération de narratifs,

    • L’évolution des récits,

    • Les outils d’évaluation.

  4. Identification des défis ouverts et des tendances futures.

Questions de recherche (RQ)

  • RQ1 : Comment différencier les narratifs en ligne des narratifs traditionnels ?

  • RQ2 : Quels sont les composants principaux d’un narratif ?

  • RQ3 : Quelles méthodes computationnelles peuvent représenter et valider des structures narratives ?

Structure du document

  • Section II : Questions de recherche et méthodologie.

  • Section III : Typologie et composants des narratifs.

  • Section IV : Méthodes computationnelles et défis.

  • Section V : Perspectives futures.

I. Motivations des domaines de recherche et méthodes de compilation de l’étude

Compte tenu du rôle central des narratifs dans les interactions humaines et l’assimilation d’informations, nous avons cherché à comprendre :

  • Comment les narratifs se développent en ligne,

  • Comment les systèmes computationnels peuvent traiter et comprendre ces récits évolutifs.

L’essor des technologies numériques a multiplié les canaux de diffusion de l’information, offrant à la fois :

  • Des opportunités d’observer les interactions humaines à grande échelle,

  • Des défis pour extraire des insights pertinents de cette masse de données.

Cela motive notre exploration de méthodes automatisées pour :

  • Détecter,

  • Construire,

  • Générer des narratifs.

A. Objectifs de recherche

Nos questions de recherche (RQ1, RQ2, RQ3) guident cette étude.

  1. Documenter les types de narratifs :

    • Distinguer les narratifs traditionnels (autonomes, comme les livres) des fragmentés (médias sociaux, blogs).

    • Identifier leurs composants universels pour faciliter leur analyse computationnelle.

  2. Explorer les méthodes de NLU (Compréhension du Langage Naturel) :

    • Différencier automatiquement les types de narratifs,

    • Extraire leurs composants (entités, relations sémantiques, intrigues),

    • Reconstruire des chronologies à partir de sources fragmentées.

  3. Étudier la génération de narratifs :

    • Analyser comment l’ordonnancement des mots influence l’interprétation des récits,

    • Détecter des stratégies rhétoriques (cadrage, biais).

  4. Créer une base de connaissances commune :

    • Recenser les ontologies, modèles de données, et benchmarks existants,

    • Favoriser la recherche collaborative.

B. Méthodologie de l’étude bibliographique

Aucune ressource ne compile actuellement les travaux sur l’analyse des narratifs. Pour garantir l’exhaustivité de notre étude, nous avons :

  1. Identifié des ateliers et revues spécialisés,

  2. Sélectionné les thèmes récurrents (p. ex. "extraction narrative", "évolution des intrigues"),

  3. Hiérarchisé les domaines de recherche (Figure 2),

  4. Choisi les articles clés selon :

    • Leur caractère novateur,

    • Leur nombre de citations,

    • Leur reproductibilité.

L’objectif est d’offrir une référence structurée pour guider les futures recherches.

III. Définition des structures narratives

A. Types de narratifs

Pour répondre à RQ1, nous distinguons :

  1. Narratifs littéraires :

    • Romans, livres (texte ou illustrations),

    • Visuels : films, bandes dessinées.

  2. Narratifs écrits fragmentés :

    • Articles de presse, posts réseaux sociaux,

    • Dynamiques : leurs événements évoluent via des sources multiples.

  3. Narratifs à visée idéologique :

    • Outils de propagande ou influence sociale,

    • Domaines spécifiques : finance, santé, jeux vidéo.

Défi majeur :

  • Identifier des thèmes et segments temporels cohérents malgré la fragmentation,

  • Combler les lacunes dans les chaînes d’événements.

B. Composants d’un narratif

Pour RQ2, nous identifions trois éléments universels :

  1. Entités :

    • Objets concrets (personnes, lieux, dates),

    • Reconnaissance automatisée (NER) :

      • Modèles statistiques ou grammaticaux,

      • Limite : peu adaptables aux domaines spécifiques.

  2. Relations sémantiques :

    • Liens entre entités (ex. "Washington est la capitale des États-Unis"),

    • Extraction automatisée,

    • Ontologies pour modéliser des relations complexes.

  3. Intrigues :

    • Séquences d’événements connectés sémantiquement,

    • 5 éléments clés (Table 2) :

      1. Exposition (contexte),

      2. Élément déclencheur,

      3. Développement,

      4. Point culminant,

      5. Résolution.

Perspectives

Les sections suivantes détaillent :

  • Les méthodes computationnelles (Section IV),

  • Les défis ouverts (Section V).

Contribution clé :

"Une cartographie inédite des technologies et enjeux dans l’analyse des narratifs."

Computational narrative construction and understanding

IV. Domaines de recherche

Cette section répond à RQ3 en présentant une synthèse des méthodes computationnelles pour la compréhension des narratifs. Les axes de recherche couverts sont illustrés dans la Figure 2, et les défis ouverts sont résumés dans le Tableau 3.

A. Extraction de narratifs

L'extraction de narratifs (autonomes ou fragmentés) se divise en trois sous-domaines :

  1. Détection d'événements :

    • Les événements sont des entités clés qui structurent les intrigues (voir Section III-B).

    • Méthodes :

      • Parsers sémantiques (ex. FrameNet, ACE) pour catégoriser les événements.

      • Approches par deep learning ou modèles hiérarchiques.

    • Défi : Adapter les modèles à des domaines spécifiques (ex. voyages, santé).

  2. Représentation des narratifs :

    • Visualisation via arbres thématiques ou schémas fonctionnels (ex. conversations Reddit).

    • Modélisation des réseaux d'acteurs pour analyser les relations entre personnages.

  3. Détection de sentiments et opinions :

    • Crucial pour identifier les biais ou campagnes d'influence.

B. Évolution des récits

L'analyse temporelle des narratifs fragmentés inclut :

  1. Détection de transitions :

    • Identification des changements thématiques (ex. via LDA).

    • Exemple : Suivi des récits migratoires en Europe.

  2. Relations causales :

    • Reconstruction de chaînes d'événements (ex. prédiction de segments manquants).

    • Bases de données : ROCStories et NewsWire pour l'entraînement des modèles.

  3. Génération de timelines :

    • Outils comme [115] ou [98] pour résumer l'évolution d'un récit sur les réseaux sociaux.

C. Génération de narratifs

Trois approches principales :

  1. Méthodes structurelles :

    • Génération hiérarchique à partir de prémisses [36] ou séquences d'événements [96].

  2. Modèles linguistiques (LLMs) :

    • GPT-2/GPT-3 pour produire du texte fluide, mais avec des risques de incohérences logiques.

    • Améliorations via grounding de bon sens ou cadres prédictifs (VerbNet).

  3. Évaluation des biais :

    • Détection de stéréotypes (genre, religion) et détoxification des sorties.

D. Évaluation des narratifs

  1. Benchmarks existants :

    • Story Cloze : Prédiction de fins plausibles pour des récits.

    • Narrative Cloze : Complétion d'événements manquants.

  2. Détection des biais :

    • Mesures via similarité cosinus ou analyse de sentiments.

    • Enjeu : Limiter les chambres d'écho dans les récits générés.

  3. Vérification des faits :

    • Outils comme ClaimBuster ou Hoaxy pour contrer la désinformation.

E. Ressources ouvertes

  • Jeux de données : ACE, FrameNet, ROCStories.

  • Ontologies pour modéliser les relations sémantiques [49].

  • Outils : Plateformes de timelining, modèles GPT-3.

Contribution clé :

"Un cadre unifié pour l'extraction, la génération et l'évaluation des narratifs, mettant en lumière les défis éthiques et techniques."

Perspectives :

  • Améliorer la cohérence logique des LLMs.

  • Développer des benchmarks multilingues.

  • Intégrer l'analyse multimodale (texte + visuels).

E. Ressources ouvertes

Il existe plusieurs outils, ontologies et jeux de données pour étendre, évaluer et entraîner des systèmes de compréhension des narratifs.

1. Outils logiciels

  • Brat2Viz : Extension de l'outil d'annotation BRAT pour visualiser les composants narratifs (acteurs, événements, temps) et leurs relations sémantiques.

  • Représentations hiérarchiques : Visualisation de données complexes (articles, budgets, statistiques).

2. Modèles de données et ontologies

  • Modèles hiérarchiques : Organisation chronologique d'entités et d'événements pour des narratifs littéraires.

  • Ontologies événementielles :

    • CEO : Pour les chaînes d'événements dans les dépêches.

    • LODE, SEM, REO, CEVO : Autres ontologies spécialisées.

  • Adaptation aux domaines : Création de sous-classes d'événements pour l'analyse en temps réel.

3. Jeux de données

  • ACE [31] : Référence pour la détection d'événements.

  • StoryDB [144] : Corpus multilingue de 21 000 histoires (42 langues).

  • LiSCU [12] : Résumés littéraires avec descriptions de personnages.

  • VIST [59] : Dataset visuel pour la narration séquentielle.

V. Développements futurs

A. Extraction de narratifs

  • Défi principal : Généraliser les méthodes à divers domaines (ex. romans vs actualités).

  • Piste : Utiliser des schémas narratifs universels (ex. éléments d'intrigue, Table 2) pour l'apprentissage transdomaine.

B. Évolution des récits

  • Intégrer des facteurs sociaux (tendances en ligne, biais utilisateurs) dans l'ordonnancement des événements.

C. Génération de narratifs

  • Améliorer la cohérence logique via :

    • Modèles linguistiques fondés sur des connaissances.

    • Méthodes de grounding sémantique.

D. Évaluation

  • Créer des benchmarks communs pour mesurer :

    • La précision,

    • La fluidité,

    • L'absence de biais.

E. Ressources ouvertes

  • Développer des outils de visualisation pour aider les analystes humains.

  • Priorité : Des représentations généralisables des structures narratives.

VI. Conclusion

Cette étude propose :

  1. Une synthèse inédite des méthodes de compréhension des narratifs.

  2. Une taxonomie des défis (construction, génération, évaluation).

  3. Des perspectives pour la recherche future (Tableau 3).

Objectif : Servir de référence pour la communauté, en identifiant les axes d'innovation prioritaires.

Liens sources
P. Ranade, S. Dey, A. Joshi and T. Finin, "Computational Understanding of Narra…

Recherche

  • Créativité Computationnelle
Vocabulaire
  • "Storytelling" → Conservé en anglais (usage courant en français) ou traduit par "art de raconter des histoires" selon le contexte.
  • "Narratives" → "Récits" / "Narratifs" (le terme anglais est souvent utilisé en sciences sociales).
  • "Framing tactics" → "Stratégies de cadrage" (théorie de la communication).
  • "Natural Language Understanding (NLU)" → "Compréhension du langage naturel".

Voyage vers les Sociétés de la Connaissance

COMMUNICATION ET MARKETING
communication, design, science des données, dialogue, éducation, cinéma, journalisme, marketing, médias, médias sociaux, narration, actualités, production, radio, social, web, art, jeux, gestion, sport, cinéma


INTELLIGENCE ARTIFICIELLE ET TECHNOLOGIES
IA, connaissance, informatique, innovation, logiciels, mathématiques, recherche, astronomie, botanique, finance, industrie, apprentissage en ligne, psychologie


RELATIONS INTERNATIONALES ET INTERCULTURALITÉ
anthropologie, culture, diplomatie, droit, économie, géographie, histoire, langues, littérature, livres, musée, musique, philosophie, politique, religion, sexualité, tourisme