AFP Medialab partenaire du projet ASRAEL
La société de l’information et de la communication génère des volumes considérables de contenus non structurés (textes, images, vidéos). En dépit de récentes évolutions et du développement de portails de données ouvertes (open data) ou de ressources comme DBPedia, qui ont facilité l’accès à l’information stockée dans des bases de données, l’essentiel de la connaissance est toujours produit sous forme de données textuelles brutes.
Parmi les informations, celles qui concernent les événements* présentent un grand intérêt, en particulier dans le contexte de l’émergence du journalisme de données. Cependant, le journalisme de données a jusqu’à présent été alimenté par les données publiques disponibles – statistiques notamment – mais a, paradoxalement, assez peu fait usage du matériel proprement journalistique que sont les événements.
Le projet ASRAEL (Acquisition de Schémas pour la Reconnaissance et l'Annotation d'Événements Liés, ANR-15-CE23-0024) a pour objectif de combler ce vide. Il rassemble le Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur (LIMSICNRS), le laboratoire Vision et Ingénierie des Contenus du CEA LIST (recherche sur l'analyse et l'interprétation de données multimédia et multilingues), le Medialab de l’Agence France-Presse (unité de R&D) et l’Institut EURECOM (école d’ingénieurs dans le domaine des Technologies de l'information de la communication et centre de recherche en Systèmes de communications).
Financé par l'Agence Nationale de la Recherche (ANR), ce projet s’inscrit dans le cadre scientifique général de l’extraction d’information. Il vise à extraire des modèles d’événement sur la base d’un large corpus de documents textuels, par une approche combinée – supervisée et non-supervisée - et de peupler et publier une base de données d’événements accessible par le biais d’un moteur de recherche sémantique.
Grâce à ce moteur, un utilisateur (journaliste ou utilisateur final) pourra formuler des requêtes sur un type d’événement (par ex. un tremblement de terre) en utilisant des filtres d’attributs (localisation = Turquie, magnitude > 8, etc). La base de connaissance sera également publiée selon les principes des données corrélées (linked data).
Pour davantage d'information, visitez notre site web: asrael.limsi.fr ou contacter le coordinateur du projet : Xavier Tannier
* Un événement est défini comme une représentation structurée de quelque chose qui survient, avec un noyau, un contexte spatio-temporel. Le « type d’événement » rassemble des instances d’événement comparables, comme « tremblement de terre », « élection » ou « course automobile ». La représentation générique d’un événement est basée sur la règle des « 5W » (What, Who, Where, When, Why) du journalisme anglo-saxon. En accord avec cette règle, la bonne description d’un événement doit rendre explicites ces cinq éléments.