Notre thème de recherche a pour objet d’élaborer une méthode de construction de structure informationnelle à partir d’une base documentaire. Cette structure doit être capable de fournir un accès à la réponse d’une question posée relative au contenu des documents. De nombreuses recherches ont été menées depuis les débuts du traitement automatique des documents qui poursuivent un objectif semblable : trouver une information précise dans des textes. Notamment, les techniques d’extraction d’information et de question-réponse appartiennent aux deux disciplines les plus exigeantes en ce qui concerne l’identification de l’information recherchée.
Malgré leurs spécificités, ces deux disciplines possèdent en commun différentes caractéristiques. Premièrement, toutes deux cherchent à identifier l’information recherchée grâce à des répertoires – préalablement constitués ou non – capables de repérer toutes les formes sous lesquelles l’information recherchée peut se présenter. L’extraction d’information constitue donc des ensembles de patrons ou de cadres capables de retrouver un type informationnel sous un grand nombre d’aspects. De leur côté, les approches de question-réponse travaillent en expansion de la requête proposée et fournissent pour les données qui s’y trouvent un maximum d’actualisations différentes.
Un second point commun entre les deux disciplines concerne leur intérêt croissant pour l’analyse textuelle et les approches linguistiques. En effet, l’identification des mots permet de préciser la nature de l’information recherchée dans les textes et aussi celle de l’information présente dans la question ou le type informationnel. Les aspects statistiques dominent toutefois dans la plupart des approches.
Ce chapitre s’intéresse à la conférence MUC spécialisée en extraction d’information et aux méthodologies qui y ont été présentées. Il se penche ensuite sur la campagne d’évaluation de TREC consacrée à la discipline de question-réponse et sur certains systèmes qui y ont concouru. Il s’agit en effet de connaître les besoins des domaines auxquels nous proposons notre méthodologie, et d’identifier également les points forts des méthodologies proposées comme les difficultés auxquelles elle doivent faire face.