L’élaboration de la structure informationnelle d’une base documentaire n’est pas une réalisation gratuite. Sa vocation est de fournir un accès précis à l’information contenue dans les textes, même pour des disciplines aussi exigeantes que l’extraction d’information ou la tâche de question-réponse. Une fois la structure informationnelle construite, il s’agit de concevoir une méthode qui permette de sélectionner l’information jugée intéressante.
Comme la nature de l’information contenue dans la structure informationnelle est linguistique (lexèmes, dépendances syntaxiques, traits sémantiques, etc.), il est normal de demander à la méthode d’interrogation de la base d’être capable de traiter des requêtes en langage naturel. Dès lors, l’accès à l’information se fait en questionnant directement le système. Cette requête est analysée d’une manière similaire à l’analyse des documents afin de construire une structure correspondant à la question compatible avec la structure informationnelle de la base documentaire. Ensuite, la structure de la question est comparée avec celle des textes afin de localiser la présence d’une information correspondante dans les textes.
L’analyse de la question se distingue puisque l’information recherchée doit être catégorisée. De plus, la structure de la question n’est pas enrichie. La comparaison entre les structures de la question et des documents peut être plus ou moins exigeante. D’abord, l’unité lexicale qui permet de catégoriser l’information recherchée peut être exigée ou non dans la réponse. Ensuite, la correspondance des liens syntaxiques entre les éléments d’information de la question et de la réponse peut être plus ou moins grande. Enfin, la fenêtre de réponse peut varier en taille : phrase, paragraphe ou texte.
Ce chapitre décrit les traitements particuliers appliqués à la question pour construire sa structure informationnelle propre, et notamment la catégorisation de l’objet de la question. Ensuite, il présente la méthode de mise en correspondance de la question avec les fragments de texte qui en sont les réponses, ainsi que les paramètres de contrainte sur l’objet de la question, sur les correspondances syntaxiques et sur la fenêtre de réponse.