Université Paris III Sorbonne Nouvelle
ILPGA
Institut de Phonétique et de Linguistique Générales et Appliquées
Thèse de doctorat en Sciences du Langage
Linguistique et Informatique
Construction et interrogation de la structure informationnelle d’une base documentaire en français
Bernard JACQUEMIN

Soutenue publiquement le 8 décembre 2 003 devant le jury composé de :

M. Henri BÉJOINT

Rapporteur

M. Benoît HABERT

Directeur

M. Claude ROUX

Examinateur

M. André SALEM

Président

Mme Frédérique SEGOND

Examinatrice

Mme Monique SLODZIAN

Rapporteur

Merci à tous !
Indications typographiques
Table des matières
Table des figures
Liste des tableaux
Introduction
1 Gestion de l’information
 1.1 Introduction
 1.2 Extraire l’information d’un texte
 1.3 Conclusion
2 Les outils d’analyse textuelle
 2.1 Introduction
 2.2 Analyse morpho-syntaxique : NTM et XIP
 2.3 Désambiguïsation sémantique lexicale
 2.4 Conclusion
3 Les ressources lexico-sémantiques
 3.1 Introduction
 3.2 Le dictionnaire de Dubois et Dubois-Charlier
 3.3 La morphologie dérivationnelle
 3.4 Les dictionnaires de synonymes
 3.5 Conclusion
4 Ajustement des dictionnaires
 4.1 Introduction
 4.2 Correction de ressources
 4.3 Élargissement des dictionnaires
 4.4 Conclusion
5 Enrichissement des documents
 5.1 Introduction
 5.2 Stockage de l’information syntaxique
 5.3 Un nouveau désambiguïsateur sémantique
 5.4 Adjonction des synonymes
 5.5 Exploitation de la dérivation morphologique
 5.6 Conclusion
6 Interrogation des documents
 6.1 Introduction
 6.2 Analyse de la question
 6.3 Correspondance entre question et réponses
 6.4 Conclusion
7 Évaluation de la méthode
 7.1 Introduction
 7.2 Définition des critères
 7.3 Présentation des résultats
 7.4 Analyse des erreurs
Conclusion
Bibliographie
Bibliographie
Index
Glossaire
Annexes
Annexes
A Méthode de stockage de l’information
B Typologie des questions de TREC-8
C Résultats de l’interrogation
 C.1 Évaluation de type question-réponse
 C.2 Évaluation de type extraction d’information