La richesse et l’architecture homonymique du dictionnaire Dubois, ainsi que la variété des informations qui y sont renfermées, nous ont amené à le choisir pour dictionnaire de référence. En effet, les données morphologiques, syntaxiques et sémantiques nous autorisent à l’exploiter tant pour l’analyse des documents que pour leur enrichissement. Toutefois, l’information qui y est rassemblée n’est ni complète, ni exempte d’imperfections.
Nous avons dès lors étudié d’autres ressources lexicales dont l’information est susceptible de compléter les lacunes du Dubois ou de corriger ses erreurs. Nous avons sélectionné diverses ressources synonymiques pour enrichir les ensembles de synonymes trop pauvres du Dubois, puis un outil de dérivation morphologique capable de pallier les indications parfois déficientes dont nous disposons. Les informations de dictionnaires sémantiques ont également été étudiées, mais nous avons rejeté l’exploitation d’une ressource électronique dont la cohérence et la rigueur étaient trop sujettes à caution.
Ces ressources nécessitent toutefois certains traitements avant de pouvoir être utilisées de manière efficace et cohérente dans les tâches d’analyse ou d’enrichissement auxquelles elles sont destinées. En effet, leur compatibilité avec le dictionnaire de référence doit être assurée pour que les données issues d’un dictionnaire puissent correspondre à celles des autres ressources.