En este artículo presentamos el sistema SMORPH, una herramienta para la construcción de diccionarios electrónicos para el análisis morfológico y el etiquetado de textos reales, así como su utilización para la construcción de un diccionario para el tratamiento de textos en español. El sistema se revela eficiente para declarar los fenómenos tipográficos y morfológicos (reglas tipográficas y de puntuación, prefijos y sufijos, palabras compuestas, palabras desconocidas, etc.) que pese a aparecer frecuentemente en los textos reales, no siempre se tienen suficientemente en cuenta en los analizadores sintácticos. SMORPH se enmarca en los trabajos de GRIL sobre estudio y desarrollo de herramientas de tratamiento lingüístico automático de textos, y debe considerarse como un módulo que se integra en otros proyectos (análisis sintáctico, etc.).
This paper describes the SMORPH system -a tool for building electronic dictionaries, morphological analysis and tagging of running texts- and how it is currently used to build a Spanish dictionary and to process Spanish texts. The system has shown to be efficient and deals, in a declarative fashion, with several typographical and morphological phenomena (punctuation and typographical rules, prefixes and suffixes, compounds, unknown words, etc.) which, though very usual in running texts,are not taken into account by most grammar building tools and parsers. SMORPH is part of the GRIL works on the study and development of tools for automatic linguistic processing of texts. It must be then considered as a module integrated in other projects (syntactic analysis, etc.).