El Abstract del Artículo de Investigación Científica en Inglés (AbAICI) ha sido, y aún lo es, el foco de atención de numerosas investigaciones tanto desde la perspectiva de la Lingüística Sistémica Funcional (SFL) como desde la perspectiva del Procesamiento Automático de Lenguas Naturales (NLP). Dada la complejidad del objeto de estudio, sin embargo, es todavía necesario llevar a cabo estudios extensivos del AbAICI que provean generalizaciones descriptivas detalladas acerca de la relación entre contexto y lengua que estén basadas en corpus, definidas formalmente e implementadas computacionalmente. Estas tres condiciones parecen ser centrales para cualquier proyecto de Generación de Lengua Natural (NLG) cuyo objetivo a largo plazo sea simultáneamente modelizar la unidad y la diversidad sistémico-funcional encontrada en los AbAICIs, y utilizar el modelo resultante en el desarrollo de herramientas para la asistencia retórica y lingüística en la escritura interactiva de AbAICIs. Este es el objetivo central del Proyecto RedACTe, uno de cuyos resultados teórico-descriptivos se presenta aquí. El mecanismo formal básico utilizado por la Gramática de Cardiff para la generación de oraciones-texto es adaptado y extendido para expresar correlaciones sistemáticas entre rasgos de estratos superiores (género y registro) y rasgos de estratos inferiores (léxico-gramática) de AbAICIs de la muestra disciplinar del Proyecto RedACTe. Definimos reglas de generación, tanto dentro de cada estrato como entre estratos, para la proyección del género en la semántica y la semántica en la forma, y así en el texto propiamente dicho.
The Research Article Abstract (RAA) has been the focus of numerous investigations within both the Systemic Functional Linguistics (SFL) and the Natural Language Processing (NLP) communities, and from the text generation and the text analysis/parsing perspectives. Given the complexity of the object of study, however, there still is a need for extensive studies of the RAA that provide detailed, descriptive, corpus-based, formally defined, and computationally implemented generalizations on the relationship between context and language. These three conditions appear to be central to any Natural Language Generation (NLG) project whose long-term goal is to simultaneously model the systemic-functional unity and diversity found in RAAs and use the resulting model for the development of tools for interactive, rhetorical, and linguistic assistance in RAA writing. This is the ultimate goal of the RedACTe Project, one theoretical-descriptive result of which is hereby presented. The basic formal mechanism used by the Cardiff Grammar for the generation of text-sentences is adapted and extended to capture systematic correlations between higher (genre and register) and lower (lexical-grammar) strata features of RAAs of the RedACTe Project¿s discipline samples. Generation procedures are defined and implemented, both within any one stratum and between strata, for mapping genre onto semantics and semantics onto form, and for text construction.