Shima Salameh Jiménez, Adrià Pardo Llibrer
Los modelos de segmentación actuales tienen el párrafo como unidad de referencia: algunos delimitan y desgranan su constitución interna en relación con el conjunto del texto (Vera Luján, 2012; Garrido, 2014); otros lo conciben como unidad básica de sentido, especialmente en escritos con una elaboración estilística alta en los que la puntuación suele jugar un rol fundamental (Ferrari y Borreguero Zuloaga, 2015). Aunque la unidad párrafo es productiva, su aplicación sistemática puede presentar problemas en artículoso columnas de opinión, en discursos de planificación discursiva relativamente reducida, en textos de especialización temática baja y variación en el nivel del registro, o en discursos producidos por estudiantes en etapas de formación obligatoria, primeros años universitarios o, incluso, hablantes no nativos de español, cuyas destrezas de escritura todavía están en desarrollo. En estos casos, se da una distribución informativodiscursiva ad libitum con, habitualmente, un empleo de la puntuación impropio, lo que dificulta asumir el párrafo como unidad completa de sentido en procesos de segmentación precisos, replicables y sin residuos. En este trabajo, presentamos dos nuevas unidades de segmentación derivadas del modelo de unidades Val.Es.Co.: conjunto de actos y movimiento. Para ello, ofrecemos un primer análisis basado en un acuerdo entre anotadores tras la segmentación completa de 15 textos formales, escritos en español peninsular, y que presentan, en mayor o menor grado, algunos de los problemas mencionados. Los resultados del estudio arrojan un conjunto de rasgos formales, estructurales y léxicos, vinculados a cada unidad, con el fin de aplicarlas en futuros análisis y contrastarlas con otros modelos de segmentación de lo escrito.
Current discourse segmentation models often consider paragraphs as their basic units. Some studies analyze the internal structure of paragraphs in relation to the entire text (Vera Luján, 2012; Garrido, 2014), while others treat paragraphs as the fundamental meaningful units, particularly in highly stylistic writings where punctuation plays a crucial role (Ferrari and Borreguero Zuloaga, 2015). Although the paragraph is a productive unit, systematic applications may encounter issues when dealing with texts such as news articles, opinion pieces, or minimally planned discourses. This includes those written by students in compulsory education or early university years, as well as non-native Spanish speakers whose writing skills are still developing. In these cases, information distribution may be problematic, often combined with improper use of punctuation, making it challenging to consider the paragraph as a complete unit of meaning in precise, replicable segmentation processes. In this study, we present two new segmentation units derived from the Val.Es.Co. model for oral discourses: “conjunto de actos” and “movimiento.” We provide an initial analysis based on the complete segmentation of 15 formal texts written in Peninsular Spanish, which exhibit some of the aforementioned issues. The results offer a set of formal, structural, and lexical features associated with each unit, with the aim of applying them in future analyses and comparing them with other written segmentation models.