Barcelona, España
Este artículo presenta una metodología para el análisis de la evolución de la terminología de un dominio especializado, medida en variación de frecuencia de uso, aparición y desaparición de los términos. Como ejemplo, el artículo describe los resultados de la aplicación de esta metodología a un corpus conformado por las actas de los congresos organizados por la Asociación Española de Lingüística Aplicada, entre los años 1983 y 2006. La metodología se resume en un algoritmo cuantitativo independiente de lengua que acepta como entrada un conjunto de ficheros de texto organizados por años y como salida selecciona términos de ese corpus calculando cómo se distribuyen sus frecuencias a lo largo del tiempo. Las propiedades geométricas de las curvas que representan las frecuencias de uso de esas unidades terminológicas permiten identificar automáticamente aquellas unidades que se ponen de moda en el dominio así como las que dejan de utilizarse. Metafóricamente, se trata de una radiografía de los cambios de paradigma que se van dando a lo largo de la historia del campo, pero también de una neología y una arqueología de su terminología, rescatando términos que sería difícil encontrar mediante inspección manual debido a la escala del corpus. El objetivo específico del artículo es proponer una alternativa a otros modelos existentes para el estudio de unidades en la escala temporal que se limitan a seguir la curva de distribución de frecuencias en el tiempo de unidades elegidas arbitrariamente por un usuario. La alternativa en este artículo ofrece una visión distinta porque es proceder del modo inverso, en lugar de introducir unidades léxicas para ver sus curvas, introducir las curvas para obtener las unidades. La utilidad de estos conjuntos de unidades puede variar en función de las necesidades. Por ejemplo, la creación de glosarios terminológicos de distintos tipos (en papel o en formato electrónico) puede requerir ya sea una nomenclatura que incluya sólo la terminología firmemente establecida en el campo o, en otros casos, incluir también las unidades neológicas o en desuso
This paper presents a methodology for analyzing the evolution of the terminology used in a specialized domain. Such terminology is measured according to its variation in the frequency of use, as well as the appearance and disappearance of the terms. As an example, the paper reports the results of the application of this methodology to a corpus made up of the 1983-2006 Spanish Association of Applied Linguistics proceedings. The methodology can be summarized in a quantitative and language-independent algorithm that accepts a set of text documents organized by years as input and offers a selection of terms as output by calculating their frequency distribution over time. The geometrical properties of the curves representing the frequency of use of the terminological units help to automatically identify those which come into use and those no longer in use. Metaphorically, the paper offers a kind of radiology of the paradigm shifts that occur in the history of the field as well as a neology and an archeology of its terminology, revealing terms that would be otherwise hard to find due to the scale of the corpus. The specific objective of this paper is to propose an alternative to other methods which only consider curves of frequency distribution of units in the time line arbitrarily selected by a user. This paper offers a new view because it is the reverse procedure: instead of introducing lexical units to study their frequency curves, the curves to obtain the units are introduced. The usefulness of these sets of units may vary according to the needs. For instance, the creation of glossaries of different types (hard copy or electronic format) may require a nomenclature that includes only the terminology firmly established in the literature or, in other cases, neologisms or terms no longer in use