Madrid, España
El presente estudio pretende avanzar una propuesta metodológica para la búsqueda de refranes en corpus lingüísticos digitales en español. Para ello, se han diseñado cuatro métodos de búsqueda, destinados a localizar dichos enunciados sentenciosos en gigacorpus que contienen mil millones de tokens, como los de la familia TenTen. Estas técnicas se han elaborado a partir de criterios internos y externos, considerando tanto la estructura bimembre como la extensión variable de los refranes. En este sentido, se ha realizado un análisis empírico y cuantitativo que ha permitido la elaboración de un corpus anotado del que proceden los ejemplos utilizados en este trabajo. La metodología aplicada permite investigar sobre cómo actúan estas paremias en la actualidad y observar los varios procesos de variación y cambio a los que están sometidas. Asimismo, esta metodología puede resultar de gran utilidad en ámbitos del saber cómo la traducción, en la medida en que ofrece un método de consulta fiable para localizar refranes y determinar elecciones traductológicas.
Cette étude vise à avancer une proposition méthodologique pour la recherche de proverbes dans des corpus linguistiques numériques en espagnol. À cet effet, quatre méthodes de recherche ont été élaborées, visant à localiser ces énoncés sentencieux dans des gigacorpus contenant un milliard de tokens, tels que ceux de la famille TenTen. Ces techniques ont été développées à partir de critères internes et externes, en prenant en compte à la fois la structure bimembre et la longueur variable des proverbes. Dans ce sens, une analyse empirique et quantitative a été réalisée, permettant la création d'un corpus annoté dont proviennent les exemples utilisés dans ce travail. La méthodologie appliquée permet d'étudier ces paremies et d'observer les différents processus de variation et de changement auxquels elles sont soumises. De même, cette méthodologie peut s'avérer très utile dans des domaines du savoir tels que la traduction, dans la mesure où elle offre un moyen de consultation fiable pour localiser des proverbes et déterminer des choix traductologiques.
This study aims to advance a methodological proposal for locating proverbs in digital linguistic corpora in Spanish. To this end, four search methods have been developed, focused on localizing these paremias in gigacorpora containing billions of tokens, such as those in the TenTen family. These techniques were created based on both internal and external criteria, considering the bimember structure and the variable length of proverbs. In this regard, an empirical and quantitative analysis has been conducted, leading to the creation of an annotated corpus from which the examples used in this work are derived. The applied methodology allows for the investigation of how these paremias function today and observing the various processes of variation and change they undergo. Similarly, this methodology may prove very useful in fields of knowledge such as translation, insofar as it offers a reliable consultation method for identifying proverbs and determining translation choices.