Thierry Etchegoyhen, Harritxu Gete, Begoña Arrate, Joxean Zapirain, Victor Ruiz
En este trabajo, presentamos el recurso ADAPTIA-MT para la adaptación y evaluación de sistemas de traducción automática en ámbitos industriales. Este recurso incluye terminología especializada y datos paralelos de validación para la traducción castellano-euskera, creados y revisados manualmente, en cuatro sectores: automoción, energía, ferroviario y máquina-herramienta. Sobre estos recursos, se comparan modelos de traducción neuronal y modelos basados en Grandes Modelos de Lenguaje en tareas de adaptación al dominio, evaluando tanto la calidad general como la precisión de la traducción terminológica. Los recursos se comparten con la comunidad científica bajo licencia CC-BY-NC-ND 4.0.
In this work, we describe the ADAPTIA-MT suite of resources for the adaptation and evaluation of Machine Translation (MT) systems in industrial domains. The suite includes specialised terminology and parallel validation corpora for Basque-Spanish translation, manually crafted and validated in four sectors: automotive, energy, railways and machine tool. We build upon these resources to compare two main approaches on domain adaptation tasks, namely Neural Machine Translation and MT based on Large Language Models, measuring both general translation quality in the selected domains and terminological accuracy. The resources are shared with scientific community under a CC-BY-NC-ND 4.0 license.