Valladolid, España
La traducción automática (TA) y los chatbots de inteligencia artificial (IA) generativa han transformado la comunicación global al facilitar la transmisión de información entre lenguas y, por ende, entre culturas. No obstante, también plantean desafíos éticos debido a los sesgos lingüísticos. En particular, estos sesgos afectan negativamente a la terminología que representa a las mujeres y al colectivo LGTBIQ+ en las traducciones generadas por estas tecnologías. Partimos de la hipótesis de que tanto las tecnologías de traducción automática como los chatbots de inteligencia artificial presentan dificultades para traducir correctamente los marcadores de género y la terminología LGTBIQ+ del inglés al español. En este sentido, con frecuencia optan por el masculino genérico cuando no se proporciona suficiente información contextual o por términos inadecuados, aunque se espera que los chatbots más recientes ofrezcan mejores resultados en este aspecto. Para validar dicha hipótesis, hemos diseñado una metodología de análisis basada en la recogida de datos cuantitativos y cualitativos a partir de traducciones generadas por sistemas de traducción automática convencionales (DeepL y Google Translate) y chatbots de inteligencia artificial como ChatGPT y Gemini. Para evaluar los datos se ha empleado una adaptación de Multidimensional Quality Metrics (MQM), que permitirá obtener un marco estandarizado para medir la calidad de traducciones. Los resultados que se desprenden del análisis muestran la persistencia de un sesgo marcado hacia el género masculino, con una identificación inconsistente del género femenino. De este modo, se puede concluir que el producto resultante de los sistemas basados en inteligencia artificial generativa no presenta mejoras significativas en comparación con los sistemas de traducción automática convencionales.
Por ello, es necesario desarrollar tecnologías lingüísticas más inclusivas, equitativas y libres de sesgos, así como fomentar el diseño de sistemas más justos y respetuosos con la diversidad, esenciales para responder a los desafíos de un contexto cada vez más interconectado y globalizado.
Machine translation (MT) and generative artificial intelligence (AI) chatbots have revolutionized global communication as they facilitate seamless cross-language and rich cross-cultural information transmission. However, they also raise complex ethical challenges due to underlying linguistic and sociocultural biases. These biases negatively impact the accurate and respectful terminology representing women and the LGBTQIA+ community in translations generated by these advanced technological systems. We hypothesize that Machine Translation technologies and Artificial Intelligence chatbots face significant and persistent challenges in accurately translating nuanced linguistic gender markers and culturally specific LGBTQIA+ terminology from English to Spanish. These tools often default to the generic masculine form when contextual information is insufficient or vague, or resort to inadequate, outdated, or inappropriate terms; however, the latest generation of sophisticated chatbots is expected to yield improved and more inclusive results in this sensitive area. To validate the hypothesis, a comprehensive and systematic methodology of analysis has been designed based on rigorous quantitative and in-depth qualitative data collection derived from translations generated by conventional Machine Translation systems (DeepL and Google Translate) and advanced AI chatbots such as ChatGPT and Gemini. This detailed analysis aims to evaluate how these tools handle inclusive and non-discriminatory terminology and their accuracy in faithfully reflecting gender diversity.
Multidimensional Quality Metrics (MQM) will be used for the evaluation to provide a standardized and widely recognized framework for objectively measuring translation quality. The findings from the comparative analysis reveal a persistent and problematic bias towards the male gender and inconsistent identification of the female gender. These issues lead to the conclusion that, despite using generative artificial intelligence, no significant or meaningful improvements in translation quality are observed compared to conventional Machine Translation systems. Therefore, it is essential to develop more inclusive, equitable, and unbiased linguistic technologies while actively promoting the design of fairer and more inclusive systems that respect human diversity—both crucial for addressing the urgent challenges of an increasingly interconnected and globalized world.