El análisis de datos masivos (big data) como el contenido generado por el usuario y concretamente las opiniones online de los consumidores ha atraído una atención considerable en los últimos años debido a sus numerosas oportunidades de investigación y aplicaciones comerciales en casi todos los campos del conocimiento. El origen de este género digital en la tradición oral pone de relieve los rasgos espontáneos de la lengua hablada que se reflejan en el texto escrito y que tiene características propias según la cultura y la lengua del usuario. Mediante la comparación de un corpus de 2.000 reseñas, este trabajo propone la identificación y el análisis de las características singulares de este nuevo género digital para determinar el comportamiento de la traducción automática de las opiniones de los usuarios al español. Así, el objetivo de este trabajo es el estudio de las reseñas turísticas traducidas al español e identificar cómo aborda la TA las principales características que confieren a este género naturalidad y credibilidad.
L'anàlisi de dades massives (big data) com el contingut generat per l'usuari i concretament les opinions en línia dels consumidors ha atret una atenció considerable en els darrers anys a causa de les seves nombroses oportunitats de recerca i aplicacions comercials en gairebé tots els camps del coneixement . L'origen d'aquest gènere digital a la tradició oral posa en relleu els trets espontanis de la llengua parlada que es reflecteixen al text escrit i que té característiques pròpies segons la cultura i la llengua de l'usuari. Mitjançant la comparació d'un corpus de 2.000 ressenyes, aquest treball proposa la identificació i anàlisi de les característiques singulars d'aquest nou gènere digital per determinar el comportament de la traducció automàtica de les opinions dels usuaris a l'espanyol. Així, l'objectiu d'aquest treball és l'estudi de les ressenyes turístiques traduïdes a l'espanyol i identificar com aborda la TA les característiques principals que confereixen a aquest gènere naturalitat i credibilitat.
Big data analysis such as user-generated content and specifically online consumer reviews has attracted considerable attention in recent years due to its numerous research opportunities and commercial applications in almost all fields of knowledge. The origin of this digital genre in the oral tradition highlights the spontaneous features of the spoken language that are reflected in the written text that has its own characteristics depending on the user’s culture and language. By comparing a corpus of 2,000 reviews, this paper proposes the identification and analysis of the unique characteristics of this new digital genre to determine the behavior of machine translation of users' reviews into Spanish. Thus, the aim of this work is to study the tourism reviews translated into Spanish and identify how MT handles the main characteristics that confer naturalness and credibility to this genre.