Este estudio experimental investiga el impacto potencial de emplear el reconocimiento automático de voz (ASR) y la traducción de voz (ST) en la interpretación consecutiva (CI) utilizando una herramienta de interpretación asistida por ordenador (CAI). La herramienta CAI empleada en este contexto es “Sight-Terp”, una herramienta con soporte ASR desarrollada y diseñada por el primer autor de este estudio. Sight-Terp ofrece múltiples funciones, como ASR, traducción automática en tiempo real, resaltado de entidades nombradas y segmentación enumerada automáticamente. La metodología de la investigación adopta un diseño intra-sujetos, evaluando el rendimiento de los participantes en escenarios con y sin el uso de Sight-Terp en una tablet. Se reclutaron 12 participantes para el experimento, y se les pidió que interpretaran cuatro discursos en inglés en modo interpretación consecutiva larga al turco: dos utilizando Sight-Terp y los otros dos con papel y bolígrafo. El análisis de datos se basa en parámetros de precisión y fluidez. Para distinguir la variación en la precisión entre los dos escenarios, las métricas de precisión se fundamentaron en el promedio de unidades semánticas correctamente interpretadas (unidades de significado) según Seleskovitch (1989). Por otro lado, la fluidez se cuantificó rastreando la frecuencia de marcadores de disfluencia, incluidos falsos inicios, pausas innecesarias, palabras de relleno, repeticiones de palabras completas, palabras fragmentadas y frases incompletas en cada sesión. Los resultados muestran que la integración de ASR en dos tareas de interpretación consecutiva mejoró la precisión en las interpretaciones de los participantes. Sin embargo, esto también incrementó la frecuencia de disfluencias y prolongó la duración de sus rendimientos en comparación con las tareas realizadas sin Sight-Terp. Los hallazgos del estudio también sugieren áreas potenciales de mejora y modificaciones que podrían optimizar aún más la utilidad de la herramienta. Estudios empíricos futuros con Sight-Terp podrán ofrecer más información sobre la viabilidad del ASR en el proceso de interpretación y sobre los aspectos cognitivos de la interacción humano-máquina en la interpretación consecutiva.
Aquest estudi experimental investiga l’impacte potencial d’utilitzar el reconeixement automàtic de veu (ASR) i la traducció de veu (ST) en la interpretació consecutiva (CI) utilitzant una eina d’interpretació assistida per ordinador (CAI). L’eina CAI utilitzada en aquest context és “Sight-Terp”, una eina amb suport ASR desenvolupada i dissenyada pel primer autor d’aquest estudi. Sight-Terp ofereix múltiples funcions, com ara ASR, traducció automàtica en temps real, ressaltat d’entitats i segmentació enumerada automàticament. La metodologia de la investigació adopta un disseny intra-subjectes, avaluant el rendiment dels participants en escenaris amb i sense l’ús de Sight-Terp en una tablet. S’han reclutat 12 participants per a l’experiment, i se’ls ha demanat que interpretin quatre discursos en anglès en mode interpretació consecutiva llarga al turc: dos utilitzant Sight-Terp i els altres dos amb paper i bolígraf. L’anàlisi de dades es basa en paràmetres de precisió i fluïdesa. A fi de distingir la variació en la precisió entre tots dos escenaris, les mètriques de precisió s’han fonamentat en la mitjana d’unitats semàntiques correctament interpretades (unitats de significat) segons Seleskovitch (1989). D’altra banda, la fluïdesa s’ha quantificat rastrejant la freqüència de marcadors de disfluència, inclosos falsos inicis, pauses innecessàries, paraules per omplir, repeticions de paraules completes, paraules fragmentades i frases incompletes en cada sessió. Els resultats mostren que la integració d’ASR en dues tasques d’interpretació consecutiva ha millorat la precisió en les interpretacions dels participants. De tota manera, això també ha incrementat la freqüència de disfluències i ha prolongat la durada dels seus rendiments en comparació a les tasques realitzades sense Sight-Terp. Les troballes de l’estudi també suggereixen àrees potencials de millora i modificacions que podrien optimitzar encara més la utilitat de l’eina. Estudis empírics futurs amb Sight-Terp podran oferir més informació sobre la viabilitat de l’ASR en el procés d’interpretació i sobre els aspectes cognitius de la interacció humà-màquina en la interpretació consecutiva.
This experimental study investigates the potential impact of employing automatic speech recognition (ASR) and speech translation (ST) in consecutive interpreting (CI) through the use of a computer-assisted interpreting (CAI) tool. The tool used is Sight-Terp, an ASR-supported CAI tool developed and designed by the first author of this study. It offers multiple features, such as ASR, real-time ST, named entity highlighting, and automatically enumerated segmentation. The methodology adopted in this research involves a within-subjects design, assessing participants’ output in scenarios with and without the use of Sight-Terp on a tablet. Twelve participants were recruited for the experimental setup and asked to interpret four English speeches into Turkish in long CI mode, using Sight-Terp for two of them and a pen and paper for the other two. The data analysis is grounded on parameters of both accuracy and fluency. In distinguishing the variance in accuracy across the two settings, accuracy metrics were rooted in the mean count of correctly rendered semantic units (units of meaning), as defined by Seleskovitch (1989). On the other hand, fluency was quantified by tracking the frequency of disfluency markers, including false starts, frequency of filled pauses, filler words, whole-word repetitions, broken words, and incomplete phrases in each session. The results show that the integration of ASR into two CI tasks led to an enhancement in the accuracy of the participants’ rendition. Concurrently, however, it led to an increase in disfluencies and extended task durations compared to the tasks in which Sight-Terp was not used. The study outcomes also suggest potential areas of improvement and modifications that could further enhance the utility of the tool. Future empirical studies using Sight-Terp will tell us more about the feasibility of ASR in the interpreting process and cognitive aspects of human-machine interaction in CI.