Alicante, España
La construcción de corpus orales implica necesariamente el tratamiento y la transcripción del audio. Resulta esencial conocer el uso de herramientas de transcripción, anonimización en el texto y anonimización en el audio. Los últimos avances tecnológicos permiten no solo contar con “software” especializado para la transcripción, el alineado de texto con el audio y el tratamiento de audio, sino que también se dispone de métodos semiautomáticos de procesamiento de datos. Una combinación de estas herramientas y procedimientos es sumamente ventajosa para la tarea de recolección de datos y construcción de corpus orales. En este trabajo, se ofrece un protocolo de tratamiento de los datos orales claro y sistemático, lo que supone un paso fundamental para poder poner a disposición de la comunidad científica corpus orales.
Building oral corpora necessarily means processing and transcribing audio files. It is essential to know how to use tools to transcribe and anonymize text and audio. The latest technological developments allow not only to have specialised software for transcribing, aligning text to audio and handling audio files, but also semiautomatic methods for data processing. Mastering a combination of these tools and procedures is highly advantageous for data collection and corpora compilation. In this work, a systematic and straightforward protocol to process oral data is presented, which is an essential step to make oral corpora available for the scientific community.