La anotación lingüística del habla en corpus multimodales es una labor tan nueva como costosa, pero también es prometedora para tareas como la extracción y el resumen de contenido, así como para abrir nuevos caminos en el análisis del habla espontánea. El presente artículo repasa el estado de la cuestión en los distintos niveles de análisis con ejemplos de proyectos internacionales y nacionales, resaltando la importancia de encontrar una base común a pesar de la actual falta de estándares.
The linguistic tagging of spoken language in multimodal corpora is a new and complex task. However, its possibilities for other tasks such as content extraction/ summarization and for further linguistic analysis are promising. This article reports on the state-of-the-art in the different analysis levels including experiences from international projects and stressing the importance of a common ground in spite of the current lack of standards.