Murcia, España
El presente trabajo examina las posibilidades que los acercamientos basados en los big data ofrecen a la investigación sobre el lenguaje. De manera resumida, los big data o “macrodatos” son los datos masivos que los usuarios generan en sus interacciones con el mundo digital y cuyo ingente volumen y naturaleza heterogénea precisa de un tratamiento especializado. El trabajo revisa de manera inicial las principales características de los big data para centrarse a continuación en los posibles problemas derivados del uso de big data en los análisis lingüísticos. La siguiente sección ofrece una revisión de estudios concretos que utilizan este acercamiento aplicándolo a la multimodalidad: un estudio del lenguaje que incluye no sólo el componente verbal sino aspectos multimodales como la gestualidad o la entonación. El trabajo concluye con una revisión de las ventajas y los problemas de la utilización de este tipo de datos.
This paper examines the possibilities that big data-based approaches offer to language research. In a nutshell, the term “big data” makes reference to the massive amount of data that users generate in their digital interactions and whose great volume and heterogeneous nature typically requires a specialized treatment. The chapter starts by reviewing the main characteristics of big data, and then focuses on the possible problems arising from the use of big data in linguistic analysis. The following section offers a review of specific studies that apply this big-data approach to the study of multimodality: an approach to language study that includes not only the verbal component but also multimodal aspects such as gestures or intonation. The paper concludes with a review of the advantages and problems of using this type of data.