Antonio Moreno Sandoval , Marta Garrote Salazar
Este trabajo resume un estudio realizado sobre la adquisición de la expresión oral de cuarenta universitarios (N = 40) que estudiaban español como lengua extranjera en los niveles A2 y B1 (MCER). El método de obtención de datos es una entrevista semiespontánea, tomando cuatro participantes por cada lengua materna (principalmente, portugués, italiano, francés, inglés, neerlandés, alemán, polaco, chino y japonés). Igualmente, se entrevistó a cuatro hablantes nativos de edad similar (grupo de control) para establecer comparaciones acerca de la producción oral y los errores del habla. El estudio parte de la metodología de la lingüística de corpus, la didáctica del español, el análisis de errores asistido por ordenador y la investigación en adquisición de segundas lenguas. Uno de los resultados es la recogida de un corpus de interlengua oral de aprendices de español. Dicho banco de datos ha permitido analizar los aspectos formales del habla no nativa (recuento de palabras o categorías más frecuentes), para lo cual se anotó morfológicamente el corpus mediante el analizador informático GRAMPAL. Asimismo, se analizaron los errores de la producción oral en el nivel léxico, gramatical, de pronunciación y pragmático-discursivo. Para este fin se diseñó una tipología de errores y se anotó manualmente el corpus con etiquetas XML
This paper summarizes the results of a study on the acquisition of the oral expression by forty university learners (N = 40) who studied Spanish as a Foreign Language at A2 (N=20) and B1 (N=20) levels (CEFR). The data collection method was a semi-spontaneous interview, and learners were divided into 10 groups (with four participants in each group) according to their mother tongue (L1). Learners’ L1 was principally Portuguese, Italian, French, English, Dutch, German, Polish, Chinese, and Japanese. Likewise, four native speakers of similar age were interviewed with the same procedures (control group) in order to compare spo¬ken language phenomena and errors between native and non-native speakers. The methodology used departs from the following approaches: Corpus linguistics, Didactics of Spanish as a foreign language, Computer-assisted error analysis, and Second language acquisition research. A result from the project is the collection of a Spanish learner language oral corpus for search and analysis purposes. This data bank has been used to examine formal aspects of non-native speech (e.g. word count or most frequent categories). To accomplish this task, the corpus was part-of-speech tagged by means of an automatic tagger for Spanish language (GRAMPAL). Furthermore, the errors were analysed at different linguistic levels: lexis-semantics, grammar, pronunciation, and pragmatics-discourse. For that goal, an error typology was designed and the errors were manually tagged with XML tags