RESUMEN Este trabajo presenta el proceso de diseño y recopilación del corpus Mexican Learner Corpus (MexLeC), a la luz de las nociones principales en la construcción de un corpus de aprendices: representatividad, autenticidad y balance (Egbert, Biber y Gray, 2022; McEnery, Xiao y Tono, 2006; Biber, 2004). Adicionalmente, se presenta un estado del arte sobre las tareas utilizadas para recopilar corpus orales de aprendices y los corpus de aprendices de inglés cuya lengua materna es el español. El resultado es un corpus oral y longitudinal único en América Latina de aproximadamente 200.000 tokens y 150 entrevistas en proceso de transcripción. Estas entrevistas representan tres tipos textuales (Biber, 2004): narrativo, informativo y de posicionamiento y dos géneros textuales (Council of Europe, 2020): monólogo descriptivo y monólogo argumentativo. Las aplicaciones principales de MexLeC son la comprensión de los patrones de adquisición de lengua extranjera, así como el desarrollo de materiales didácticos y programas de enseñanza del inglés.
ABSTRACT This article introduces the process of design and collection of the Mexican Learner Corpus (MexLeC), considering the notions of representativeness, authenticity (naturalness) and balance in building a learner corpus (Egbert, Biber y Gray, 2022; McEnery, Xiao y Tono, 2006; Biber, 2004). At the same time, it presents a literature review of materials and task type in learner spoken corpora and the availability or English learner corpora from Spanish native speakers. The result is an oral and longitudinal corpus unique in Latin America of approximately 200 000 tokens and 150 interviews in transcription. The recorded interviews sample three text-types in Biber (2004), informative, stance and narrative as well as two text genres (Council of Europe, 2020), descriptive monologue and argumentative monologue. The main applications of MexLeC are in the understanding of patterns of language acquisition and the development of teaching materials and program design for English as a Foreign Language.