María Belén Labrador de la Cruz 

Las relaciones sintagmáticas siempre han sido el eje central de la lingüística de corpus, donde elelemento más importante es elcotexto(principalmente patrones colocacionales). Sin abandonar este enfoque, el advenimiento de la inteligencia artificial(IA)ha abierto nuevas posibilidades para explorar los corpus más allá de las funcionalidades de los navegadores y programasde concordancias, ya que las herramientas de investigación impulsadas por IA ofrecen una comprensión más profunda y holística de los corpus. Este artículo examinael potencial de Notebook LM, una aplicación de IA generativa. Lahipótesis inicial es que la combinación decorpus eIAconduce a una comprensión más exhaustiva de géneros textuales y del lenguaje utilizado en ellos. Una ventaja de Notebook LM sobre grandes modelos de lenguaje como ChatGPT es que procesa solo los textos cargados, otorgandoa los investigadores control preciso sobre las fuentes utilizadas. Como estudio de caso, se utilizó un corpus comparable de descripciones de quesos: 400 textos en español (121461 palabras) y 600 en inglés (111871 palabras). Se utilizó Notebook LM para resumir el corpus,obtener temas clave,como la importancia histórica y los métodos de produccióny demostrar el poder de las instrucciones(prompts), más adecuadas para el análisis cualitativo. Al compararlas convenciones de escritura, las descripciones en inglés tienden a ser más concisas e informativas, mientras que los textos españolesutilizan un lenguaje más subjetivo y evocador, a menudo incorporando contexto cultural y un tono más entusiasta. Estos hallazgos pueden ser útiles en escritura en segundas lenguas y en traducción, al distinguir las características estilísticas de textos promocionales que resultan apropiadas en ambas lenguas. En conclusión, Notebook LM proporciona posibilidades complementarias que, combinadas con otras aplicaciones de análisis de corpus, constituyen una poderosa herramienta para el aprovechamiento de los corpus basados en géneros.
Syntagmatic relations have always been at the core of corpus linguistics, where the most important element to study is the co-text,mainly collocates and patterns identified in concordance lines. Without abandoning this approach, the advent of artificial intelligence (AI)has opened new possibilities for exploiting corpora beyond traditional browser and concordancer functionalities, as AI-powered research tools offer a deeper, more holistic understanding of corpora. This paperexplores the potential of Notebook LM, a generative AI (GenAI) application, to complement data retrieved by traditional corpus-analysis toolkits.Ourinitial hypothesis is that combining corpus and GenAI approaches leads to a more comprehensive understanding of specific genre-based texts and the language used within them. A key advantage of Notebook LM over large language models (LLMs) like ChatGPT is that it processes only uploaded texts, giving researchers precise control over the sources used.As a case study, a comparable English-Spanish corpus of online cheese descriptionswas used. It contains 400 Spanish texts(121,461 words) and600 English texts(111,871 words). This corpus was fed into Notebook LM, and its functions were used to summarize, explain, and retrieve key themes such as historical significance and production methods. The power of prompting within Notebook LM is also demonstrated, suggesting that GenAItools are more suitable for qualitative than quantitative analysis in this context.Comparing writing conventions in both languages revealed distinct differences: English descriptions tend to be more concise and informative, while Spanishtexts use more subjective, evocative language, often incorporating cultural context and a more enthusiastic tone. These findings can assist in second-language writing and translation trainingby pinpointing the appropriate stylistic characteristics ofpromotional textsin English and Spanish. In conclusion,Notebook LM provides complementary affordances which, when combined with other corpus-analysis applications, constitute a powerful tool for leveraging genre-based corpora.