Miguel Á. Álvarez Carmona, Ángel Díaz Pacheco, Ramón Aranda, Ansel Y. Rodríguez González, Lázaro Bustio Martínez, Vitali Herrera Semenets
La tarea del REST-MEX 2025, organizada en IberLEF, representa la cuarta edición de un esfuerzo continuo por establecer referencias comparativas de sistemas de procesamiento de lenguaje natural en el ámbito del turismo en México. La tarea se centra en la clasificación automática de reseñas generadas por usuarios en tres ejes: polaridad (de 1 a 5), tipo de servicio (hotel, restaurante o atractivo), y la identificación de uno de los 40 Pueblos Mágicos predefinidos. Este año, el reto atrajo un número récord de envíos e incrementó su complejidad al ampliar el conjunto de datos y promover la investigación en estrategias avanzadas de ajuste fino, ingeniería de prompts y métodos centrados en los datos. En total, 32 equipos realizaron 70 envíos válidos, explorando una amplia variedad de enfoques que incluyen modelos basados en Transformers, aprendizaje por transferencia a partir de ediciones anteriores de REST-MEX, esquemas de binarización de clases y estrategias de selección de instancias basadas en representaciones contextuales. Este artículo presenta una visión general de la tarea, las características del conjunto de datos, el protocolo de evaluación y un análisis comparativo de los resultados.
The REST-MEX 2025 shared task, hosted at IberLEF, represents the fourth edition of an ongoing effort to benchmark natural language processing systems in the domain of Mexican tourism. The task focuses on the automatic classification of user-generated reviews into three axes: polarity (from 1 to 5), type of service (hotel, restaurant, or attraction), and the identification of one of 40 predefined Pueblos Mágicos (Magical Towns). This year, the challenge attracted a record number of submissions and introduced greater complexity by expanding the dataset and encouraging research into advanced fine-tuning strategies, prompt engineering, and data-centric methods. A total of 32 teams submitted 70 valid runs, exploring a diverse range of methods including Transformer-based models, transfer learning from previous REST-MEX editions, class binarization schemes, and instance selection strategies based on contextual embeddings. This paper presents an overview of the task, the dataset characteristics, the evaluation protocol, and a comparative analysis of the results.