Alberto Manuel Brandâo, José Alves de Castro, José João Almeida
Los recursos multilingües son útiles para los estudios lingüísticos, para la traducción y para muchas otras tareas. Sin embargo, estos recursos son difíciles de obtener y de organizar. En este documento describimos un conjunto de herramientas diseñadas para ayudar en la tarea de extraer recursos bilingües de la Red que sirvan para construir corpora paralelos y memorias de traducción. Nuestro objetivo es construir herramientas que puedan ser compartidas o usadas de manera independiente.
Multilingual resources are useful for linguistic studies, translation, and many other tasks. Unfortunately, these resources are difficult to obtain and organize. In this document we describe a set of tools designed to help in the task of mining bilingual resources from the web, from a specific site, from a file system, from a list of URLs, or from a translation memory. As a design goal we intend to build tools that can be used both cooperatively (in pipeline) and also in a independent way.