Barcelona, España
Este trabajo presenta una vía computacional para la detección de la huella caligráfica de un escriba en un conjunto documental amplio. El sistema hace uso de los avances en técnicas de HTR (Handwritten Text Recognition), habitual-mente empleadas para la transcripción automática, pero utilizadas en esta ocasión para localizar las manos de nuestro interés al lidiar con un grupo extenso de textos, en el que pueden existir decenas o cientos de manos diferentes. Llevamos a cabo un experimento de control con Lope de Vega (reconocido dramaturgo español del siglo xvii) y la plataforma Transkribus (de fácil uso para los investigadores no es-pecialistas en informática) con resultados muy acertados: el sistema, una vez en-trenado con la mano de Lope y otras doscientas manos diferentes, es capaz de se-ñalar a Lope en documentos fuera del modelo, con unas tasas de acierto elevadas (exactitud, precisión, recall y puntaje F1 en entorno de 0.95-1.00). Estos resultados abren la puerta a entrenar modelos para manos de relevancia (autores, censores, copistas, burócratas, actores, etc.) y a realizar batidas por los documentos conser-vados con el fin de localizar otros testimonios en los que hayan intervenido, lo que puede conducir a hallazgos de valor histórico, literario y patrimonia
This paper presents a computational approach for detecting the calligraphic footprint of a scribe in a large documentary corpus. The system leverages advances in HTR (Handwritten Text Recognition) techniques, usually employed for automatic transcription, but on this occasion used to locate the specific handwriting of interest when dealing with an extensive collection of texts, in which there may be dozens or even hundreds of different hands. We conducted a control experiment with Lope de Vega (a renowned 17th-century Spanish playwright) and the Transkribus platform (user-friendly for researchers who are not computer specialists), obtaining very accurate results: once trained on Lope’s hand and on two hundred other distinct hands, the system can single out Lope’s handwriting in documents beyond the mod el, with high success rates (accuracy, precision, recall, and F1 scores in the range of 0.95-1.00). These findings pave the way for training models for hands of particular interest (authors, censors, copyists, bureaucrats, actors, etc.) and systematically scanning extant documents in order to detect other instances in which they participated, which could lead to discoveries of historical, literary, and patrimonial significance