- -
UPV
 

Reconocimiento de textos

La UPV desarrolla un sistema que permite la transcripción del 85% de los archivos medievales de la Corona de Francia, desconocidos hasta la fecha

[ 12/09/2017 ]

Un equipo de investigadores de la Universitat Politècnica de València (UPV), perteneciente al Centro Tecnológico de Reconocimiento de Patrones y Lenguaje Humano (PRHLT, por sus siglas en inglés), ha desarrollado un sistema con innovadores métodos probabilísticos de indexación y búsqueda de información textual en imágenes de texto manuscrito que han aplicado a la colección de registros del Trèsor des Chartes, el Tesoro de las Cartas, antiguos archivos de la Corona de Francia, denominados también Chancery.


El desarrollo de este sistema y el logro de indexar la colección Chancery con él es el principal resultado de la estrecha colaboración que, durante dos años, ha tenido lugar entre tres de los participantes del proyecto multidisciplinar HIMANIS: el Instituto de Investigación e Historia de los Textos (IRHT, por Institut de Recherche et d'Histoire des Textes), la empresa francesa de procesado de imágenes texto A2iA y el equipo de procesado de texto manuscrito del centro PRHLT de la UPV.


La fuente más valiosa para conocer los orígenes de Francia y, por extensión, de Europa


Chancery es, posiblemente, la fuente conocida más valiosa para desvelar y entender la historia temprana de Francia y los países relacionados con ella, raíz en conjunto por lo tanto de la Europa actual.


La colección contiene más de 70.000 páginas de registros de actos de la cancillería real francesa durante los siglos XIII y XIV. Las hojas son de gran tamaño y están densamente manuscritas en latín y francés medieval, con más de un tercio de las 50 millones de palabras escritas en ellas fuertemente abreviadas. Por estas razones, entre otras, únicamente unos pocos eruditos especializados en este tipo de manuscritos son capaces de leerlos y entenderlos con fiabilidad.


Apenas un 0,007% de Chancery ha sido transcrito


Hasta la fecha, tan solo alrededor de 500 páginas de esta colección han sido transcritas manualmente, gracias a un considerable esfuerzo de estos especialistas. "Así pues", apunta Enrique Vidal, investigador principal de HIMANIS por parte del Centro PRHLT-UPV, "gran parte de la historia temprana vigente de Francia y Europa está, hasta cierto punto, basada en esta pequeñísima muestra de Chancery".


Ahora, gracias el sistema de indexación y búsqueda desarrollado en HIMANIS, los historiadores pueden buscar de forma fácil y eficaz la información relevante para sus estudios en la totalidad de las 60.000 páginas indexadas de esta icónica colección (quedar 10.000 por transcribir).


"Algunos historiadores especulan que, con la información que se va a poder obtener mediante el buscador de texto manuscrito de HIMANIS, algunos capítulos de la historia de Europa podrían necesitar una revisión. La tecnología de indexación y búsqueda probabilística es original y exclusiva del PRHLT. Gracias, en buena parte, a su gran eficacia, ha sido posible el importante logro conseguido en este proyecto, que sitúa al PRHLT en una clara posición de vanguardia con respecto a las capacidades actuales de otros grupos de investigación o empresas especializadas en estos temas de todo el mundo", concluye Vidal.


Contactos para iniciar proyectos similares con colecciones de referencia de la historia de España


Los investigadores de la UPV se encuentran actualmente en contacto con otros equipos españoles de investigación en humanidades, con el objeto de plantear proyectos de indexación similares a Chancery con manuscritos vinculados a la historia de España. En concreto, se están preparando propuestas para indexar determinadas colecciones de referencia como algunas partes del Archivo de Indias y del de Simancas, entre otros.


Invitado a formar parte de 'Time Machine'


Por otra parte, cabe señalar también que el centro PRHLT ha sido invitado para formar parte de Time Machine, una ambiciosa propuesta de proyecto FET Flagship que involucra a más de 80 instituciones europeas.


El objetivo del mismo, a largo plazo, es procesar toda la información histórica existente en archivos, bibliotecas y museos europeos, con el fin de desarrollar un innovador sistema que permita a los eruditos y público en general viajar en el tiempo a través de la historia de Europa.


Más información

Noticias destacadas


Cancerless Cancerless
Un equipo de la UPV participa en un proyecto europeo para prevenir el cáncer y contribuir a su diagnóstico precoz en personas sin hogar
Carreteras más seguras Carreteras más seguras
Investigadores de la UPV y Metalesa desarrollan nuevas infraestructuras inteligentes para mejorar la seguridad vial
Reintroducción del gallipato Reintroducción del gallipato
El proyecto LIFE Renaturwat celebra el Día Mundial del Agua con una iniciativa que mejora la biodiversidad y la conservación de los humedales artificiales
Premi de la Ribera Premi de la Ribera
El doctor por la UPV Joan Borràs, premiado por el Ayuntamiento de Algemesí por un trabajo enmarcado en su tesis doctoral
Proyecto europeo LIVESEEDING Proyecto europeo LIVESEEDING
La UPV trabaja en nuevas semillas ecológicas de pimiento blanco, zanahoria morada y coliflor adaptadas al cambio climático
La gran aportación de la Universidad Pública La gran aportación de la Universidad Pública
Las universidades públicas valencianas generan casi 50.000 puestos de trabajo y elevan el salario medio de la Comunitat un 11%



EMAS upv