- -
UPV
 

Reconocimiento de textos

La UPV desarrolla un sistema que permite la transcripción del 85% de los archivos medievales de la Corona de Francia, desconocidos hasta la fecha

[ 12/09/2017 ]

Un equipo de investigadores de la Universitat Politècnica de València (UPV), perteneciente al Centro Tecnológico de Reconocimiento de Patrones y Lenguaje Humano (PRHLT, por sus siglas en inglés), ha desarrollado un sistema con innovadores métodos probabilísticos de indexación y búsqueda de información textual en imágenes de texto manuscrito que han aplicado a la colección de registros del Trèsor des Chartes, el Tesoro de las Cartas, antiguos archivos de la Corona de Francia, denominados también Chancery.


El desarrollo de este sistema y el logro de indexar la colección Chancery con él es el principal resultado de la estrecha colaboración que, durante dos años, ha tenido lugar entre tres de los participantes del proyecto multidisciplinar HIMANIS: el Instituto de Investigación e Historia de los Textos (IRHT, por Institut de Recherche et d'Histoire des Textes), la empresa francesa de procesado de imágenes texto A2iA y el equipo de procesado de texto manuscrito del centro PRHLT de la UPV.


La fuente más valiosa para conocer los orígenes de Francia y, por extensión, de Europa


Chancery es, posiblemente, la fuente conocida más valiosa para desvelar y entender la historia temprana de Francia y los países relacionados con ella, raíz en conjunto por lo tanto de la Europa actual.


La colección contiene más de 70.000 páginas de registros de actos de la cancillería real francesa durante los siglos XIII y XIV. Las hojas son de gran tamaño y están densamente manuscritas en latín y francés medieval, con más de un tercio de las 50 millones de palabras escritas en ellas fuertemente abreviadas. Por estas razones, entre otras, únicamente unos pocos eruditos especializados en este tipo de manuscritos son capaces de leerlos y entenderlos con fiabilidad.


Apenas un 0,007% de Chancery ha sido transcrito


Hasta la fecha, tan solo alrededor de 500 páginas de esta colección han sido transcritas manualmente, gracias a un considerable esfuerzo de estos especialistas. "Así pues", apunta Enrique Vidal, investigador principal de HIMANIS por parte del Centro PRHLT-UPV, "gran parte de la historia temprana vigente de Francia y Europa está, hasta cierto punto, basada en esta pequeñísima muestra de Chancery".


Ahora, gracias el sistema de indexación y búsqueda desarrollado en HIMANIS, los historiadores pueden buscar de forma fácil y eficaz la información relevante para sus estudios en la totalidad de las 60.000 páginas indexadas de esta icónica colección (quedar 10.000 por transcribir).


"Algunos historiadores especulan que, con la información que se va a poder obtener mediante el buscador de texto manuscrito de HIMANIS, algunos capítulos de la historia de Europa podrían necesitar una revisión. La tecnología de indexación y búsqueda probabilística es original y exclusiva del PRHLT. Gracias, en buena parte, a su gran eficacia, ha sido posible el importante logro conseguido en este proyecto, que sitúa al PRHLT en una clara posición de vanguardia con respecto a las capacidades actuales de otros grupos de investigación o empresas especializadas en estos temas de todo el mundo", concluye Vidal.


Contactos para iniciar proyectos similares con colecciones de referencia de la historia de España


Los investigadores de la UPV se encuentran actualmente en contacto con otros equipos españoles de investigación en humanidades, con el objeto de plantear proyectos de indexación similares a Chancery con manuscritos vinculados a la historia de España. En concreto, se están preparando propuestas para indexar determinadas colecciones de referencia como algunas partes del Archivo de Indias y del de Simancas, entre otros.


Invitado a formar parte de 'Time Machine'


Por otra parte, cabe señalar también que el centro PRHLT ha sido invitado para formar parte de Time Machine, una ambiciosa propuesta de proyecto FET Flagship que involucra a más de 80 instituciones europeas.


El objetivo del mismo, a largo plazo, es procesar toda la información histórica existente en archivos, bibliotecas y museos europeos, con el fin de desarrollar un innovador sistema que permita a los eruditos y público en general viajar en el tiempo a través de la historia de Europa.


Más información

Noticias destacadas


Ingeniería Aeroespacial, nota de acceso más alta Ingeniería Aeroespacial, nota de acceso más alta
El 98,1% de las plazas ofertadas por la Universitat Politècnica de València para el curso 2017-2018, adjudicadas
Modelización del comportamiento Modelización del comportamiento
La población con alto riesgo de suicidio en España se multiplicará por 8 en un lustro
Generación Espontánea en UPV TV Generación Espontánea en UPV TV
Jorge (Euroavia Valencia): "No estás en clase viendo cómo se encaja un tornillo, bajas al taller y lo encajas"
Experimenta 2017 Experimenta 2017
La Escola d'Estiu UPV acerca la ciencia a los más pequeños
Proyecto Cobiophad Proyecto Cobiophad
Investigadores de la UPV desarrollan un nuevo sistema eficiente, rápido, sencillo y económico de detección de alergias
Desafío Aporta 2017 Desafío Aporta 2017
Los proyectos de la UPV Sofcivics y LicitaLio, entre los seleccionados por Red.es
QS Top 50 Under 50 QS Top 50 Under 50
La Universitat Politècnica de València, entre las mejores universidades del mundo con menos de 50 años de vida
Entre los más eminentes Entre los más eminentes
La Academia de las Ciencias celebra el solemne acto de recepción de Avelino Corma como asociado



EMAS upv