- -
UPV
 

Reconeixement de textos

La UPV desenvolupa un sistema que permet la transcripció del 85% dels arxius medievals de la Corona de França, desconeguts fins avui

[ 12/09/2017 ]

Un equip d'investigadors de la Universitat Politècnica de València (UPV), pertanyent al Centre Tecnològic de Reconeixement de Patrons i Llenguatge Humà (PRHLT, per les seues sigles en anglès), ha desenvolupat un sistema amb innovadors mètodes probabilístics d'indexació i cerca d'informació textual en imatges de text manuscrit que han aplicat a la col·lecció de registres del Trèsor des Chartes, el Tresor de les Cartes, antics arxius de la Corona de França, denominats també Chancery.

El desenvolupament d'aquest sistema i l'assoliment d'indexar la col·lecció Chancery amb ell és el principal resultat de l'estreta col·laboració que, durant dos anys, ha tingut lloc entre tres dels participants del projecte multidisciplinari HIMANIS: l'Institut de Recerca i Història dels Textos (IRHT, per Institut de Recherche et d'Histoire dónes Textes), l'empresa francesa de processament d'imatges text A2iA i l'equip de processament de text manuscrit del centre PRHLT de la UPV.

La font més valuosa per a conèixer els orígens de França i, per extensió, d'Europa

Chancery és, possiblement, la font coneguda més valuosa per a desvetlar i entendre la història primerenca de França i els països relacionats amb ella, arrel en conjunt per tant de l'Europa actual.

La col·lecció conté més de 70.000 pàgines de registres d'actes de la cancelleria real francesa durant els segles XIII i XIV. Les fulles són de grans dimensions i estan densament manuscrites en llatí i francès medieval, amb més d'un terç de les 50 milions de paraules escrites en elles fortament abreujades. Per aquestes raons, entre altres, únicament uns pocs erudits especialitzats en aquest tipus de manuscrits són capaços de llegir-los i entendre'ls amb fiabilitat.

Només un 0,007% de Chancery ha sigut transcrit

Fins avui, tan sols al voltant de 500 pàgines d'aquesta col·lecció han sigut transcrites manualment, gràcies a un considerable esforç d'aquests especialistes. "Així doncs", apunta Enrique Vidal, investigador principal d'HIMANIS per part del Centre PRHLT-UPV, "gran part de la història primerenca vigent de França i Europa està, fins a cert punt, basada en aquesta xicotetíssima mostra de Chancery".

Ara, gràcies al sistema d'indexació i cerca desenvolupat en HIMANIS, els historiadors poden cercar de forma fàcil i eficaç la informació rellevant per als seus estudis en la totalitat de les 60.000 pàgines indexades d'aquesta icònica col·lecció (queden 10.000 per transcriure).

"Alguns historiadors especulen que, amb la informació que es va a poder obtenir mitjançant el cercador de text manuscrit d'HIMANIS, alguns capítols de la història d'Europa podrien necessitar una revisió. La tecnologia d'indexació i cerca probabilística és original i exclusiva del PRHLT. Gràcies, en bona part, a la seua gran eficàcia, ha sigut possible l'important assoliment aconseguit en aquest projecte, que situa al PRHLT en una clara posició d'avantguarda pel que fa a les capacitats actuals d'altres grups de recerca o empreses especialitzades en aquests temes de tot el món", conclou Vidal.

Contactes per a iniciar projectes similars amb col·leccions de referència de la història d'Espanya

Els investigadors de la UPV es troben actualment en contacte amb altres equips espanyols de recerca en humanitats, amb l'objecte de plantejar projectes d'indexació similars a Chancery amb manuscrits vinculats a la història d'Espanya. En concret, s'estan preparant propostes per a indexar determinades col·leccions de referència com algunes parts de l'Arxiu d'Índies i del de Simancas, entre uns altres.

Convidat a formar part de 'Time Machine'

D'altra banda, cal assenyalar també que el centre PRHLT ha sigut convidat per a formar part de Time Machine, una ambiciosa proposta del projecte FET Flagship que involucra a més de 80 institucions europees.

L'objectiu de la mateixa, a llarg termini, és processar tota la informació històrica existent en arxius, biblioteques i museus europeus, amb la finalitat de desenvolupar un innovador sistema que permeta als erudits i al públic en general viatjar en el temps a través de la història d'Europa.


Més informació

Notícies destacades


PLD llançarà Arion 1 en 2019 PLD llançarà Arion 1 en 2019
Raúl Torres, ex estudiant UPV, prepara la revolució comercial de la indústria aeroespacial europea
Pulgarcito Pulgarcito
Personal investigador de la UPV crea el primer ninot de la història fet amb palla d'arròs
Vista cansada Vista cansada
La UPV participa en el disseny d'un nou tipus d'implant intracorneal per a corregir la presbícia
Premi Forest R. McFarland Premi Forest R. McFarland
Antonio García, investigador de l'Institut CMT-Motors Tèrmics de la UPV, guardonat per la Societat d'Enginyers d'Automoció
Neuromàrqueting Neuromàrqueting
Un equip d'investigadors de la UPV treballa en la creació de nous productes emocionals
Pablo Marín Pablo Marín
Un estudiant de doctorat UPV, triplement guardonat pel seu TFM: Beca UEECA, Premi 2K17 y Premi FEDNA
Pel seu estudi sobre aïllament acústic Pel seu estudi sobre aïllament acústic
Manuel Jesús Parrilla, doblement titulat per la UPV, guanya el XV Premi Andrés Lara per a Joves Investigadors 2017
Enginyeria de competició Enginyeria de competició
MOTOR-UPV, integrada per alumnes de Generació Espontània, campiona d'Espanya de velocitat en la categoria SSP300



EMAS upv