Avui s'ha constituït formalment l’empresa derivada Transkriptorium, sorgida de la Universitat Politècnica de València. Transkriptorium naix amb l'objectiu d'explotar tecnologia de transcripció i indexació de la informació continguda en imatges digitalitzades de documents manuscrits.
La tecnologia desenvolupada està basada en mètodes estadístics i consisteix a obtenir un mapa de probabilitats d'una imatge determinada. Amb les tècniques d'intel·ligència artificial i aprenentatge automàtic (machine learning), Transkriptorium ha aconseguit accedir als continguts de milers de pàgines antigues manuscrites.
L'equip promotor de l’empresa derivada està format per Joan Andreu Sánchez Peiró i Enrique Vidal, professors del Departament de Sistemes Informàtics i Computació, i membres del Centre Tecnològic de Reconeixement de Patrons i Llenguatge Humà (PRHLT n’és la sigla en anglès).
Igualment, formen part de Transkriptorium Vicente Bosch, tècnic superior també del PRHLT; Alejandro Héctor Toselli, investigador científic associat de la Universitat Northeastern (Boston, els EUA), i Verónica Romero, professora de la Universitat de València. Finalment, el consultor privat Luis Antonio Morró s'incorpora a la iniciativa com a president executiu de l'empresa.
Per a Joan Andreu Sánchez, “la tecnologia desenvolupada supera qualsevol solució actual basada en el treball humà expert sobre el text. El desenvolupament i la comercialització d'aquests processos en diversos àmbits (administratius, culturals, econòmics, legals, etc.) és una clara oportunitat econòmica. No existeixen més de tres o quatre empreses en tot el món que es dediquen comercialment a això”.
Sánchez ha explicat que “són més de 20 anys de treball els que han propiciat la tecnologia que ara es transfereix a aquesta empresa. Són infinitat de casos d'ús, treballant amb institucions tant públiques com privades. Tot això ens ha donat l'experiència necessària”.
D’altra banda, Enrique Vidal ha destacat l'enorme mercat potencial que suposen els arxius i biblioteques de tot el món. “S'especula que, actualment, hi ha més text manuscrit que text automàtic, per tot el que s'ha acumulat al llarg de la història. I tot això està pendent de ser llegit i explorat.”
En aquest sentit, Sánchez ha apuntat al fet que “es compten per quilòmetres la quantitat de documents manuscrits que queden per transcriure i indexar. Per posar-ne un exemple, si la Biblioteca Nacional alineara els documents que atresora, se superarien els 100 km de paper”.
Durant dècades, el personal investigador del PRHLT ha afinat la tecnologia gràcies als projectes europeus concedits al seu equip. Un antecedent és Himanis, que el 2017 va permetre indexar la col·lecció de registres del Trèsor des Chartes, (el tresor de les cartes), antics arxius de la Corona de França, denominats també Chancery. La col·lecció conté més de 70.000 pàgines de registres d'actes de la cancelleria reial francesa dels segles XIII i XIV.
El 2019, va arribar el projecte Carabela, desenvolupat durant els últims dos anys i que ha permès accedir als continguts de més de 130.000 imatges de l'Arxiu General d'Índies i l'Arxiu Històric Provincial de Cadis. Gràcies a aquests projectes, ha eixit a la llum informació que constitueix un tresor arqueològic de primera magnitud, a causa de la gran riquesa històrica i cultural que conté.
Amb aquesta, en són ja 17 les empreses derivades participades per la Universitat Politècnica de València, i set més constituïdes com a empreses no participades. Per a la institució valenciana, les empreses derivades són el mecanisme més complet i eficaç de transferència de tecnologia, ja que conjuminen no sols uns resultats d'investigació explotables, sinó també el talent i la capacitat dels seus creadors.
Notícies destacades