La IA retorna la veu a una persona malalta d’ELA

El projecte ha sigut presentat al Campus d’Alcoi de la UPV en la II Jornada de l’Institut Valencià d’Investigació en Intel·ligència Artificial (VRAIN) 

Jordi Linares, director del grup VertexLit, és investigador adscrit al Campus d’Alcoi

Quan la veu s’apaga, el silenci pesa. En ell s’amaguen emocions, records i matisos que formen part de cada persona. Aquest silenci el coneix bé Fran Vivó, veí de Benaguasil i afectat per Esclerosi Lateral Amiotròfica (ELA), una malaltia que, sense avisar, li va arrabassar la capacitat de parlar amb la seua pròpia veu . Avui, gràcies a la intel·ligència artificial, l’ha recuperada.

El grup d’investigació VertexLit, dirigit per Jordi Linares, ha presentat un projecte que exemplifica el poder transformador de la intel·ligència artificial aplicada al benestar de les persones. Aquest projecte que va arribar a ValgrAI de la mà del documentalista Alex Badia, i a través de la investigadora Gemma Piñero de l’institut iTEAM de la UPV.

L’investigador que es va postular per a treballar en la recuperació de la veu de Fran va ser el membre de la Unitat Mixta d’Investigació de Valencian Graduate School and Research Network of Artificial Inteligence (ValgrAI) i de l’Institut Universitari Valencià d’Investigació en Intel·ligència Artificial (VRAIN) de la Universitat Politècnica de València (UPV), Jordi Linares.

Missatges d’àudio

L’equip va afrontar un gran repte: reconstruir la veu de Fran amb tot just 20 minutos d’àudio en castellà i valencià, la seua llengua natal. Amb xarxes neuronals entrenades per a treballar amb corpus limitats —especialment en valencià, on a penes existeixen recursos— els investigadors van analitzar la seua dinàmica vocal, van incorporar modulacions emocionals i van crear un model adaptatiu. Tot amb l’objectiu d’oferir un llenguatge ple de trets humans i amb les tonalitats pròpies de la zona de Benaguasil, en lloc d’una veu robòtica.

L’àudio amb el qual comptava l’equip per a treballar eren missatges de veu extrets de whatsapp, però es tractava de material escàs, ja que quan Fran va perdre la capacitat de la parla a penes començava a usar-se el sistema d’àudios en aquesta app de missatgeria.

El projecte desenvolupat per a Fran Vivó transcendeix el tecnològic: la recreació fidel de la veu d’una persona, utilitzant un sistema de clonació basat en IA que ha aconseguit recuperar el seu timbre, la seua prosòdia, la seua identitat. I, en definitiva, la seua manera única de dir les coses, substituint d’aquesta manera la veu robòtica d’una aplicació de comunicació controlada pels ulls, per la seua pròpia veu.

En aquest procés, la família ha jugat un paper fonamental perquè ha ajudat en el procés de construcció de la parla i ha possibilitat ajustar la càrrega emocional, l’entonació o la intenció del missatge mitjançant un editor que respecta la identitat sonora de Fran. A més, l’eina és editable pel que ells poden generar el text, atès que entenen el que ell vol dir. La tecnologia només posa la veu: l’emoció continua sent seua.

DSC_6407

Vida més digna

Aquest projecte no sols li ha permès a Fran recuperar la seua identitat sinó que obri un ventall de possibilitats als malalts d’ELA, ajudant-los a recuperar qui són i tenir esperança en la vida, com el mateix Fran reconeix.

El grup VertexLit, que ha realitzat aquest projecte de manera totalment altruista, pretén mostrar el potencial humanitzador de la IA, ja que aquesta pot retornar capacitats perdudes i dignificar la vida de persones que viuen situacions extremes. Aquest projecte no cerca sobreeixir per la seua complexitat tècnica, sinó pel seu impacte humà.

Així mateix, Jordi Linares, director del grup VertexLit afirma que amb el projecte cerquen donar visibilitat a les persones afectades per ELA, ja que l’ELA continua sent una malaltia invisible en la conversa social i mediàtica, malgrat el sofriment immens que provoca en pacients i famílies, de manera que “aquesta veu no sols és per a Fran. És per a tots ells“, assegura.

Tal com explica el director de VRAIN i director general de ValgrAI de la UPV, Vicent Botti, qui ha inaugruado la jornada donse s’ha presentat aquest dearrollo, “no es trada d’un experiment ni una demostració. És una promesa ètica: la ciència i la tecnologia han de posar-se al servei dels qui més suport necessiten, i de la mateixa manera que Fran ha tornat a parlar, milers de veus també ho podran fer”.

Presentació a Alcoi

La presentació d’aquest projecte pioner del grup d’investigació VertexLit ha tingut lloc en el marc de la II Jornada de l’Institut Valencià d’Investigació en Intel·ligència Artificial (VRAIN) a l’Escola Politècnica Superior d’Alcoi.

En ella, els investigadors dels diferents grups d’aquest institut han acostat també els avanços en intel·ligència artificial en camps com la subtitulació automàtica, detecció i extracció de ressenyes de la web, detecció automatitzada de microplàstics i seguretat en les interaccions d’entorns virtuals i híbrids.