Anàlisi computacional de textos
La UPV desenvolupa, juntament amb Autoritas Consulting, una eina contra la pederàstia que permet deduir el sexe i l'edat dels usuaris de les xarxes socials
[ 10/11/2015 ]
Un equip d'investigadors del Centre de Recerca Pattern Recognition and Human Language Technology de la Universitat Politècnica de València (PRHLT-UPV) ha desenvolupat, juntament amb l'empresa Autoritas Consulting, una nova eina que permet deduir el sexe i rang d'edat dels autors de comentaris en les xarxes socials.
El treball, els resultats del qual han sigut publicats per la revista Information Processing and Management, és de gran utilitat en operacions de seguretat o detecció de possibles casos de pederàstia i, al seu torn, constitueix una eina molt valuosa per a les empreses de cara a l'enfocament de les seues accions de màrqueting a partir del coneixement de la segmentació del mercat.
La teoria de grafs, element clau
Paolo Rosso, investigador del PRHLT de la UPV, explica que "la informació sobre el sexe i l'edat dels usuaris de les xarxes socials no sempre és accessible ni explícita, i quan ho és, pot ser falsa. L'eina que hem desenvolupat permet desxifrar aquesta informació, aplicant amb aquest fi tècniques d'anàlisi lingüística computacional".
Així, per a inferir la informació desitjada, l'eina desenvolupada des de la UPV i Autoritas Consulting estudia el llenguatge utilitzat pels usuaris de les xarxes, aplicant amb aquesta finalitat la teoria de grafs.
Anàlisi d'expressions i estructura del discurs, temps verbals, emocions i categories gramaticals
Aquesta analitza els temps verbals emprats, les categories gramaticals més repetides, l'estructura del discurs, la tipologia d'expressions utilitzades i el pes de les emocions. A partir d'aquestes dades, és possible saber si darrere d'un text anònim es troba un home o una dona, i el seu rang d'edat.
Francisco Rangel, director tecnològic (CTO) en Autoritas Consulting, detalla el procés: "Partim d'un text, del qual extraiem les categories gramaticals per a construir un graf. Aquest s'enriqueix amb les emocions expressades, la polaritat de les paraules, els tipus de verb i de substantiu, etc. Després, s'aplica la teoria de grafs per a calcular la importància de cada element en l'estructura del discurs. Davant de cada cas nou, utilitzant un algorisme d'aprenentatge, s'extrau el graf i s'obté una predicció".
Utilitzada ja en casos d'investigació policial d'amenaces de bomba
L'eina ja ha sigut utilitzada en casos d'investigació policial d'amenaces de bomba. "En aquests casos, interessa fer un seguiment d'aquests comptes. No sols per veure de què parlen, sinó també per veure quin perfil tenen els autors. El sistema, a més, ajuda també a captar perfils falsos", conclouen els autors del treball.
Notícies destacades
i-Days 2025
ColoSense, guanyador absolut del certamen europeu d'innovació sanitària d'EIT Health amb un sistema de detecció precoç del càncer colorectal
IA i desigualtat laboral
Un estudi en què participa la UPV proposa estratègies per a un ús responsable de la IA generativa que no incremente el risc d'exclusió de l'ocupació
Cooperació internacional
La UPV signa un acord de col·laboració marc de 4 anys de duració amb la Universitat Al-Azhar de Gaza
L'església de Sant Joan del Mercat recupera la seua esplendor
La intervenció pictòrica, escultòrica i ornamental l'ha liderada un equip de l'Institut Universitari de Restauració del Patrimoni, coordinat per la catedràtica Pilar Roig
La universitat espanyola en xifres
La insuficient oferta pública d'allotjament universitari condiciona la igualtat real d'oportunitats entre estudiants segons es desprèn de l'informe de la CRUE
Nanoestreles d'or contra el càncer
Personal investigador de la UPV desenvolupa una innovadora teràpia per al tractament del càncer, més precisa i amb menys efectes secundaris