- -
UPV
 

Ganadores del Reto IberSpeech-RTVE

El grupo VRAIN-MLLP de la UPV se consolida como líder en subtitulado automático en directo para televisión

[ 04/06/2021 ]

El grupo de investigación MLLP (Machine Learning and Language Processing), perteneciente al Instituto VRAIN (Instituto Valenciano de Investigación en Inteligencia Artificial) de la UPV, ha obtenido el primer puesto en el Reto IberSpeech-RTVE 2020 de subtitulado automático para televisión, y ha repetido así su victoria de 2018. Esto consolida la tecnología UPV-VRAIN-MLLP como la mejor de España, y entre las mejores del mundo, para el subtitulado automático en directo de contenidos televisivos.

En esta edición, el reto ha consistido en un conjunto de pruebas ciegas compuesto por 56 horas de discurso transcrito de 16 programas de televisión en español de diferentes características. El sistema primario de MLLP ha conseguido el primer puesto al reducir la tasa de error de palabra (WER) al 16%. El MLLP ha sido el único grupo que ha participado con su propio kit de reconocimiento del habla en reproducción en directo (streaming) de última generación no basado en Kaldi, el TLK transLectures de la UPV.

Javier Jorge Cano, investigador del MLLP ha explicado que “esta competición ha supuesto una gran oportunidad para evaluar nuestros sistemas bajo condiciones de uso reales, lejos de los típicos conjuntos de datos académicos.” Y ha añadido que “a pesar de que ya obtuvimos los mejores resultados en 2018, esta edición planteaba un reto mayor, con mucha más diversidad y complejidad que el anterior; por lo tanto, estamos muy contentos con los resultados obtenidos con nuestro sistema de reconocimiento de voz”.

“Puede parecer ciencia ficción, pero en realidad, no estamos tanto lejos de conseguirlo”

“En nuestro grupo llevamos cerca de 10 años investigando y desarrollando esta tecnología propia de reconocimiento del habla, siempre con una máxima: transferirla al mundo real para satisfacer necesidades reales y aportar valor a nuestra sociedad”, explica Joan Albert Silvestre Cerdà, investigador del MLLP del VRAIN.

Desde el año 2014 utilizan el subtitulado automático en valenciano, castellano e inglés para el repositorio de videos docentes UPVmedia, que incluye los videos poliMedia y poliTube, con una calidad de transcripción excelente, sin requerir ninguna intervención humana. En 2019 pusieron en marcha, juntamente con el ASIC, el servicio poliSubs, para la subtitulación automática en tiempo real de ponencias, congresos y conferencias en la UPV.

“Tenemos intención de dar un impulso a este servicio, y extenderlo hacia la subtitulación multilingüe y en directo de las clases impartidas por nuestro profesorado en las salas de videoapuntes, un caso de estudio que estamos trabajando muy intensamente en el proyecto de investigación nacional Multisub del Ministerio de Ciencia”, añade Joan Albert.

Por otro lado, conviene destacar que esta tecnología continuará aplicándose y desarrollándose en el marco de dos proyectos de investigación europeos en los que participan: EXPERT (Erasmus+) y TAILOR (H2020).

Su objetivo final es orquestar las tres tecnologías (reconocimiento del habla, traducción automática y síntesis de voz) para conseguir el doblaje automático integral de recursos audiovisuales con clonación de voz. Esto permitiría, por ejemplo, doblar al polaco la voz de un profesor valenciano hablante a un video poliMedia, no con una voz polaca genérica, sino con su propia voz, todo de manera automática. “Puede parecer ciencia ficción, pero en realidad, no estamos tanto lejos de conseguirlo”, apunta Joan Albert Silvestre.

Transferencia a instituciones y empresas

La tecnología desarrollada por el MLLP ha sido además transferida a diferentes instituciones públicas y privadas internacionales, entre las que destacan el Centro de Traducción de la Comisión Europea, las universidades de Potsdam (Alemania), la de Lisboa, la Abierta de Holanda y la Carlos III de Madrid, la multinacional americana AppTek Inc. y la empresa valenciana Tyris Software SL.

Recientemente, han iniciado un proyecto conjunto con la radiotelevisión valenciana, À Punt, para aplicar e integrar esta tecnología en sus emisiones televisivas, tanto en directo como en diferido.

Noticias destacadas


Listas de espera Listas de espera
Todos los viernes se asignarán plazas vacantes en las titulaciones de grado, doble grado y PARS de la UPV
Ayudas comedor Ayudas comedor
Abierto, hasta el próximo 5 de septiembre (inclusive), el plazo de solicitudes de ayudas para cubrir el menú del día durante el curso 2025-2026
¿Buscas alojamiento cerca de la UPV? ¿Buscas alojamiento cerca de la UPV?
Si estudias en la Universitat Politècnica de València y necesitas una vivienda, te ayudamos en la búsqueda
Aún quedan plazas Aún quedan plazas
Del 31 de julio al 8 de agosto de 2025 y del 25 de agosto al 5 de septiembre, preinscríbete en un máster universitario
Movilidad sostenible Movilidad sostenible
¿Vienes cada día a la Universitat Politècnica de València? Mira cuántas opciones de transporte tienes a tu disposición
Monument 4 Movement, WaTech, Biosoil y Sabores Irresistibles Monument 4 Movement, WaTech, Biosoil y Sabores Irresistibles
Los 4 ganadores de MuéveteXValència, el certamen de la Fundación Princesa de Girona para iniciativas de reconstrucción postDANA, tienen sello UPV



EMAS upv