Publicaciones

A continuación se presentan algunas publicaciones clave que sustentan teóricamente y experimentalmente el proyecto LightVED.

Congresos y Workshops

Alejandro H. Toselli, Álvaro Cuéllar, Sònia Boadas, Enrique Vidal, Joan Andreu Sánchez
Writer Identification using Simplified Handwritten Text Recognition Models
IbPRIA, 2025.
🔗 DOI
Luis-Jesus Marhuenda, Miquel Obrador-Reina, Mohamed Aas-Alas, Alberto Albiol, Roberto Paredes
Unveiling Differences: A Vision Encoder-Decoder Model for Difference Medical Visual Question Answering
Medical Imaging in Deep Learning, 2025.
🔗 Website

Miguel Zaragozá-Portolés, David Gimeno-Gómez, Carlos-D. Martínez-Hinarejos
Extending LIP-RTVE: Towards A Large-Scale Audio-Visual Dataset for Continuous Spanish in the Wild
IberSPEECH, 2024.
🔗 DOI
David Gimeno-Gómez, Carlos-D. Martínez-Hinarejos
Towards Parameter-Efficient Non-Autoregressive Spanish Audio-Visual Speech Recognition
IberSPEECH, 2024.
🔗 DOI
David Gimeno-Gómez, Carlos-D. Martínez-Hinarejos
The PRHLT Speech Recognition System for the Albayzín 2024 Bilingual Basque-Spanish Speech to Text Challenge
IberSPEECH, 2024.
🔗 DOI

David Gimeno-Gómez, Carlos-D. Martínez-Hinarejos
Tailored design of Audio–Visual Speech Recognition models using Branchformers
Computer Speech & Language, 2025.
🔗 DOI