Albayzin 2024 Wake-Up Word Detection Challenge

Tecnología

Inteligencia Artificial Tendencias

En el área de Discovery, de Telefónica Innovación Digital, trabajamos para que la tecnología esté al servicio de las personas y no al revés. Por ello, una de las líneas de trabajo del equipo Digital Life Disruption Lab es humanizar la tecnología, dotarla de la naturalidad, eficiencia y accesibilidad necesarias para que todas las personas independientemente de su edad o condición puedan hacer uso sus beneficios.

Uno de los ejes que vertebran este avance es el lenguaje natural y el control mediante interfaces vocales. Concretamente la detección de palabras de clave, conocidas como “wake-up words” son una parte fundamental en esta cadena de comunicación. Así pues, desde Discovery queremos promocionar las investigaciones que apuesten por el progreso de esta tecnología. En este contexto, hemos organizado un desafío en el marco de las Evaluaciones Albayzin, un evento que se celebra bianualmente y cuyos resultados se presentan en la conferencia IberSpeech.

Las Evaluaciones Albayzin representan una serie de retos que buscan consolidar y avanzar la posición de liderazgo de España en la investigación de la lengua española y las lenguas co-oficiales, como el catalán, el euskera y el gallego. Telefónica ha sido un participante activo en estas evaluaciones, especialmente en el desafío de Reconocimiento Automático del Habla (ASR, por sus siglas en inglés), donde hemos competido en las últimas tres ediciones. En nuestra participación de 2022, obtuvimos la victoria gracias a nuestra colaboración con el equipo de investigación Speech@FIT de la Brno University of Technology.

El desafío que proponemos en esta ocasión busca la mejora de la detección de palabras clave o “wake-up words”. Para la evaluación, Telefónica ha propuesto un conjunto de datos que los participantes podrán utilizar para entrenar sus modelos. Los datos de evaluación se han liberado, permitiendo el rendimiento de cada sistema propuesto. Las fechas clave del reto son las siguientes:

20 de mayo: apertura del registro
3 de junio: liberación de datos de entrenamiento y validación
31 de julio: fecha límite de registro
2 de septiembre: liberación de los datos de evaluación
18 de octubre: fecha límite de entrega de los resultados
31 de octubre: difusión de los resultados a los participantes
12 de noviembre: publicación de los resultados y presentación en IberSpeech.

Si perteneces a un grupo de investigación y estás interesado en participar, abajo tienes toda la información de interés.

Tecnología

Redes y Conectividad Ciberseguridad y Privacidad

Gestión de identidades en base al paradigma de reducción del tiempo de exposición

Esta investigación analiza el actual problema de la manipulación de identidades digitales centrándose en tres pilares fundamentales: la seguridad de la solución, su usabilidad y el coste de su implementación.

26/08/2024

Albayzin 2024 Wake-Up Word Detection Challenge

Explora nuestra siguiente investigación