Candidatura

Aplicación de IA y Cloud en el análisis de contenidos audiovisuales en el Archivo de RTVE

Los archivos de RTVE están formados por más de 20 millones de documentos entre los que destacan los fondos de Televisión y Radio que representan la memoria audiovisual del último siglo. El objeto del proyecto es la implementación de un sistema de metadatado automático - basado en tecnologías del habla, procesamiento del lenguaje natural y visión artificial - que permita mejorar la accesibilidad y, por tanto, la reutilización de unos fondos de especial relevancia. Este proyecto permitirá a RTVE hacer accesibles más de 11.000 horas de video prácticamente inéditas hasta ahora, muchas de las cuales proceden del fondo de cine producido entre 1965 y 1980. Los datos generados de forma automática permitirán en el futuro inmediato desarrollar nuevos proyectos en el ámbito de la recomendación de contenidos y búsquedas semánticas, abriendo un amplio abanico de posibles colaboraciones con la industria y las organizaciones preservadoras de la memoria.
Antecedentes

Antecedentes

En la última década la digitalización de los procesos productivos de RTVE, unida a la digitalización de los archivos de RNE y TVE, ha permitido el fácil acceso de los usuarios a la totalidad de los fondos, aproximadamente 2.100.000 horas de contenidos, de forma rápida y sencilla, consiguiendo un importantísimo incremento en el uso de los fondos ya sea para la producción de nuevos contenidos, la reemisión, comercialización y difusión a través de la web de RTVE y sus nuevas plataformas bajo demanda.
Este aumento en la demanda del uso del Archivo ha supuesto una sobrecarga de trabajo para las unidades responsables de hacer accesibles y difundir estos contenidos que, en paralelo, no han dejado de sufrir una continua reducción de sus plantillas. Es necesario por tanto actualizar los procesos de trabajo de estas unidades, profundizando en la automatización de los mismos con la implantación de las nuevas herramientas de IA que la tecnología está ofreciendo en el ámbito de la Documentación.

Retos

Retos

- Implantar una herramienta en Cloud que se integre en los actuales procesos de trabajo del Archivo.
- Automatizar el proceso de metadato de los contenidos manteniendo las condiciones de recuperación y reutilización del material de archivo por las distintas áreas de la Corporación RTVE.
- Mejorar la accesibilidad y reutilización de contenidos de valor histórico, cultural, social,... y ponerlos a disposición de la producción de contenidos de RTVE, de las industrias culturales y de la ciudadanía, entre otros actores.
- Convertir al Archivo de RTVE en referente tecnológico en la aplicación de IA a contenidos audiovisuales.
- Influenciar y definir el desarrollo de tecnologías específicas para el sector audiovisual.
- Garantizar la preservación digital de los fondos garantizando su plena recuperación.

Fases

Fases

La duración de este proyecto es de 16 meses. Los 4 primeros se dedican a la configuración, aprendizaje y puesta en marcha y los 12 siguientes al servicio propiamente dicho. Para llevar a cabo este proyecto se ha creado un grupo interdisciplinar de trabajo en el que intervienen distintas áreas de la Corporación, como son el Fondo Documental, la Dirección de Innovación y el Área de Sistemas.

Nuevos Servicios

Nuevos Servicios

Tradicionalmente se considera que el tiempo que un documentalista dedica al análisis de una hora de televisión es de 4 horas de trabajo. Las nuevas tecnologías permiten reducir exponencialmente el tiempo de análisis documental al tiempo que se genera una mayor cantidad de información sobre el contenido analizado. Esto permite imaginar nuevas formas de explotación del Archivo, así como la redefinición y optimización de los flujos de trabajo y de los roles profesionales.

Conclusiones

Conclusiones

Sitúa al Fondo Documental como un área de innovación dentro de RTVE y en el ámbito internacional.
-Permite adquirir experiencia en la aplicación de IA a contenidos audiovisuales.
-Capacita a los profesionales del Archivo para asesorar en proyectos similares dentro y fuera de la Corporación. Aumenta la visibilidad de fondos de especial relevancia.
-Abre nuevas formas de explotación de los fondos.
-Abre la puerta a convenios con distintas entidades culturales para la reutilización de esos materiales.
-Genera metadatos para 11.000 horas de contenido que no pueden analizarse con los recursos actuales.
-Aplicado a la parrilla actual reduce el tiempo dedicado al análisis y permite recursos a otras tareas más creativas.
-Aporta otros puntos de vista para la explotación de los fondos.

Event Sponsor: Premios/Cena Entrega Galardones

Implantado en:

RTVE

Periodo de ejecución:

07/01/2021 - 29/09/2021

Otros socios tecnológicos:

VSN, Etiqmedia