Solución de inteligencia artificial que, tomando como origen el audio de los vídeos grabados durante las vistas y declaraciones, permite la generación automática del texto
Esta herramienta facilita el trabajo de jueces y magistrados para realizar el análisis de las vistas celebradas, con la posibilidad de realizar búsquedas y localizar un extracto específico de una grabación, consulta de los intervinientes en los diálogos; descarga de documentos con los textos de la grabación, generar etiquetas

Antecedentes

Antecedentes

Uno de los programas más ambiciosos que ha emprendido la SGNTJ es la incorporación de tecnologías disruptivas de inteligencia artificial y machine learning a las soluciones tecnológicas de la Justicia. La finalidad es potenciar el desarrollo de nuevas capacidades para el procesamiento, almacenamiento y análisis de la información digital, que se incrementa a un ritmo creciente, de manera que permita ser explotada y presentada de un modo eficiente para ofrecer nuevos servicios al conjunto de la Administración de Justicia y ciudadanía.
Con este propósito se ha creado el Centro de Innovación encargado de analizar y desarrollar iniciativas basadas en tecnologías disruptivas que son susceptibles de aplicación en el ámbito de la Justicia.
Entre las iniciativas impulsadas desde el Centro de Innovación, se halla la implementación de las herramientas informáticas necesarias, que permiten el manejo de los archivos audiovisuales de un modo más eficiente. Cabe destacar, que entre ellos se encuentran las actas de las vistas judiciales, las cuales se realizan mediante grabaciones de vídeo en las salas de vistas, quedando asociadas a los expedientes judiciales.
La evolución en técnicas de procesamiento de lenguaje natural y de su aplicación práctica mediante costes razonables, ha permitido emprender el análisis del procesamiento de determinadas fuentes de información “no estructurada”, como las grabaciones de vistas, de modo que pueda aportar valor para realizar búsquedas, interrelación de información, indexación, volcados a elementos estructurados, etc.
A día de hoy, para la extracción de la información contenida en la grabación de una vista, se precisa el visionado completo o parcial por parte de los jueces y magistrados, sin más ayuda que desplazarse de manera manual por la reproducción y dedicar un tiempo costoso en esta tarea.
En este contexto, nace la iniciativa Textualización de Vistas, como una solución de inteligencia artificial que, tomando como origen el audio de los vídeos grabados durante las vistas y las declaraciones, permite la generación automática del texto. Con esta solución se responde a la necesidad de manejar los archivos audiovisuales de un modo más eficiente.
La puesta en marcha de este sistema en el ámbito de la Justicia supone un hito de gran importancia, ya que es la primera vez que se aplican tecnologías disruptivas como instrumento de apoyo a la actividad judicial.

Retos

Retos

El objetivo de esta herramienta es agilizar el trabajo de los jueces y magistrados en la revisión de las grabaciones de las vistas y declaraciones, evitando que tengan que realizar el recorrido del vídeo sin más apoyo que la memoria de haber asistido de un modo personal.

Fases

Fases

La Textualización de Vistas permite, de manera diferida, procesar los vídeos grabados en las vistas y declaraciones judiciales para extraer en formato de texto la información que se alberga en ellos. Esta información se anexa al vídeo original, sin modificarlo en ningún momento, permitiendo la búsqueda y navegación a través del vídeo seleccionado. Como características más innovadoras, cabe destacar la posibilidad de realizar búsquedas de texto libre sobre el contenido de la grabación, la clasificación por intervinientes de los tramos de vídeo, el registro de la textualización de la vista en un documento de texto editable y generar etiquetas asociadas a momentos concretos de la grabación.
Para llevar a cabo la elección del sistema más idóneo se evaluaron diferentes soluciones tecnológicas de textualización de vídeos mediante sistemas de Inteligencia Artificial (IA).
Realizado un primer análisis, se consideraron tres soluciones para realizar las pruebas que permitieran seleccionar la tecnología más adecuada a las necesidades demandadas en el ámbito de la Justicia. En concreto se valoró la precisión (cálculo mediante un algoritmo que alinea las palabras y compara su coincidencia), tiempo de ejecución (cálculo según tiempos de logs y fechas de los ficheros de subtítulos), estabilidad, identificación y detección de hablantes e integración con otras aplicaciones del Ministerio de Justicia.
Teniendo en cuenta los aspectos anteriores, se seleccionó la opción que por fiabilidad, implicación y pruebas realizadas obtuvo los mejores resultados. Esta solución basada en un sistema de red neuronal y procesamiento fonético propio, se encuentra en fase de piloto en una de las sedes del territorio gestionado por el Ministerio de Justicia, y se ha integrado con la herramienta de visionado de expedientes judiciales electrónicos Horus.
Actualmente se está preparando el despliegue generalizado al resto de sedes judiciales del territorio gestionado por el Ministerio de Justicia.
La ejecución de este proyecto se lidera por el Centro de Innovación de la SGNTJ apoyado por resto de áreas como el Centro de Productos Procesales, Centro de Desarrollo, Centro de Producción, Arquitectura Corporativa, Oficina de Gestión del servicio, Oficina de Seguridad, calidad etc.

Nuevos Servicios

Nuevos Servicios

Si bien la Textualización de Vistas se encuentra en fase piloto, ya se ha podido comprobar que aporta importantes beneficios que mejorarán con su uso:
• Mejora en la productividad: supone un ahorro estimado del 60% del tiempo que los usuarios tardan en localizar un extracto específico de una grabación y realizar el análisis de las vistas celebradas.
• Eficiencia: facilita a los jueces y magistrados el entendimiento jurídico del procedimiento global, mejorando, por ende, el hallazgo de resoluciones jurídicamente motivadas en un menor tiempo.
• Fiabilidad: este sistema presenta un nivel de acierto superior al 80% en la textualización de las grabaciones. No obstante, se espera que a medida que se vaya avanzando en la extensión del sistema al resto de órganos judiciales irá almacenando más datos y podrá aprender automáticamente, lo cual supondrá un aumento progresivo de la fiabilidad.
• La integración con la herramienta Visor Horus permite que el conjunto formado por la grabación, las marcas introducidas por el personal del órgano judicial y el fichero de subtítulos, esté disponible cuando los usuarios accedan a los expedientes judiciales electrónicos a través del Visor Horus, incluyendo las funcionalidades de búsquedas y otras auxiliares para copiar y pegar el texto procesado del contenido de la grabación.
• La capacidad de aprendizaje automático que se alimenta de los datos que se van incorporando a medida que se utiliza el sistema, permitirá la ampliación y mejora de prestaciones de esta herramienta.
El alcance de esta solución incluye todos los órdenes jurisdiccionales y todas las instancias del ámbito territorial en los que es competente el Ministerio de Justicia, incluyendo las Fiscalías, lo que supone más de 11.200 usuarios beneficiados por la aplicación. Además, las comunidades autónomas con competencias transferidas en materia de justicia, en el ámbito del Comité Técnico Estatal de la Administración Judicial Electrónica (CTEAJE) ya han mostrado su interés en incorporar esta herramienta a sus sistemas de grabación.

Conclusiones

Conclusiones

La Textualización de Vistas permite, de manera diferida, procesar los vídeos grabados en las vistas y declaraciones judiciales para extraer en formato de texto la información que se alberga en ellos. Esta información se anexa al vídeo original, sin modificarlo en ningún momento, permitiendo la búsqueda y navegación a través del vídeo seleccionado. Como características más innovadoras, cabe destacar la posibilidad de realizar búsquedas de texto libre sobre el contenido de la grabación, la clasificación por intervinientes de los tramos de vídeo, el registro de la textualización de la vista en un documento de texto editable y generar etiquetas asociadas a momentos concretos de la grabación.
Para llevar a cabo la elección del sistema más idóneo se evaluaron diferentes soluciones tecnológicas de textualización de vídeos mediante sistemas de Inteligencia Artificial (IA).
Realizado un primer análisis, se consideraron tres soluciones para realizar las pruebas que permitieran seleccionar la tecnología más adecuada a las necesidades demandadas en el ámbito de la Justicia. En concreto se valoró la precisión (cálculo mediante un algoritmo que alinea las palabras y compara su coincidencia), tiempo de ejecución (cálculo según tiempos de logs y fechas de los ficheros de subtítulos), estabilidad, identificación y detección de hablantes e integración con otras aplicaciones del Ministerio de Justicia.
Teniendo en cuenta los aspectos anteriores, se seleccionó la opción que por fiabilidad, implicación y pruebas realizadas obtuvo los mejores resultados. Esta solución basada en un sistema de red neuronal y procesamiento fonético propio, se encuentra en fase de piloto en una de las sedes del territorio gestionado por el Ministerio de Justicia, y se ha integrado con la herramienta de visionado de expedientes judiciales electrónicos Horus.
Actualmente se está preparando el despliegue generalizado al resto de sedes judiciales del territorio gestionado por el Ministerio de Justicia.
La ejecución de este proyecto se lidera por el Centro de Innovación de la SGNTJ apoyado por resto de áreas como el Centro de Productos Procesales, Centro de Desarrollo, Centro de Producción, Arquitectura Corporativa, Oficina de Gestión del servicio, Oficina de Seguridad, calidad etc.

Implantado en:

Subdirección General de Nuevas Tecnologías de la Justicia (MINISTERIO DE JUSTICIA)

Periodo de ejecución:

02/04/2019 - 30/06/2020

Otros socios tecnológicos:

Indra