Mejorando el diagnóstico, pronóstico y tratamiento del cáncer en Europa mediante algoritmos multimodales de IA basados en imagen médica
Antecedentes
El proyecto INCISIVE requería una plataforma segura que permitiese un almacenamiento gobernado de sus datos, así como un manejo eficiente de los mismos, durante el período de diseño de la plataforma federada. TIC Salut demandaba una plataforma de IA que garantizara la seguridad de los datos de salud de los distintos centros hospitalarios europeos que participan en el proyecto, así como la posibilidad de entrenar los distintos algoritmos desde los múltiples centros de investigación y empresas tecnológicas del consorcio.
TIC Salud optó por una solución integrada en los centros de procesamiento de datos (CPDs) de la Generalitat de Catalunya, gestionados por T-Systems. La gran volumetría de los datos requería una plataforma flexible y escalable capaz de tratar grandes pesos y subidas simultáneas en poco tiempo.
Además, se necesitaba facilidad en la subida de datos, así como una estructura sencilla de la información histórica, ya que los proveedores de datos eran personal médico.
Retos
El resultado cuando finalice el proyecto INCISIVE será un repositorio de datos federado interoperable de miles de imágenes clínicas de cáncer de mama, pulmón, próstata y colorrectal. El repositorio, gracias a Cloudera Data Platform, permitirá compartir datos sanitarios de forma segura y conforme a la GDPR.
Además, los múltiples algoritmos no sólo actuarán como soporte a la toma de decisiones de los profesionales de la salud, sino que incorporarán herramientas de explicabilidad para que los usuarios de las herramientas entiendan los mecanismos que han llevado a una conclusión determinada.
La explicabilidad del algoritmo busca incrementar la confianza del especialista. Gracias a un modelo con un sistema de explicabilidad, el profesional puede conocer por qué se está dando el diagnóstico y, aunque la decisión final será tomada en base a su propio conocimiento, el hecho de que pueda saber qué variables han influido en este diagnóstico le ayudará a tomar mejor la decisión.
Fases
El proyecto consta de dos fases, una primera finalizada, que ha supuesto la subida a la plataforma de las imágenes históricas de los cánceres analizados. Y una segunda, que incluye el entrenamiento de unos 20 algoritmos dedicados al diagnóstico, pronóstico y tratamiento de los cuatro tipos de cáncer mediante la combinación de distintas modalidades de imagen y datos clínicos. Para ello, se está haciendo uso del Data Science Workbench de Cloudera que está ayudando en la integración de los notebooks a la plataforma para que puedan acceder así a los datos gobernados de manera directa y ágil.
Esta solución está permitiendo acelerar la capacidad para diseñar, escalar e implementar machine learning y análisis avanzados.
Nuevos Servicios
La plataforma ha dado servicio a múltiples perfiles, desde radiólogos y oncólogos, hasta desarrolladores de algoritmos de IA con una gran flexibilidad. Eso ha hecho que no fuera necesario contratar personal técnico especializado debido a la usabilidad de la plataforma. Asimismo, se trata de una plataforma altamente escalable que permite la incorporación de nuevos proveedores de datos al proyecto, así como distintos desarrolladores ubicados en distintos países europeos.
Conclusiones
Gracias a Cloudera Data Platform, CatSalut y la Fundación Social TIC Salut se ha avanzado en el uso de la IA para el diagnóstico del cáncer en un entorno seguro, usable y escalable, absolutamente imprescindible en el ámbito de la salud.