ArgIA: Plataforma para habilitar y acelerar la adopción de IA en el Sector Público Vasco
Antecedentes
El Gobierno Vasco apuesta por el uso de la Inteligencia Artificial en el sector público, lo que conlleva necesidades de entornos y cómputo especializados para poder consumir modelos de IA o ML existentes (tanto on-premises cómo en cloud), así como adaptar o desarrollar nuevos modelos u otras cargas de supercomputación (HPC) relacionadas con investigación.
Estas necesidades de infraestructura tan especializada y habitualmente compleja y costosa llevan a plantear un sistema horizontal compartido, que permita disponer de patrones reutilizables que no sólo aceleren la implantación y cobertura de nuevos casos de uso para el negocio sino que faciliten una adopción eficiente, sostenible y ordenada al centralizar mecanismos de gobierno y seguridad .
Retos
Los principales objetivos y retos que se quieren conseguir con la plataforma ArgIA son los siguientes:
1-. Dar respuesta a la estrategia de IA del Gobierno Vasco en la que EJIE tiene el papel de gestor tecnológico.
2-. Proporcionar una plataforma que preste recursos especializados de infraestructura y middleware para cargas relacionadas con ML y Modelos de IA para sustentar las aplicaciones que integren estas funcionalidades así como cargas HPC tradicionales.
3-. Proporcionar un hub de modelos de IA que permita consumirlos como servicio.
De esta forma ArgIA se convierte en una pieza constituyente dentro del marco de estrategia y gobierno de IA del Gobierno Vasco.
Fases
Fase 1: Infraestructura on-premises para la ejecución de cargas sobre aceleradores hardware
Implementación de elementos para ejecutar cargas compartidas sobre aceleradores hardware on-premises: Elementos físicos de NVIDIA como sistemas DGX, tarjetas A100, H100 y H200. Software virtual y herramientas como slurm de Schedmd. Facilita el entrenamiento de modelos de IA y en general, la ejecución de cargas de alta computación.
Fase 2: Consumo de infraestructura de aceleración de hardware en cloud.
Para proyectos en los que el consumo de recursos de hardware de aceleración es más eficiente si se realiza en la nube: Duración temporal limitada o estacional y uso intensivo de GPUs. Por ejemplo proyectos de investigación de genómica.
Fase 3: Extensión de la infraestructura hardware y software para servir modelos de IA en formato Hub de Modelos o Model as a Service.
Integración con el entorno IaaS de EJIE y Kubernetes y uso de software especializado como Triton, vLLM y LiteLLM.
Nuevos Servicios
ArgIA sustenta un nuevo servicio dentro del catálogo de Servicios Convergentes que proporciona EJIE a sus clientes para poder desplegar funcionalidades de IA y supercomputación en formato de Hub de Modelo, Modelos como servicio y recursos compartidos.
La optimización de recursos y el uso de recursos compartidos proporciona eficiencia y reduce los costes y la deuda técnica respecto a un enfoque de iniciativas independientes cada una con necesidades duplicadas. Se facilita además la gestión del ciclo de vida de las mismas y sobre todo permite aplicar de forma más efectiva los mecanismos de gobierno, seguridad y cumplimiento requeridos.
Conclusiones
La incorporación de ArgIA en el catálogo de servicios de EJIE permite al Gobierno Vasco y sus entidades acelerar y habilitar para la adopción de la IA, de manera más sostenible y segura. Esto es una palanca clave para la transformación digital posibilitando la mejora en última instancia de los servicios a las personas y la ciudadanía en general.
El enfoque horizontal de compartición de recursos, patrones reutilizables y entrega híbrida permiten además que las soluciones además de seguras sean más eficientes, escalables y optimizadas. Aptas no sólo para pilotos o pruebas sino para aplicaciones productivas y con criticidad.










