En medio de la ola de IA generativa que estamos viviendo, los servicios basados en modelos lingüísticos de gran tamaño (LLM) desarrollados por terceros, como ChatGPT o Bard, se han convertido rápidamente en la gran tendencia del momento. Sin ir más lejos, ya hemos vivido el éxito de ChatGPT, que alcanzó los 100 millones de usuarios en sólo 2 meses desde su lanzamiento.
Los LLM tienen el potencial de acelerar aún más la transformación digital y sólo estamos en los inicios de esta nueva era de IA generativa, pero desde luego no son una solución universal, sobre todo para las empresas que desean adoptar la IA generativa para los casos de uso basados en sus datos. En este sentido, queremos arrojar luz sobre los retos de las compañías ante el uso de esta tecnología y cómo enfrentarlos desde el punto de vista de los datos que alimentan la IA.
En primer lugar, la privacidad de los datos es una preocupación crítica para todas las empresas, ya que se enfrentan a los retos de salvaguardar los datos personales, de los clientes y de la empresa en medio de la rápida evolución de las tecnologías digitales y las innovaciones que se alimentan de esos datos.
Las aplicaciones SaaS de IA generativa, como ChatGPT, son el ejemplo perfecto de los tipos de avances tecnológicos que exponen a las personas y las organizaciones a riesgos de privacidad. Estas aplicaciones de terceros pueden almacenar y procesar información sensible de la empresa, que podría quedar expuesta en caso de brecha de seguridad o acceso no autorizado.
En segundo lugar, la falta de contexto empresarial es otro de los retos de los modelos LLM. GPT-4 o BERT se han entrenado con grandes cantidades de texto disponible en Internet, que abarca una amplia gama de temas. Sin embargo, estos modelos no tienen acceso a las bases de información de las empresas ni a fuentes de datos propias. Como consecuencia, cuando se les plantean preguntas específicas sobre la compañía, los LLM pueden arrojar dos tipos de respuestas: erróneas o “hallucinations” como se expresa en inglés y resultados basados en datos pero fuera de contexto.
Aplicado al contexto empresarial, pongamos el caso de que un empleado pregunta por las políticas de viaje y reubicación de la empresa. Un LLM genérico respondería con políticas que suenan razonables, pero no tendrían porqué coincidir con las reales de la organización.
Entonces, ¿cómo pueden las empresas adoptar una IA generativa de calidad?
Entrenar un LLM desde cero puede parecer atractivo, pero es prohibitivamente caro. Sam Altman, CEO de Open AI, estima que el coste de entrenar a GPT-4 supera los 100 millones de dólares. Una opción para garantizar la privacidad de los datos es utilizar modelos LLM de código abierto para crear nuestra propia aplicación empresarial.
Los modelos de código abierto permiten alojar soluciones de IA dentro de la propia empresa sin gastar una fortuna en investigación, infraestructura y desarrollo. Esto también significa que las interacciones con este modelo se mantienen “en casa”, eliminando así las preocupaciones de privacidad asociadas con las soluciones SaaS LLM como ChatGPT o Bard.
Además, al aprovechar tecnologías de código abierto como Ray o LangChain, los desarrolladores pueden afinar los modelos lingüísticos con datos específicos de la empresa, añadiendo contexto a los LLM y mejorando así la calidad de las respuestas.
Con estas capacidades de código abierto, las empresas pueden crear y alojar LLM expertos en su materia o sector, adaptados para ser útiles en casos de uso específicos, en lugar de tener un enfoque generalista que no les aporte ni facilite información relevante.
A pesar de que hablamos de empresas, las entidades del sector público también tienen que afrontar, tarde o temprano, esta innovación e implementarla en las estructuras que sea necesaria y donde les aporte un valor diferencial a la hora de gestionar la información interna. Teniendo en cuenta el carácter de los datos que manejan, estas aplicaciones a medida pueden ser extremadamente útiles para agilizar una administración pública que necesita digitalizarse.
Al principio de este texto, hablábamos de la IA Generativa como una ola, pero podría definirse más como un tsunami. Pero para seguir siendo relevantes, las empresas y organizaciones públicas tienen que empezar a experimentar con esta tecnología desde hoy mismo para prepararse de cara al futuro y, de esta forma, afianzar su ventaja competitiva en un mundo tan cambiante como el actual. Por eso desde compañías como Cloudera estamos trabajando para poner al alcance de todas las organizaciones, tanto públicas como privadas, una IA de confianza, accesible, segura y de calidad.