En el mundo actual, la IA con lenguaje natural habilitado no es solamente algo “bueno para tener”, sino una necesidad. Según Gartner, “para 2024, hasta el 80% de las experiencias digitales de marca se entregarán a los consumidores a través de personas virtuales”.
La IA conversacional se extiende más allá de los bots de chat. Los sistemas de IA que procesan un lenguaje natural participan en un diálogo similar al humano, comprenden el contexto y ofrecen respuestas inteligentes en cuestión de milisegundos. En pocas palabras, el procesamiento de lenguaje natural es un programa informático que comprende el lenguaje humano de la manera en que se habla. El procesamiento de lenguaje natural cambia todo el tiempo: los nuevos desarrollos en tecnología y las estrategias en constante evolución refinan la forma en que la IA procesa el lenguaje.
Gartner enumeró ocho enfoques para procesar el lenguaje natural en Gartner 2021 Strategic Roadmap for Enterprise AI: Natural Language Architecture (Hoja de ruta estratégica para IA empresarial de Gartner 2021: Arquitectura del lenguaje natural),Anthony Mullen,Magnus Revang,Stephen Emmott,Erick Brethenoux,Berna Elliot y Jessica Ekholm, 15 de diciembre de 2020:
1: Modelos de lenguaje generalizado o modelos de transformadores
En 2020, muchos proveedores incorporaron este nuevo enfoque disruptivo para el procesamiento de lenguaje. Los motores de información detallada, el análisis de texto, la generación de lenguaje natural (NLG) y la IA conversacional utilizan estos modelos en todas las áreas del flujo de trabajo de tecnología NL. Estos modelos de lenguaje generalizado se suelen utilizar con el aprendizaje de transferencia para aprovechar los modelos de aprendizaje profundo predefinidos (con billones de parámetros) con el fin de crear modelos personalizados para sectores y organizaciones. Algunos ejemplos de estos modelos son BERT/Meena y GPT2/3.
2: Middleware conversacional
Este middleware permite utilizar una combinación flexible de motores de habla y conversación. Es posible desacoplar el motor subyacente de sus datos de formación, así como su integración y diseño de diálogos. Los motores típicos que utilizan estos proveedores de middleware son Amazon Lex, Microsoft Bot Framework, Google Dialogflow, IBM Watson y Rasa. (Consulte Uso de middleware de IA conversacional para crear bots conversacionales y asistentes virtuales).
3: Ampliación de la búsqueda y la conversación a las consultas informáticas
La mayoría de las herramientas de inteligencia empresarial (BI) han aportado algún tipo de interfaz de lenguaje natural a lo que hacen. Pero el enfoque de la mayoría de ellas no es totalmente conversacional. Sin embargo, las consultas informáticas mejoran de forma rápida. La última herramienta prometedora es Google TAPAS, donde se utilizan modelos de lenguaje generalizado para acceder a datos tabulares. Obtenga más información sobre la evolución de la BI y el lenguaje natural en este informe: Worlds Collide as Augmented Analytics Draws Analytics, BI and Data Science Together (Los mundos chocan a medida que la analítica aumentada une el análisis, la BI y la ciencia de datos).
4: Pilas y módulos de aprendizaje profundo modular de proveedores de NL
Los grandes proveedores, como Alibaba, Oracle, IBM y Microsoft, están desarrollando funcionalidades de habla, documentación, traducción y conversación a partir de una pila compartida de modelos NL y componentes comunes.
5: Democratización del desarrollo ciudadano en las experiencias de NL
Ya sea para búsqueda o conversación, muchos proveedores han mejorado las opciones WYSIWYG de sus herramientas para desarrolladores ciudadanos y han aumentado la accesibilidad de sus interfaces no técnicas. Existen herramientas de diseño de poco código y sin código disponibles para mucho más que solamente los diálogos. El diálogo conversacional es solamente una de las muchas cosas que los desarrolladores ciudadanos pueden diseñar sin conocimientos técnicos. A menudo, las plataformas de poco código y sin código actuales no solamente ofrecen diseño de diálogo, sino también RPA y desarrollo de aplicaciones de búsqueda junto con elementos de diseño Web 2.0 más estándar.
6: Los proveedores ofrecen modelos de lenguaje extendido en ofertas multimodales para incluir la traducción y la visión informática
Los servicios de lenguaje están evolucionando para ser más multimodales, lo que permite una comunicación rica y natural entre personas y máquinas. Por ejemplo, Openstream proporciona la capacidad de interactuar y hablar de forma simultánea con las aplicaciones de mapeo. Y Baidu Translate toma señales no solamente de las palabras habladas, sino también de los objetos visuales en una escena de vídeo.
7: Evolución del acceso a datos, la gestión de metadatos y los sistemas basados en gráficos
Hoy en día, las soluciones de Data Fabric son la vanguardia en el enriquecimiento y la gestión de datos distribuidos. La solución de Data Fabric puede proporcionar servicios de datos reutilizables, canalizaciones, niveles semánticos y API mediante una combinación de enfoques de integración de datos. Para mejorar aún más las soluciones de Data Fabric, puede añadir el reconocimiento de esquemas dinámicos o la optimización basada en costes (consulte Desmitificación de Data Fabric).
8: Una canalización emergente de herramientas y servicios para proyectos de NL
Cada vez es mayor la cantidad de empresas de anotación y etiquetado de datos que admiten servicios de texto, habla y anotación de documentos junto con la visión informática. Las empresas de traducción gestionan las cargas de trabajo mediante centros de traducción de modelos y personas.