SAS anuncia IA generativa en "modelos ligeros" y datos "sintéticos" a medida para entrenarlos
La empresa presenta novedades orientadas a afrontar problemas específicos para ayudar a las empresas a mejorar la productividad.
20 abril, 2024 02:03"Nuestro objetivo es democratizar el uso de la inteligencia artificial (IA) y potenciar a las organizaciones, como las vuestras, con datos e IA. Pero, ¿con qué finalidad…?", plantea a la audiencia el CTO de SAS, Brian Harris, en el evento anual de su compañía, Innovate, que, por primera vez, se celebra en Las Vegas.
Él mismo se responde: "Es una fórmula muy sencilla. Cuando usamos datos e IA para tomar mejores decisiones y lograr mejores resultados, estamos aumentando el nivel de conocimiento. Y si aprendes rápido ves las oportunidades antes que los competidores".
Cabe presumir que su propia compañía se ha aplicado la fórmula, para verlas con antelación. Así que, en el evento de referencia al que asiste Disruptores El Español, "las oportunidades" avistadas se transforman en media docena de anuncios de calado.
Empezando por la gran estrella del momento tecnológico. SAS incorpora IA generativa a su plataforma Viya, "para acelerar la productividad" y eficiencia de sus clientes.
No ha desarrollado, para ello, un modelo propio de lenguaje masivo. Está abierta a integrar cualquiera de los LLM que ya están en el mercado. "No es ese nuestro negocio", precisa el vicepresidente de IA y analítica, Udo Sglavo. "No construimos modelos de lenguaje masivo por nuestra cuenta. Nosotros los consumimos".
IA para problemas específicos
Lo que sí produce SAS por su cuenta, y es otro de los grandes anuncios de la jornada, es un nuevo concepto, que SAS bautiza como "modelos ligeros".
Son soluciones específicas, que integran la inteligencia artificial para empresas concretas que afrontan un determinado problema o desafío de negocio. "Construimos los modelos para resolver una 'entidad'. Por ejemplo, si tienes muchas tablas [de datos] sin una clave común, ¿cómo puedes unirlas?", explica Sglavo a Disruptores.
"Puedes usar estadística para determinar cuál es clave más probable, ¿no? Pues eso es un modelo y lo que hace es crear las entidades y nada más. Tenemos nuestra plataforma y con ella podemos crear todo tipo de modelos".
El propósito de estos empaquetados específicos de software inteligencia, para una empresa o para un asunto que interesa a varias, es atacar directamente casos de uso "del mundo real", con elevada eficiencia. El jefe de tecnología Harris menciona casos y soluciones como la aceleración de investigaciones médicas, desarrollos de fármacos y, en el sector bancario, la detección de fraudes y el cumplimiento regulatorio.
"Estamos rebajando costes, ayudando a las manufactureras a optimizar sus operaciones y su cadena de suministros”, añade. "Y transformando la industria aseguradora, ayudándoles a conocer los riesgos y establecer experiencias personalizadas, únicas y premium, de las que se benefician los clientes y los aseguradores".
El uso de IA, para unos propósitos u otros, plantea la necesidad de contar con datos para el entrenamiento. "Hay hambre de datos". En el caso de los modelos ligeros que anuncia SAS, esto supone utilizar los datos proporcionados por los propios clientes.
Datos como materia prima
Pero no siempre hay datos suficientes para el proceso de entrenamiento. Y esto conduce a otro de los grandes anuncios de la jornada: Data Maker, una fábrica de datos sintéticos. Ofrece datos no recolectados, sino creados de manera artificial, para entrenar un modelo ligero.
¿Cómo funciona esa fabricación de datos, a partir de qué materia prima se generan?, le preguntamos a Sglavo.
"Data Maker es un generador de datos sintéticos a partir de una idea que nació viendo cómo se crean las imágenes fake”, contesta. "Ves la foto de una persona que no es real, pero parece perfectamente humana, ¿verdad? Es porque se han utilizado fotos [reales] para crear un modelo que produce esa imagen. Nosotros aplicamos la misma idea a datos tabulados".
"Básicamente, tenemos datos como materia prima y se crea un modelo que es típicamente una red neural. Imita los patrones de los datos y con eso genera otros nuevos, que no son iguales a los tabulados, pero los patrones y las correlaciones entre las variables siguen ahí", remarca Sglavo.
"Puedes confiar en ellos para construir un modelo. El reto con los datos sintéticos es que no se trata de duplicar los que ya tienes, sino de crear otros nuevos en los que, por ejemplo, los casos de fraude están sobrerrepresentados…", añade.
"Es decir, volvamos al fraude, que es un tema agradable para comentar", bromea. "Si miro mis datos encontraré probablemente que no hay muchas transacciones fraudulentas, porque si la mitad de mi base de datos tuviera casos de fraude ya estaría fuera del negocio. Usamos datos sintéticos para sobrerrepresentar esos casos y así es más fácil para el modelo de IA detectar los fraudes".
"Pero al desplegar un modelo cambiamos la realidad", advierte Sglavo, para subrayar que, en el ejemplo del fraude bancario, descubrir un procedimiento concreto y frenarlo supondrá que decaiga su uso, deje de ser significativo y surjan otros diferentes.
Como consecuencia, el modelo tendrá que ser sometido a sucesivas actualizaciones, añadiendo en los datos de entrenamiento los cambios de comportamiento que se vayan produciendo.
Este planteamiento es válido para cualquier otro tipo de actividad tratada con modelos ligeros, advierte Sglavo, que se ofrecerán mediante suscripción, para mantener un sistema de actualizaciones.
Entorno para desarrolladores
Otro de los grandes anuncios de SAS en su evento es Viya Workbench. Una expansión de su plataforma "fundacional" que genera un entorno para desarrolladores y diseñadores.
Workbench funciona como un autoservicio bajo demanda, para la preparación de los datos, hacer análisis exploratorio de estos y, finalmente, desarrollar modelos analíticos y de machine learning.
Planteado de otra manera, es un "ecosistema" de programación que permitirá a los desarrolladores utilizar el lenguaje que prefieran. Empezará a operar con Python y R, que estarán disponibles a final de año, y dos opciones de entorno de trabajo: Jupyter Notebook/JupyterLab y Visual Studio Code. También permitirá definir las características de potencia de computación utilizada, para atenerse a las necesidades del proyecto.
El fundador y CEO de SAS, Jim Goodnight, apareció en el escenario de Innovate para hacer una demostración práctica de cómo Workbench es capaz de manejar un segmento de "código de 1998", que analizaba apuestas con dados.
También en relación con las ayudas para los desarrolladores, otra de las novedades anunciadas en Las Vegas es Viya Copilot. En este caso, se trata propiamente un asistente de programación.
Afirma Marinela Profi, líder de estrategia IA global, que Copilot es una herramienta para “acelerar el desarrollo de la inteligencia artificial, con planteamientos específicos para cada industria”.
Un humano en el bucle
La herramienta podría reemplazar el actual concepto de low code para desarrollo rápido y automatizado. Incluye la posibilidad de hacer "brainstorming", para analizar ideas sobre un determinado software. En todas las nuevas aplicaciones de la IA los directivos de SAS insisten en que ha de haber una persona que decida. “Un humano en el bucle” ("human in the loop"), dice Sglavo.
El resultado es que “cuando los desarrolladores son más productivos, la compañía es más productiva”, sentencia Alyssa Farrell líder del marketing de SAS orientado a la industria de la salud.
Y queda otro punto destacado en las presentaciones del Innovate: las model cards y la nueva "asesora de gobernanza AI", orientadas a crear un modelo de "confianza y transparencia" que ayude a las organizaciones "a navegar el turbulento panorama de la inteligencia artificial".
Reggie Townsend, vicepresidente para el uso ético de los datos, declara que los clientes "son entusiastas en cuanto al potencial de la IA, pero se mantienen todavía cautelosos sobre cuándo y cómo utilizarla".
Estas herramientas ad hoc pretenden ayudar a los clientes a adoptar la IA y desplegarla en la industria real. Las model cards, que son autogeneradas por modelos con contenido de productos de SAS, ya habían sido presentadas a principios de año en la conferencia para analistas Insight.
Bryan Harris resume la actividad de su compañía aseverando que prospera sobre la base de generar, para sus clientes, mejoras en "productividad, rendimiento y confianza". Y sobre lo que traerá el futuro, expresa con rotundidad una idea: "Los clientes quieren consumir IA".