Enrique Molina.

Enrique Molina.

Opinión

Sin datos de calidad no hay IA que valga

Enrique Molina
Publicada

Desde la salida de ChatGPT en noviembre de 2022, el tema estrella del mundo tecnológico, y yo diría que, de la economía global, es la inteligencia artificial. En este tiempo de ilusión y descubrimiento, hemos visto la IA y su variante generativa (la que permite producir textos, presentaciones, fotos o vídeos, entre otras cosas, a partir de los datos y de su interpretación) como poderosas herramientas para que las empresas ganen en eficiencia y productividad, conceptos clave para garantizar una economía sana y un alto nivel de bienestar de los ciudadanos.

Sin embargo, el desembarco de la IA generativa no va a ser un camino de rosas y antes va a haber que hacer algunos ajustes importantes para sacarle partido.

Por ejemplo, la consultora Gartner, una referencia en el mundo de la tecnología, ya advirtió el año pasado de que un tercio de los proyectos que involucren IA generativa serán abandonados después de la prueba de concepto debido a la mala calidad de los datos, controles de riesgo inadecuados, costes crecientes e impredecibles de implantación o un retorno de la inversión poco claro para los empresarios.

La misma Gartner ha ido más allá y ha dicho sobre este tema que el 85% de los proyectos de IA fracasa por problemas con la calidad de los datos. Y otra consultora estratégica como McKinsey subraya que la precisión y efectividad de modelos generativos dependen directamente del nivel de calidad de los datos iniciales, destacando que una deficiente gestión de la información puede reducir en un 30% o 40% los resultados esperados.

No digo nada nuevo si afirmo que los datos son el verdadero combustible de la IA. Y que el resultado que vayan a aportar los modelos basados en inteligencia artificial dependerá directamente de la calidad y preparación previa de la información con la que se alimentan. Por lo tanto, podemos decir, sin lugar a duda, que las soluciones de IA que implante una empresa serán tan buenas o malas como lo sean sus datos. En este sentido, se calcula que el 80% del esfuerzo a la hora de armar un proyecto con inteligencia artificial se consume en gestionar, preparar y asegurar esa calidad de la información.

El elevado coste de descuidar los datos

La consultora Deloitte advierte claramente que los errores derivados de los datos defectuosos pueden tener un coste mayor para las empresas que el propio uso de la IA. Es decir, que puede ser peor el remedio que la enfermedad si no tomamos medidas. Datos incorrectos probablemente llevarán a decisiones de negocio incorrectas.

También pueden llevar a las compañías a incumplir normativas estrictas como la del GDPR (de protección de datos personales) o la ISO 27001 (de gestión de la seguridad de la información). Y, a partir de ahora, la directiva NIS2, que refuerza la ciberseguridad de las compañías y las instituciones que operan en sectores críticos, con el consiguiente perjuicio económico, por las sanciones que implica, y de reputación.

De la calidad de los datos y de los algoritmos también dependerá que se puedan evitar sesgos que lleven a discriminación, lo que puede dar lugar a demandas contra las empresas. En este sentido, mucho se ha hablado de los casos en que la IA ha llevado a grandes corporaciones a perpetuar políticas de contratación de personal que dejaban fuera a candidatos con buenos currículums, pero con el sexo, la raza o el código postal "equivocados". Pero no es, desde luego, el único problema.

Para evitar respuestas erróneas o las temibles alucinaciones, los sistemas de IA deberán ser entrenados de forma exhaustiva con datos claros, coherentes y trazables. De esta manera serán más fáciles de auditar y de corregir llegado el caso. Y ese momento llegará porque la IA no es infalible. Eso conviene tenerlo en cuenta. Invertir en calidad, seguridad y gobierno de datos reduce significativamente los costes operativos futuros de implementar la IA.

Se impone la incultura de los datos

Cuando hablamos de IA y de la situación de los datos, el escenario no es favorable. Aunque muchas veces escuchamos que los datos son el petróleo del siglo XXI y que la información es el activo más importante de una empresa, la realidad es que muy pocas compañías pueden hoy en día presumir de una verdadera cultura Data Driven o centrada en el dato. Y si la tienen, no es a nivel general, sino que se reduce al ámbito de algún departamento específico. Por acuñar un término: en líneas generales, se impone la incultura de los datos.

En consecuencia, la información en las compañías suele estar desactualizada, duplicada y repartida en aplicaciones o repositorios que, además, no están conectados entre sí. Además, en muchos casos, esos datos están desprotegidos, siendo accesibles a cualquiera y compartidos sin control. Y hacen imposible tener una visión global y horizontal sobre los mismos. Lo que lleva a una enorme lentitud en la preparación de informes y en la toma de decisiones de sus directivos.

Las posibilidades de la inteligencia artificial son enormes. El mercado lo sabe y las consultoras llevan dos años pregonándolas. De hecho, me atrevería a decir que una empresa que no aproveche esta ola tecnológica va a tener muy complicado (por no decir imposible) competir en un mercado donde sus rivales seguramente sí se van a beneficiar de ella. Pero para dar ese salto, las compañías antes deberán demostrar que tienen su información actualizada, segura y en forma. Y que hay una estrategia coherente detrás. Tendrán que trabajar en los próximos meses y años para convertirse en una verdadera empresa Data Driven. Y, a partir de ahí, las ganancias que promete la IA generativa llegarán. Como flor en primavera.

*** Enrique Molina es director de Data en Prodware.