Una de las sesiones plenarias en Cloudera Evolve25 en Dubái.

Una de las sesiones plenarias en Cloudera Evolve25 en Dubái. Alberto Iglesias

Tecnológicas

Cloudera fija su hoja de ruta en Dubái: IA privada, datos federados y convergencia como palancas de crecimiento

La integración de Trino y SDX, las soluciones preconfiguradas junto a Dell y Nvidia para explotar la inteligencia artificial o el despliegue saudí con AWS marcan un nuevo ciclo para la enseña norteamericana.

Más información: Charles Sansbury, CEO de Cloudera: "Las empresas no están dispuestas a mover cada fragmento de datos a la nube"

Dubái (EAU)
Publicada

Las claves

Cloudera apuesta por una estrategia híbrida y multicloud, permitiendo a las empresas gestionar datos críticos tanto en la nube como en infraestructura propia para garantizar eficiencia, seguridad y soberanía.

La compañía anunció el lanzamiento de su plataforma de datos e IA en la región de AWS en Arabia Saudí, facilitando a empresas y organismos públicos cumplir normativas locales y avanzar en soberanía digital.

Cloudera impulsa la integración de tecnologías como Trino, SDX y Octopai para automatizar la gobernanza y federar consultas sobre datos dispersos, eliminando silos y facilitando el desarrollo de IA privada.

En Madrid, Cloudera trabaja en la creación de un gran 'hub' de datos e inteligencia artificial para unificar fuentes de información y mejorar la toma de decisiones y el acceso de los ciudadanos a servicios públicos.

Hay congresos que funcionan como un escaparate de producto y hay otros que actúan como sismógrafos de hacia dónde se está moviendo la industria, sin necesidad de hipérboles ni grandes proclamas. Este último es el caso de Evolve25 en Dubái, la entrega de la serie de eventos anuales que Cloudera celebra en Oriente Medio.

No es casual esta ubicación: es la región que más dinamismo e inversiones está desplegando en torno al dato y a la inteligencia artificial que lo explota.

No es que falte brillo en este sarao -el emblemático hotel Atlantis The Royal es un escenario que nunca decepciona-, sino porque la conversación que se masca en los mentideros del sector va muy por delante de cualquier despliegue escénico imaginable. Aquí, la sensación predominante es que las empresas han entrado de lleno en una fase de “convergencia” tecnológica en estas lides. Convergencia como palabra mágica y recurso de ida y vuelta, a caballo entre las anteriores eras del control y de la conveniencia.

Convergencia, en definitiva, ante la complejidad real que trae la IA generativa y la presión por gobernar datos dispersos, sin gobernanza y cada vez más críticos.

Está lejos de ser algo baladí: las empresas se están acostumbrando a lidiar con entornos híbridos, con datos alojados en diferentes nubes y en sus propios centros de datos, con requisitos de latencia cada vez más estrictos, un retorno de la inversión en IA que preocupa “más que nunca”. Y el elefante en la sala: la seguridad y la soberanía del dato. Todo esto se percibe en cada conversación, desde los bancos del Golfo hasta los operadores logísticos que pasan por aquí buscando certezas en un mercado que no deja de mutar.

Capacidad para elegir

Aun así, las cifras impresionan. Cloudera gestiona ya 25 exabytes de datos en sus plataformas globales, un volumen que dice mucho de la ola de consolidación que atraviesa el mercado y del apetito de las grandes empresas por unificar lo que durante años ha estado fragmentado.

De ahí el volcado liderado por Charles Sansbury, CEO de la firma, en una estrategia híbrida y multicloud que responda a lo que piden las organizaciones: eficiencia, gobernanza y capacidad de elegir dónde y cómo ejecutar cargas sin quedar atrapadas en un único modelo tecnológico.

En entrevista con DISRUPTORES - EL ESPAÑOL, Sansbury señala que "las cargas de trabajo tienen requisitos distintos y, aunque unas pueden ir a la nube, muchas otras terminan ejecutándose en hardware que es tuyo, y en el caso de las grandes compañías una proporción mayor va a seguir haciéndolo en infraestructura propia". Por eso, su estrategia se articula alrededor de la portabilidad: "El objetivo es que exista una plataforma de datos que abstraiga la infraestructura subyacente, de modo que el cliente pueda construir una vez y ejecutar donde corresponda".

En la práctica, explica, esto significa que "lo temporal puede ir al cloud; pero lo crítico para el negocio, con datos propietarios o que funciona 24/7, probablemente deba ejecutarse por razones de coste, eficiencia y seguridad en hardware que tú controlas".

Ese concepto de elección entre entornos -tantas veces vaciado de significado por la industria- adquiere aquí una dimensión concreta. Frank O’Dowd, CRO de la enseña, planteaba que el nuevo campo de batalla es el unified data fabric, capaz de conectar plataformas, lagos de datos y herramientas dispares sin multiplicar proveedores por el camino.

“No es cuestión de poner toda la tecnología en múltiples entornos, hay que unificar el data lakehouse”, advertía desde el emirato, recordando las participaciones en proyectos abiertos como Apache Iceberg, la expansión de Trino y la llegada de tecnologías de descubrimiento y trazabilidad de datos como Octopai. De hecho, la propia compañía ha anunciado la integración nativa de Trino, SDX y Octopai para automatizar gobernanza, federar consultas y descubrir datos repartidos en múltiples sistemas sin moverlos ni duplicar políticas de seguridad.

Romper los silos para la IA

Hay una máxima que, por evidente, no podemos dejar de señalar: la IA no puede despegar ni escalar en las organizaciones si el dato sigue secuestrado en silos. Según la información que maneja la propia Cloudera, sólo el 9% de los líderes de TI asegura que toda la información de su organización es accesible.

Del 'big data' a hoy

Cloudera es, en esencia, una compañía nacida del big data que ha sabido mutar hacia la IA empresarial sin despegarse de su ADN: gestionar y gobernar datos complejos en arquitecturas híbridas. Convertida en empresa de capital privado tras su salida del Nasdaq en 2021, opera hoy en más de veinte países y mantiene una base de clientes que incluye a algunas de las mayores organizaciones del mundo en sectores como banca, telecomunicaciones, energía o administraciones públicas. Su facturación alcanza aproximadamente los 1.000 millones de dólares anuales.

La cifra suena preocupante, pero también explica por qué el debate en Dubái va mucho más allá del enésimo modelo generativo o la enésima promesa de automatización.

Es el CTO de la compañía tecnológica, el español Sergio Gago, quien aporta un marco conceptual al momento que vivimos y de dónde se extrapola esa convergencia tan repetida: “Primero fue la ola del control, cuando nosotros lanzamos Hadoop; luego, la de la conveniencia, con los hiperescalares y los data services; ahora vivimos la era de la complejidad que nos obliga a la convergencia”.

Venga aquí la paradoja: las empresas quieren más capacidades, más modelos de inteligencia artificial, más automatización, pero sus datos aún carecen de control, auditoría o entornos seguros y gobernados para poder ser explotados por la promesa de la IA.

En ese sentido es donde entran en juego tecnologías como Trino -con su federación de consultas sobre múltiples fuentes- o Taikun Kubernetes -que simplifica despliegues y unifica computación en entornos híbridos-. Aspiran, no en vano, a convertirse en los ladrillos básicos para que las arquitecturas modernas no colapsen bajo su propio peso.

De Oriente a la IA privada

La regulación marcó el tono de una de las noticias más relevantes del día: el anuncio de que Cloudera lanzará su plataforma de datos e IA en la región de AWS en Arabia Saudí, en plena expansión de su estrategia de soberanía digital.

En un Golfo que está abrazando la IA con la misma velocidad con la que construye nuevas ciudades futuristas, este movimiento no es menor: permitirá a empresas y organismos públicos almacenar y procesar datos dentro del país, cumplir con normativas locales y avanzar hacia modelos de IA sin renunciar a la autonomía tecnológica que exige su propia legislación nacional.

No se trata solo de regulación. También hay mucho que rascar alrededor del hardware y del papel de Nvidia como nuevo 'poder fáctico' de la IA. Aprovechar la inteligencia artificial requiere de hardware de última generación, principalmente del fabricante verde, pero también de datos de alta calidad para que esos modelos merezcan la pena. Hasta aquí nada nuevo, ni nada que no se haya mencionado incluso en esta misma crónica.

La repetición, empero, es obligada para introducir propuestas como AI Inference Services, de herramientas low-code como AI Studios o AI Agents Studio (para construir agentes de IA sin complicaciones innecesarias) pero, especialmente, las propuestas de AI Factory. En palabras del Chief Product Officer, Leo Brunnick, se trata de una solución preconfigurada que combina el hierro de Dell con las GPU de Nvidia y el entorno de datos de Cloudera.

No es una estrategia de oposición a los grandes modelos de IA pública, pero sí la reivindicación de que una IA privada irá cobrando cada vez más fuerza conforme esta tecnología vaya escalando en las empresas. Y Cloudera quiere repetir su acierto al apoyar los entornos híbridos (en plena ola de los hiperescalares), apostando ahora por entornos privados de inteligencia artificial, gobernados y sin dependencia de actores capaces de cambiar sus modelos “en cualquier segundo”, como recordaba su CTO, Sergio Gago.

El gran 'hub' de datos e IA en Madrid

El propio Charles Sansbury, CEO de Cloudera, recibió en su sede de Estados Unidos a Isabel Díaz Ayuso y Miguel López-Valverde, presidenta y consejero de Digitalización de la Comunidad de Madrid, respectivamente. El propósito de tan extraordinaria misión fue dar luz verde a un gran 'hub' de datos e inteligencia artificial en la región capitalina, sobre el que también DISRUPTORES - EL ESPAÑOL ha preguntado al máximo directivo de esta tecnológica.

Como explica Sansbury a este medio, su vínculo con la capital es personal y profesional: "Soy antiguo residente de Madrid y un gran admirador de lo que están haciendo. Hemos estado trabajando con ellos desde hace mucho tiempo, por ejemplo, en materia de datos de salud", y destaca que la ciudad está entrando en una fase de implementación acelerada de tecnología.

"Barcelona fue durante años una adoptante muy rápida, y ahora Madrid se está convirtiendo a ese mismo tipo de ritmo tecnológico". Sobre el proyecto conjunto, resume que el objetivo es "desarrollar una plataforma de datos empresarial que unifique todas las fuentes de información de la Comunidad de Madrid".,

Algo que permitirá "facilitar a los ciudadanos el acceso a los datos públicos, renovar permisos, obtener licencias" y, al mismo tiempo, dotar a la administración de información para "tomar mejores decisiones sobre la asignación de recursos en los servicios públicos".