Una persona escribiendo a ChatGPT

Una persona escribiendo a ChatGPT iStock Omicrono

Software

El nuevo negocio con la IA es cobrarle por dejarle consultar tu contenido: así es la plataforma que quiere liderarlo

Uno de los pesos pesados de internet ha bloqueado el acceso de la IA a los contenidos de muchas webs de internet a menos que paguen por el acceso.

Más información: Meta aprovechó el contenido de libros pirateados para entrenar a su IA: los autores aseguran que fue una decisión consciente

Publicada
Actualizada

Los desarrolladores de inteligencia artificial generativa se han encontrado con un muro. Para los chatbots más populares como ChatGPT, Gemini o Claude ya no será tan sencillo encontrar gratis información en internet para responder a tus preguntas. Cloudflare ha creado una herramienta con la que obligar a los gigantes de la IA a pagar por el contenido de las webs con el que nutren a sus grandes modelos de lenguaje.

Cloudflare es uno de los gigantes de CDN (Red de Distribución de Contenido), encargados de la gestión del tráfico en internet para que los usuarios puedan acceder rápido a toda clase de contenido. Un intermediario entre un cliente y un servicio online o una tienda, un lector y un periódico digital. Además, ofrece protección a millones de webs frente a posibles ataques y ahora, contra el saqueo de la IA.

Cloudflare bloqueará por defecto los scrappers de IA, los rastreadores de esta tecnología. Con esta nueva herramienta no solo protegerían los contenidos con derechos de autor de su uso sin permiso, también se pone a disposición de las webs una nueva forma de recibir remuneración por su contenido por parte de los desarrolladores de grandes modelos o responsables de los chatbots. Una nueva forma de negocio para una nueva era de Internet.

Los rastreadores de IA

Los buscadores como Google cuentan con bots que rastrean el contenido en internet para encontrar aquello que estás buscando y ofrecerte esa lista de enlaces en los que consultar la información. Estos rastreadores de Google, o GoogleBots, se usan tanto para el SEO como para la IA.

El negocio de internet y la publicidad online se forjó alrededor de esta colaboración entre creadores de contenido y los buscadores que facilitaban el acceso a esas fuentes de información. Sin embargo, el conflicto ha llegado con la aparición de los chatbots y el entrenamiento de los grandes modelos de lenguaje en los que se basan.

Los desarrolladores de esta tecnología, como OpenAI, rastrearon la red de redes para adquirir millones de parámetros, textos de todo tipo con los que entrenar su IA, incluso si ese contenido estaba protegido por derechos de autor, como libros o artículos. Al poco tiempo de nacer los chatbots más populares, la IA se conectó a internet para ofrecer datos actuales extrayendo la información de otras webs gracias a los AI Crawlers, como son GPTBot de OpenAI o ClaudeBot de Anthropic, entre otros.

Ahora, los usuarios pueden conseguir la información resumida por la IA en vez de hacer clic en varios medios o webs para informarse sobre un tema, aunque esta tecnología siga teniendo el riesgo de sufrir alucinaciones e inventarse la información. Esto ha derivado en la denuncia de importantes medios de comunicación como The New York Times contra empresas como OpenAI por hacer uso sin su consentimiento de sus artículos.

Pagar por acceso

Ante las críticas y las demandas legales, las empresas tecnológicas también han empezado a firmar acuerdos con algunos medios para poder acceder a su contenido, lo que les permite seguir entrenando a la IA y generar resúmenes para los lectores. Para igualar la partida, Cloudflare ha anunciado el bloqueo de los AI Crawlers por defecto para todos sus clientes.

Este nuevo servicio de protección contra la IA es voluntario, por lo que se puede desactivar por completo en los ajustes. Como añadido, el gigante del tráfico de la red ha anunciado la función Pay Per Crawl, que permite a los propietarios de dominios definir un precio fijo por cada solicitud de acceso de un rastreador, obligando a los propietarios de los LLM y sus bots a pagar por ese acceso al contenido.

Se trata de una herramienta que está todavía en fase beta, cuya fuerza para reestablecer un equilibrio o frenar la desaparición del internet tal y como lo conocemos dependerá de las medidas que tomen los diferentes agentes en este mercado y de cuántas webs utilicen esta nueva herramienta.