El diccionario de los chatbots de las ‘big tech’

El diccionario de los chatbots de las ‘big tech’

Tecnológicas

El diccionario de los chatbots de las ‘big tech’

Bitext, en Madrid y San Francisco, ha dado con la fórmula perfecta entre Lingüística y procesamiento del lenguaje natural que genera datos de forma automática para los asistentes virtuales de las grandes

17 septiembre, 2019 07:00

Nos gustan las máquinas. Al menos, nos gusta hablar con ellas, a veces, incluso las preferimos a las personas... sobre todo si es para relacionarse con las empresas. De hecho, el 62% de los consumidores elige conversar con un chatbot antes que con un humano, según el informe 2019 State of Conversational Marketing. El asistente virtual evita discusiones, esperas y ¿ también malentendidos?  

Aún existen ciertos aspectos tecnológicos que amenazan al prometedor futuro de estos cerebros virtuales. Por ejemplo, la creación de diccionarios que las máquinas puedan entender. La española Bitext ha conseguido automatizar la producción de estos datos y hacerlo de forma ordenada y estructurada. De aquí que cuatro de las cinco grandes multinacionales tecnológicas ya estén usando esta tecnología para que sus chatbots ganen inteligencia, rapidez y eficacia. Su secreto: dar con la combinación perfecta entre inteligencia artificial (IA) y Lingüística. 

Bitext es el resultado del interés de Antonio Valderrábanos, experto en análisis de textos, por profundizar en las aplicaciones de la lingüística computacional. Por aquel entonces, corría el 2008, la inteligencia artificial era más bien una ensoñación futurística que una realidad palpable, así que su empresa empezó creando diccionarios de distintos idiomas para las grandes marcas. Un trabajo que ha ido evolucionando hasta incluso cambiar la propia misión de la compañía. "Nuestro propósito es ayudar a las máquinas a entender mejor a los humanos", reconoce el Chief Strategy Officer (CSO) de Bitext, Tony Jiménez, a INNOVADORES. 

Y para que la inteligencia artificial comprenda el lenguaje de las personas necesita palabras, pero no valen así, a lo bruto, sino que deben estar bien ordenadas. "No funciona por tener muchos datos, tienen que ser de calidad y si están desestructurados, pueden crear confusión", afirma. "La IA se basa en la forma que tenemos los humanos para aprender", explica. "Si le enseñas el diccionario de la RAE a un bebé, no podrá hablar; pero si le estructuras bien la información, lo conseguirá". "Hay una gran diferencia entre un niño que solo llora y uno que pide comer", añade como ejemplo.

Hasta ahora, estos datos se tenían que etiquetar de forma manual. Una persona iba clasificando cada frase o palabra. Bitext es una de las pocas empresas que ha logrado automatizar la producción de datos. "No tenemos mucha competencia". Por eso ha captado el interés de los gigantes tecnológicos mundiales (que no pueden citar por confidencialidad). "Nos usan para cosas que el usuario final utiliza diariamente". Hasta ahí puede leer. También les ha ayudado tener una sede en San Francisco (EEUU). "Estamos en el centro de la innovación", destaca Jiménez. Y eso les obliga a «ser verdaderamente muy buenos». 

Inteligencia artificial y lingüística

Esta "salsa secreta" es, según el CSO, la mezcla perfecta entre la Lingüística y la inteligencia artificial, en concreto, Bitext está especializada en el procesamiento del lenguaje natural (NPL). A partir de ahí, son capaces de generar diccionarios genéricos o especializados por sectores. "Cada vertical se tiene que conceptualizar". Incluso pueden jugar con la personalidad del chatbot. "Es posible medir el sentimiento del cliente para que la máquina proporcione la respuesta más adecuada". Aunque, indica, este servicio lo realizan ad hoc

Una de las pruebas que respaldan la innovación de Bitext, además de sus potentes clientes, es el reconocimiento recibido por Gartner. Solo en el último año, la empresa española ha aparecido en 20 informes de la prestigiosa consultora, además de haber sido seleccionada como cool vendor en tecnologías de inteligencia artificial. Este verano, también ha sido mencionada en cuatro publicaciones (hype circle) de la misma entidad.