La forma que tenemos de relacionarnos con los servicios digitales ha evolucionado notablemente en las últimas décadas: del ordenador como punto de acceso hemos pasado a tener todo el mundo a nuestro alcance en la palma de nuestra mano con los smartphones y, más recientemente, hemos comenzado a usar nuestra misma voz como interfaz por defecto en muchos casos de uso.

La banca no es ajena a estos cambios de hábitos motivados por la innovación tecnológica. Según un estudio de Ditrendia, siete de cada diez usuarios de banca dejarán de acudir a las oficinas físicas en los próximos tres años por el uso de asistentes de voz. Y para 2023, Juniper Research estima que habrá 8.000 millones de asistentes de voz embebidos en toda clase de dispositivos, desde altavoces inteligentes a vehículos, pasando por toda clase de 'wearables' y televisores.

Comprobar el estado de la cuenta, el saldo disponible o realizar pagos mediante la voz son sólo algunas de las acciones que ya son posibles con el actual estado del arte de esta tecnología. Pero esto tan sólo es el principio, como han destacado los participantes en el Foro de Debate de D+I - EL ESPAÑOL, organizado junto a EVO Banco.

“Estamos recorriendo la última milla en términos de tecnologías de voz, que empezaron a ponerse de moda en los 70 u 80, pero que todavía tenían muchos fallos en el reconocimiento del lenguaje natural. Ahora, con las redes neuronales profundas hemos vivido un impulso tremendo. El reto está en aplicarla y darle los casos de uso que demandan nuestros clientes”, introduce Javier González, director de Innovación de EVO, quien no obstante lanza una advertencia: “Hay una diferencia enorme entre que un sistema tenga una fiabilidad del 85% al 95%, porque puede dar la sensación al consumidor de que no está funcionando correctamente”.

“La voz es connatural a las personas y, también, al sector bancario, ya fuera cuando íbamos a la oficina o a través de este tipo de tecnologías. Algunos modelos sencillos, como los chatbots a través de WhatsApp ya están maduros, pero no incorporan estas capacidades de tratamiento del lenguaje natural que podríamos llamar agentes conversacionales. La clave aquí será cómo integrarlos no sólo para hacer una transferencia o consultar el saldo, sino como un nuevo canal dentro de toda la estrategia digital”, añade a su vez Armando Martínez Polo, responsable del área de Tecnología de PwC España.

Javier González, director de Innovación en EVO. Jesús Umbría

Por supuesto, la pandemia ha tenido mucho que ver en la progresiva adopción de las tecnologías de voz -o agentes conversacionales, si lo prefieren- en los últimos años.

“Antes de la pandemia ya veíamos que muchos bancos contaban con este tipo de asistentes, pero la pandemia ha empujado a la interacción por esta vía frente a las oficinas. Las apps móviles, por ejemplo, ya son la alternativa principal y vemos como cada vez incorporan más este tipo de funcionalidades y apunta a que va a seguir creciendo”, apunta Yolanda Azcunaga, experta en tecnologías de voz de Google.

“Sin duda, la incorporación de la voz dentro del sector bancario se ha visto impulsada por la pandemia”, coincide Esther Checa, directora de Innovación de t2Ó. “Incluso algunos estudios recogen que el uso de asistentes conversacionales con la banca estaba en un 15% antes de la covid-19 y ha subido a un 27%. Esto implica que hay una necesidad de los usuarios en interactuar con la banca por estos canales, que aún están en las primeras etapas de madurez de la inteligencia artificial y que se irán perfeccionando para beneficiar a los consumidores”.

Esther Checa, directora de Innovación de t2Ó. Jesús Umbría

Eso sí, la importancia creciente de estas fórmulas de relación entre consumidores y los servicios financieros no se detiene en la propia app del banco, sino que debe entenderse en un contexto en el que acciones como los pagos pueden producirse en cualquier entorno, incluso mientras conducimos.

“Los pagos por voz en el coche no son una comodidad, sino una necesidad, porque no hay otra forma de hacerlos con seguridad. Estamos viendo como los grandes actores están situando el vehículo conectado como un elemento más de su estrategia de voz, que posibilite nuevos casos de uso y ofrezca nuevos servicios en movilidad”, detalla Uliana Torkunova, CEO de Letmevoice, durante la mesa redonda.

Voz y datos, datos y voz

Durante el debate, con perfiles tan multidisciplinares como los presentes, surgen numerosas ideas para fomentar el uso de los agentes conversacionales en el entorno bancario.

Torkunova apela a la necesaria colaboración entre los distintos agentes de la industria y, junto a Checa y Azcunaga, reconocen la obligación (y oportunidad al mismo tiempo) de hacer llegar esta tecnología a las personas con limitaciones en la accesibilidad a estos servicios, desde aquellos con discapacidad a los que carecen de nociones digitales básicas, como los mayores, pasando por los usuarios con problemas de habla. González, de hecho, apela a la formación como ingrediente básico de esta ecuación y Martínez Polo hace lo propio con la extensión de estos asistentes a los propios empleados.

Yolanda Azcunaga, experta en tecnologías de voz de Google. Jesús Umbría

Pero hay dos conceptos que sobresalen por méritos propios durante toda la conversación: datos e integración.

“Nosotros empezamos con un caso muy sencillo que era complicado de resolver en términos de usabilidad: hacer un buscador avanzado de movimientos. Teníamos esa demanda y, conforme la gente lo fue usando, le dimos más usos hasta que lo convertimos en una estrategia global que pueda dar respuestas a muchos escenarios, incluso en comunicación directa con el ‘contact center’ para resolver cuestiones como robos de tarjetas”, explica Javier González. “Por ahora estamos en experiencias más transaccionales, pero el objetivo es ir más allá y ofrecer propuestas más personalizadas a los clientes a partir de los datos que obtenemos por la voz y su integración con otro tipo de información, estructurada y no estructurada, que manejamos”.

Armando Martínez Polo, responsable del área de Tecnología en PwC España. Jesús Umbría

Tanto Esther Checa como Armando Martínez Polo coinciden con esta visión y apelan a que “debe haber experiencias basadas en datos obtenidos de la voz pero también en la integración eficiente de la ingente cantidad de datos que genera un banco para alimentar los modelos y llegar a conversaciones maduras y que ofrezcan una propuesta de valor diferencial”. El objetivo, en opinión de ambos ponentes, es integrar, consolidar y explotar los datos para ofrecer recomendaciones y servicios hiperpersonalizados que lleven al asistente conversacional del estado reactivo a una actitud mucho más proactiva respecto al consumidor.

Uliana Torkunova y Yolanda Azcunaga arrojan algo de luz a cómo realizar este trabajo exhaustivo con los datos: desde la entrada en juego de sistemas de inteligencia artificial que incorporan texto e imágenes junto a la voz (como el lanzado por Google hace apenas un mes) hasta la integración de toda clase de ‘inputs’ que van más allá del lenguaje natural, desde el calendario, el historial de navegación del coche o la simple analítica de los datos estructurados para anticiparse a las necesidades del usuario.

Uliana Torkunova, CEO de Letmevoice. Jesús Umbría

Una integración de ‘front-office’, ‘backoffice’ y aplicaciones de terceros que lleva incluso a los ponentes a afirmar que es ahí (junto a la progresiva adopción y la mejora constante de la experiencia de usuario para evitar cualquier fricción) donde radica la clave del éxito presente y futuro de los asistentes conversacionales. Voz y APIs para conectarlo todo, los ingredientes de una nueva era en la digitalización del sector financiero.

De aquí al infinito: los expertos del foro organizado por EL ESPAÑOL y EVO adelantan algunas de las nuevas funcionalidades que pueden llegar por medio de estas interfaces de voz: desde la biometría como forma de acceder de forma segura a servicios online en apenas segundos hasta la capacidad de integrar los asistentes con más dispositivos en diferentes escenarios de uso. Allá donde el cliente esté, en clara oposición al concepto tradicional de la oficina presencial de toda la vida.

De lo que no tienen duda los ponentes es del extraordinario potencial que nos aguarda con estas tecnologías de voz, con un desarrollo dispar entre casos de uso pero que se antoja como una alternativa más para poder crear una banca más cercana y personalizada.