amazon textract 1

amazon textract 1

Software

La nueva IA de Amazon es capaz de extraer texto de cualquier documento y papel

Textract es una nueva IA que extrae texto de documentos sin las limitaciones de los programas OCR tradicionales, manteniendo hasta el formato.

Noticias relacionadas

El OCR, o reconocimiento óptico de caracteres, es una de esas tecnologías veteranas que nunca parecen funcionar del todo bien. Consiste en reconocer los caracteres escritos o impresos y digitalizarlos; en otras palabras, pasar lo que hay en el papel a la pantalla, no como una imagen, sino como texto que podamos seleccionar y editar.

No es tan sencillo como suena. El programa tiene que ser capaz de reconocer infinidad de tipos de letras diferentes, pero incluso así puede fallar; por ejemplo, puede que la fotografía o el escaneo del documento incluya imperfecciones o no tenga mucha resolución. Y si el documento tiene un formato especial, como tablas o gráficos, entonces es básicamente imposible que el programa te lo detecte correctamente.

La IA que extrae texto de documentos puede ser el salto que necesitaba el OCR

Hasta ahora, dice Amazon, que ha presentado Textract, un nuevo servicio OCR para AWS (Amazon Web Services) capaz de reconocer y extraer texto de cualquier fuente. La compañía se ha demostrado especialmente confiada con este producto, llegando a afirmar que es capaz de procesar millones de páginas en sólo unas horas, y todo de manera precisa.

Textcract está basado en el aprendizaje automático, gracias a lo que ha podido aprender detalles que normalmente se escapan a los programas tradicionales, como el contexto; es capaz de detectar el tipo de documento que está escaneando, y buscar caracteres y palabras dependiendo de esto.

Por ejemplo, esta IA es capaz de reconocer extractos bancarios, facturas, tickets, cartas del banco y de Hacienda y otros tipos de documentos, y extraer los datos de manera precisa en documentos que podemos editar. Esto es especialmente útil para aplicaciones bancarias o de control de gastos.

Estos datos estarán estructurados tal y como estaban en el documento original; el sistema es capaz de reconocer tablas, gráficos y otros elementos sin volverse loca como es habitual en programas de OCR.

Textract ya está disponible en algunos países como parte de AWS, por lo que no está dirigido para el consumidor. En vez de eso, Amazon quiere que los desarrolladores de apps y webs lo utilicen en sus propios proyectos para ofrecer nuevos servicios.