En la actualidad, organizaciones de todo el mundo manejan cantidades ingentes de datos, archivos, ficheros y otro tipo de documentos, y tanto su almacenaje como su tratamiento se están convirtiendo en una tarea cada vez más compleja. Afortunadamente, con el paso del tiempo se han desarrollado algunas herramientas que permiten simplificar la gestión y el tratamiento de estos datos, además de mejorar la eficiencia de los tediosos procesos administrativos que forman parte del día a día de las empresas.
La última novedad en este ámbito ha venido de la mano de Amazon, que lanzó al mercado hace escasas semanas un nuevo servicio conocido como Textract. Esta nueva herramienta ha sido añadida al portfolio de Amazon Web Services, y su principal función se basa en la extracción automática de texto y de datos de documentos escaneados, pudiendo identificar también el contenido de campos de formularios y la información almacenada en tablas.
El gigante del E-Commerce con sede en Seattle acaba de poner en jaque a todas las empresas que se dedican al reconocimiento óptico de caracteres (OCR), ofreciendo un servicio mucho más completo que promete revolucionar este sector de una forma drástica. Mientras que la mayoría de organizaciones cuya actividad se basa en la extracción de datos llevan a cabo esta labor mediante la extracción manual (un proceso lento y costoso), Textract de Amazon utiliza la tecnología Machine Learning para leer instantáneamente cualquier tipo de documento.
El gigante del E-Commerce con sede en Seattle acaba de poner en jaque a todas las empresas que se dedican al reconocimiento óptico de caracteres (OCR), ofreciendo un servicio mucho más completo que promete revolucionar este sector de una forma drástica.
Una de las principales ventajas de este nuevo servicio es que permite detectar automáticamente el diseño de cualquier documento y los elementos clave de cada página. Además, Amazon Textract entiende a la perfección las relaciones de datos integrados en cualquier formulario o tabla, pudiendo extraer todo su contenido íntegro e intacto.
No obstante, la propuesta de valor y principal factor diferencial de Textract es el empleo de la tecnología Machine Learning. Mientras que los métodos convencionales implican la utilización de un código (en muchos casos de elevada complejidad) para cada situación en particular, Textract ha sido entrenado con millones de documentos de todos los sectores, incluyendo facturas, contratos, recibos, documentos fiscales o pedidos de venta (entre muchos otros tipos de documentación).
Textract es sólo un ejemplo más de la dirección a la que se dirige Amazon y de la visión que tiene la compañía de cara a los próximos años. A pesar de que la organización tiene una posición óptima en los sectores en los que ya opera en la actualidad, su planteamiento va mucho más allá, dado que la compañía ha optado por una estrategia de diversificación.
Sin embargo, esta estrategia no es algo nuevo para Amazon, especialmente si tenemos en cuenta sus orígenes. La empresa que comenzó dedicándose a la venta de libros a través de internet, está consolidada en la actualidad como uno de los gigantes en los ámbitos de la logística, del retail, de los servicios Cloud y de la innovación, y da la sensación de que esto sólo es el comienzo.