Gureak Marketing y la utilización del OCR

GUPOST enlazado con el OCR

Gureak Marketing y la importancia del OCR

Para empezar hay que definir que es un OCR, se puede decir que es un reconocimiento óptico de caracteres. Es un software que incorporamos en nuestros equipos y es capaz de reconocer las letras de hojas con texto digitalizado y trasformarlo todo a un formato Word.

También reconoce imágenes y se utiliza mucho, y las incrusta en el documento de texto como una imagen más. Es una gran ventaja para poder modificar facturas y poderlas utilizar reenviándolas al cliente otra vez, en Gureak Marketing constantemente realizamos extracción de texto por medio de un OCR.

Hay en el mercado bastantes programas de OCR, entre los que cabe destacar los conocidos OmniPage, Abbyy Fine Reader o READiris. Versiones reducidas de estos programas suelen encontarse entre el software incluido en los escáneres.

Se puede destacar entre ellos el OmniPage Professional por su amplia variedad de opciones y su buena presentación y funcionamiento, con algunos módulos se podría directamente utilizar en el escaner mientras se está digitalizando.

Estos programas todavía tienen mucha dificultad a la hora de transformar fórmulas químicas y matemáticas a texto, lo hemos comprobado en Gureak Marketing, les cuesta mucho y luego exige un gran trabajo manual para dejar todo bien. Son capaces de leer las fórmulas pero en su mayoría las convierte en imagen.

Los programas actuales de OCR están basados en el análisis de características de los caracteres en vez de en la coincidencia de las matrices de estos, lo que permite una mayor velocidad en el proceso y el no tener que depender de una limitada base de fuentes.

También se han detectado en Gureak Marketing  según Txomin Alkorta bastantes complicaciones a la hora de interpretar letra histórica de libros de nacimientos o libros literarios. Es cierto que también pueden reconocer textos escritos manualmente, pero en este caso siempre a condición de que estén escritos claramente, a ser posible con letra de molde, y que esta se asemeje lo más posible a un tipo de letra existente, de otra manera será casi imposible que lo pueda hacer bien.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: