Ir al contenido

Documat


Resumen de Reconocimiento de texto manuscrito continuo

Alejandro Hector Toselli Árbol académico

  • Esta tesis tiene como línea general el estudio e implementación de un sistema de reconocimiento automático de texto manuscrito, basado en la actualmente exitosa tecnología de Reconocimiento del Habla (RH).

    Se comienza con la implementación de un sistema de reconocimiento de caracteres manuscritos aislados, basados en los "Modelos de Markov de Capa Oculta" (HMMs). En el mismo se prueban diferentes métodos de normalización de estilos (inclinación y altura), y diferentes conjuntos de extracciones de características adecuadas para su uso con los HMMs. En los experimentos se consiguen resultados comparables con otras aproximaciones sobre el mismo corpus de muestras.

    A continuación se implementa un sistema de reconocimiento de texto manuscrito continuo (RTM) para una tarea de reconocimiento de cantidades numéricas escritas mediante texto en castellano. El corpus utilizado se compone de muestras obtenidas en el laboratorio en condiciones controladas, y dispone de un léxico comparativamente pequeño. Se prueban diferentes técnicas de preproceso para normalización de los atributos de estilo de las frases (pendiente de línea base, inclinación vertical y altura). Se realiza el reconocimiento global de las frases, sin aplicar ningún tipo de segmentación previa explícita de sus elementos componentes (palabras y/o caracteres), basándose en el empleo de diferentes fuentes de conocimiento. Cada una de éstas fuentes rige un grado de percepción diferente en la formación correcta de frases; morfológico, léxico y sintáctico. Todas ellas son modeladas por máquinas de estados finitos (MEF), permitiendo ser integradas fácilmente entre si y posibilitando una inter-cooperación eficaz entre las mismas.

    Para el modelo sintáctico (de lenguajes) se utiliza tanto un autómata de estados finitos construido manualmente, como N-gramas inferidos a partir de las muestras. Con ambos modelos se consiguen resultados de reconocimiento excelentes


Fundación Dialnet

Mi Documat