Trabajo Fin de Máster
Estructura DL para reconocimiento de escritura manuscrita
Autor/es | Moreno Casanova, Julia |
Director | Murillo Fuentes, Juan José
Aradillas Jaramillo, José Carlos |
Departamento | Universidad de Sevilla. Departamento de Teoría de la Señal y Comunicaciones |
Fecha de publicación | 2021 |
Fecha de depósito | 2021-08-17 |
Titulación | Universidad de Sevilla. Máster en Ingeniería de Telecomunicación |
Resumen | En este Trabajo Fin de Máster, se plantea una estructura de Deep Learning orientada al reconocimiento de escritura manuscrita. Esta estructura, la podemos definir como una especie de sistema encargado de segmentar las ... En este Trabajo Fin de Máster, se plantea una estructura de Deep Learning orientada al reconocimiento de escritura manuscrita. Esta estructura, la podemos definir como una especie de sistema encargado de segmentar las líneas de una imagen de texto que le pasemos como entrada. Evidentemente, la salida de este sistema, es decir, la imagen segmentada, podría emplearse como entrada en sistemas de reconocimiento óptico de caracteres, sistemas de transcripción de texto, o cualquier otro que requiera que las líneas de un documento manuscrito deban estar delimitadas. Por tanto, el tipo de algoritmo que planteamos, desarrolla una tarea muy importante, pues ayuda a que un texto manuscrito se pueda digitalizar, y así poder aplicarle los mismos algoritmos de automatización que se emplean para documentos escritos a ordenador. El código, donde se plasma este sistema, se ha elaborado, principalmente, haciendo uso de las bibliotecas Keras y TensorFlow 2.0 de Python, Numpy, OpenCV2, Scipy, entre otras. Además, se han empleado dos bases de datos para el entrenamiento del algoritmo propuesto: la ICDAR 2013 [14], ya utilizada por [3] (referencia base para el desarrollo de nuestro proyecto), y la DIVA-HisDB [17], para la que es necesario llevar a cabo un proceso de adaptación. Finalmente, decir que, en este trabajo, se recogen y explican, paso a paso, todos los procesos que realiza el algoritmo propuesto, así como los resultados extraídos del mismo, sus errores y posibles mejoras. In this Master Thesis, we propose a Deep Learning structure oriented to handwriting recognition. This structure can be defined as a kind of system in charge of segmenting the lines of a text image that we pass it as input. ... In this Master Thesis, we propose a Deep Learning structure oriented to handwriting recognition. This structure can be defined as a kind of system in charge of segmenting the lines of a text image that we pass it as input. Obviously, the output of this system, i.e. the segmented image, could be used as input in optical character recognition systems, text transcription systems, or any other system that requires the lines of a handwritten document to be delimited. Therefore, the type of algorithm we are proposing performs a very important task, as it helps to digitise a handwritten text, so that the same automation algorithms that are used for computer-written documents can be applied to it. The code, which embodies this system, has been developed mainly using the Python libraries Keras and TensorFlow 2.0, Numpy, OpenCV2, Scipy, among others. In addition, two databases have been used to train the proposed algorithm: ICDAR 2013 [14], already used by [3] (a basic reference for the development of our project), and DIVA-HisDB [17], for which it is necessary to carry out an adaptation process. Finally, this work includes and explains, step by step, all the processes carried out by the proposed algorithm, as well as the results extracted from it, its errors and possible improvements. |
Cita | Moreno Casanova, J. (2021). Estructura DL para reconocimiento de escritura manuscrita. (Trabajo Fin de Máster Inédito). Universidad de Sevilla, Sevilla. |
Ficheros | Tamaño | Formato | Ver | Descripción |
---|---|---|---|---|
TFM-2012-MORENO CASANOVA.pdf | 9.056Mb | [PDF] | Ver/ | |