Trabajo Fin de Grado
Herramienta para segmentación de líneas de texto en imágenes basada en Deep Learning
Autor/es | Mendoza Sánchez, José Luis |
Director | Murillo Fuentes, Juan José |
Departamento | Universidad de Sevilla. Departamento de Teoría de la Señal y Comunicaciones |
Fecha de publicación | 2020 |
Fecha de depósito | 2020-10-14 |
Titulación | Universidad de Sevilla. Grado en Ingeniería de las Tecnologías de Telecomunicación |
Resumen | Este proyecto trata de utilizar las ventajas de la Inteligencia Artificial y el Deep Learning para la creación de una herramienta capaz de segmentar las líneas de un texto. La utilidad de esta herramienta radica principalmente ... Este proyecto trata de utilizar las ventajas de la Inteligencia Artificial y el Deep Learning para la creación de una herramienta capaz de segmentar las líneas de un texto. La utilidad de esta herramienta radica principalmente en conformar la primera pieza de un programa mayor, como por ejemplo uno de reconocimiento óptico de caracteres, o cualquier otra en la que se necesite distinguir las líneas de un texto manuscrito. Estas herramientas tienen aplicación a nivel mundial en ámbitos que abarcan desde la digitalización de documentos antiguos hasta la traducción simultánea de texto manuscrito. Para el código, hemos utilizado principalmente las bibliotecas Keras y TensorFlow 2.0 de Python, junto con muchas otras como Numpy, Matplotlib, Scipy o OpenCV2 para el tratamiento digital de imágenes. La base de datos utilizada para el entrenamiento ha sido la que se ofreció a los concursantes del ICDAR 2013 Handwriting Segmentation Contest. Además, esta memoria intenta documentar el proceso seguido, de manera que el lector pueda tomarla como una guía para su propio proyecto de Machine Learning, entender los fallos que se han cometido y evitarlos a toda costa. También encontrará un capítulo entero donde encontrará un listado de referencias que han sido útiles para aprender esta tecnología partiendo de cero, además de otros conceptos que hemos preferido explicar por nosotros mismos. This project tries to take advantage of the Artificial Intelligence and Deep learning technologies for the creation of a tool to segment the lines of a text. The utility of this tool consists mainly in being the first piece ... This project tries to take advantage of the Artificial Intelligence and Deep learning technologies for the creation of a tool to segment the lines of a text. The utility of this tool consists mainly in being the first piece of a bigger one, like an Optical Character Recognition software (OCR) or any other one which needs to distinguish the lines of a handwritten text. These are the tools used all over the world for different applications varying from old handwritten documents digitalization to simultaneous translation of texts. For the code, we have used mainly the Keras and TensorFlow2.0 frameworks for Python, along with other libraries like Numpy, Matplotlib, Scipy and OpenCV2 for digital image processing. The dataset used for the training has been the one given to the participants of the ICDAR 2013 Handwriting Segmentation Contest. Also, this memory tries to keep record of the process, so that the reader can take it as a guide for his or her own Machine Learning project, understand the mistakes made and avoid them at all costs. The reader will also find a whole chapter, the second one, where he or she would encounter a list of references useful for learning this technology from scratch, in addition to some other ideas we have preferred to explain ourselves. |
Cita | Mendoza Sánchez, J.L. (2020). Herramienta para segmentación de líneas de texto en imágenes basada en Deep Learning. (Trabajo Fin de Grado Inédito). Universidad de Sevilla, Sevilla. |
Ficheros | Tamaño | Formato | Ver | Descripción |
---|---|---|---|---|
TFG-2857-MENDOZA SANCHEZ.pdf | 7.771Mb | [PDF] | Ver/ | |