Trabajo Fin de Máster
Modelos de atención para la transcripción de textos manuscritos históricos
Autor/es | García González, Luis |
Director | Aradillas Jaramillo, José Carlos
Murillo Fuentes, Juan José |
Departamento | Universidad de Sevilla. Departamento de Teoría de la Señal y Comunicaciones |
Fecha de publicación | 2020 |
Fecha de depósito | 2020-09-07 |
Titulación | Universidad de Sevilla. Máster en Ingeniería de Telecomunicación |
Resumen | La transcripción de texto manuscrito es una tarea que cobra importancia a la par de la necesidad de conservar todo el conocimiento e historia que esconden los textos antiguos. La mayoría de los textos importantes de autores ... La transcripción de texto manuscrito es una tarea que cobra importancia a la par de la necesidad de conservar todo el conocimiento e historia que esconden los textos antiguos. La mayoría de los textos importantes de autores reputados llevan tiempo transcritos a texto digital, pero la ingente cantidad de textos menores o específicos sólo son abarcables con procesos industrializados, en este caso a través de software automático. La automatización que se trata en este proyecto es una automatización a través de modelos de deep learning, los cuales se basan en redes neuronales. Esta automatización se lleva a cabo a partir de una imagen digitalizada del texto manuscrito, realizada manualmente, por lo que esta técnica no puede conocerse como una automatización pura. Desde la aparición del OCR, son numerosos los autores que han propuesto modelos varios para dar solución a este problema. Estas soluciones abarcan desde reconocimiento de caracteres hasta reconocimiento de frases completas. El objetivo de este proyecto es presentar una solución basada en modelos de atención. De esta manera se propone que la dependencia de la transcripción realizada de los caracteres anteriores y posteriores al que ocupa en cada momento puede aportar claridad y exactitud a la transcripción del mismo, información que va más allá de las propias características que presenta la imagen de cada caracter. The transcription of handwritten text takes on the importance of preserving all the knowledge and history hidden in ancient texts. Most of the known texts or those of reputed authors have been transcribed into digital text ... The transcription of handwritten text takes on the importance of preserving all the knowledge and history hidden in ancient texts. Most of the known texts or those of reputed authors have been transcribed into digital text for a long time, but the huge amount of minor or specific texts can only be covered by industrialized processes, in this case through automatic software. The automation dealt with in this project is automation through deep learning models, which are based on neural networks. This automation is carried out from a digitized image of the handwritten text, which must be done by hand, so this technique cannot be known as pure automation. Since the emergence of OCR, many authors have proposed various models to solve this problem. These solutions range from character recognition to full sentence recognition. The aim of this project is to present a solution based on the attention model. In this way, it is proposed that the dependence of the transcription made of the characters next to the one it occupies at each moment can contribute to the clarity and accuracy of the transcription, thus providing information beyond the own characteristics that it presents in the image of each character. |
Cita | García González, L. (2020). Modelos de atención para la transcripción de textos manuscritos históricos. (Trabajo Fin de Máster Inédito). Universidad de Sevilla, Sevilla. |
Ficheros | Tamaño | Formato | Ver | Descripción |
---|---|---|---|---|
TFM-1649-GARCIA GONZALEZ.pdf | 1.815Mb | [PDF] | Ver/ | |