Mostrar el registro sencillo del ítem

Trabajo Fin de Máster

dc.contributor.advisorMartín Clemente, Rubénes
dc.creatorTrigos Sena, José Maríaes
dc.identifier.citationTrigos Sena, J.M. (2023). Reconocimiento y clasificación de imágenes utilizando técnicas de aprendizaje profundo (Deep Learning). (Trabajo Fin de Máster Inédito). Universidad de Sevilla, Sevilla.
dc.description.abstractApesar de que el texto es uno de los medios de comunicación más antiguos, su importancia y presencia no ha hecho más que crecer. Este crecimiento, sumado a la variedad de formas e idiomas en los que puede aparecer este texto, hace que su identificación manual sea cada vez más compleja. La Inteligencia Artificial y, en concreto, el “Deep Learning” ha permitido el desarrollo de algoritmos basados en redes neuronales que automatizan y aceleran la identificación de texto, facilitando enormemente esta tarea. En este Trabajo Fin de Máster se buscará desarrollar una aplicación que, a través de la webcam, permita detectar texto en la imagen y reconocerlo para escribirlo por pantalla. Esto supone el primer paso para obtener sistemas de identificación automática de texto, que puedan ser usados para la traducción instantánea, por ejemplo. La detección de texto en la imagen será realizada por una algoritmo compuesto por una red neuronal completamente convolucional y un sistema de posprocesado. Este algoritmo recibirá la imagen y devolverá las coordenadas de unas cajas delimitadoras o “bounding boxes” orientadas, que destacará las zonas de la imagen que tienen texto. El reconocimiento del texto detectado se hará usando una red neuronal convolucional de clasificación de caracteres. Por tanto, se necesitará segmentar y ordenar los caracteres que se detecten previamente. El resultado de esta última fase es el texto reconocido, ordenado y corregido, para poder escribirlo por
dc.description.abstractAlthough text is one of the oldest means of communication, its importance and quantity has only grown. This growth, added to the variety of forms and languages in which this text can appear, makes its manual identification increasingly complex. Artificial Intelligence and, in particular, “Deep Learning” has enabled the development of algorithms based on neural networks that automate and accelerate the identification of text, greatly simplifying this task. In this Master Thesis we will seek to develop an application that, through the webcam, can detect text in the image and recognize it, in order to write it on the screen. This is the first step to obtain automatic text identification systems that can be used for instant translation, for example. The text detection in the image will be performed by an algorithm composed of a fully convolutional neural network and a post-processing system. This algorithm will receive the image and return the coordinates of oriented bounding boxes, which will highlight the areas of the image that have text. The recognition of the detected text will be done using a convolutional neural network for character classification. Therefore, it will be necessary to segment and sort the previously detected characters. The result of this last phase is the recognized text, sorted and corrected, in order to be able to write it on the
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacional*
dc.titleReconocimiento y clasificación de imágenes utilizando técnicas de aprendizaje profundo (Deep Learning)es
dc.contributor.affiliationUniversidad de Sevilla. Departamento de Teoría de la Señal y Comunicacioneses
dc.description.degreeUniversidad de Sevilla. Máster en Ingeniería Industriales

TFM2655_Trigos Sena.pdf37.72MbIcon   [PDF] Ver/Abrir  

Este registro aparece en las siguientes colecciones

Mostrar el registro sencillo del ítem

Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Excepto si se señala otra cosa, la licencia del ítem se describe como: Attribution-NonCommercial-NoDerivatives 4.0 Internacional