Trabajo Fin de Máster
Sistema de reconocimiento de imágenes sobre FPGA para aplicaciones de visión artificial
Autor/es | Campos Ramos, Adrián |
Director | Avedillo de Juan, María José
Jiménez Través, Manuel Núñez Martínez, Juan |
Departamento | Universidad de Sevilla. Departamento de Electrónica y Electromagnetismo |
Fecha de publicación | 2022 |
Fecha de depósito | 2023-01-19 |
Titulación | Universidad de Sevilla. Máster en Microelectrónica: Diseño y Aplicaciones de Sistemas. |
Resumen | Con el transcurrir de los años han surgido numerosas aplicaciones en campos muy
diversos, como la medicina, la seguridad o la educación, que hacen uso de la visión
artificial. Muchas de estas aplicaciones requieren la ... Con el transcurrir de los años han surgido numerosas aplicaciones en campos muy diversos, como la medicina, la seguridad o la educación, que hacen uso de la visión artificial. Muchas de estas aplicaciones requieren la detección e identificación de objetos o personas. Las redes neuronales, y en particular las redes neuronales convolucionales, han demostrado su utilidad para estas tareas y han permitido un desarrollo muy significativo de este campo. Sin embargo, a veces es mucho más simple y efectivo aplicar soluciones ya conocidas del campo de Machine Learning. Los dispositivos Zynq All Programmable System on Chip (AP SoC) pueden llegar a ser muy efectivos. La posibilidad de dividir el trabajo entre la lógica programable y su sistema de procesamiento nos presenta una solución factible para la implementación de grandes algoritmos y mayor velocidad que la ejecución total en un sistema de procesamiento. Este Trabajo Fin de Master (TFM) aborda la implementación de un sistema para el reconocimiento de imágenes de dígitos manuscritos (0-9) sobre la placa de desarrollo Pynq-Z2 que incorpora un dispositivo AP SoC de la familia Zynq de Xilinx. El desarrollo se ha realizado en el entorno PYNQ, que permite el uso de aceleradores hardware desde Python. De esta forma se han implementado funciones aceleradas en hardware que son llamada desde Python. El acelerador almacena un conjunto de imágenes de referencia con las que comparar la imagen a clasificar, identificando la más próxima. Esto es, se implementa para la clasificación un algoritmo del “vecino más próximo”. La selección de las imágenes de referencia aplicando otro algoritmo clásico, el k-means, permite obtener soluciones con un compromiso satisfactorio entre tiempo de inferencia, accuracy (precisión) y recursos utilizados. Además, se realiza una comparación con un sistema que utiliza redes neuronales binarias. La funcionalidad del sistema desarrollado se demuestra mediante la ejecución de un documento interactivo (Jupyter Notebooks) accesibles a través de una interfaz web. |
Cita | Campos Ramos, A. (2022). Sistema de reconocimiento de imágenes sobre FPGA para aplicaciones de visión artificial. (Trabajo Fin de Máster Inédito). Universidad de Sevilla, Sevilla. |
Ficheros | Tamaño | Formato | Ver | Descripción |
---|---|---|---|---|
CAMPOS RAMOS, ADRIAN.pdf | 1.951Mb | [PDF] | Ver/ | |