Doble Grado en Matemáticas y Estadística

URI permanente para esta colecciónhttps://hdl.handle.net/11441/77614

Examinar

Envíos recientes

Mostrando 1 - 20 de 53
  • Acceso AbiertoTrabajo Fin de Grado
    Análisis de supervivencia a través de árboles de decisión
    (2024-06-05) Tirado Carballo, José Antonio; Muñoz Pichardo, Juan Manuel
    El análisis de datos es una herramienta esencial en diversas disciplinas, permitiendo extraer información valiosa y realizar predicciones basadas en datos históricos. Entre las múltiples técnicas disponibles, los árboles de decisión se destacan por su simplicidad, interpretabilidad y versatilidad. Este trabajo de fin de grado se centra en los ´arboles de supervivencia, abordando su base en los árboles de decisión. En el capítulo 1. Introducción, se realiza una breve introducción a los árboles de decisión y su aplicabilidad en el estudio del análisis de supervivencia. En el capítulo 2. Arboles de decisión ´ , comenzamos con una introducción general que da paso a la discusión sobre árboles de regresión y árboles de clasificación, detallando los procesos de construcción y poda de estos modelos. Además, exploramos las ventajas y desventajas inherentes a los árboles de decisión, ofreciendo una visión equilibrada sobre cuándo y cómo utilizarlos de manera efectiva. Esta sección también incluye una introducción al análisis con datos censurados, preparando el terreno para la discusión más especializada en árboles de supervivencia. En el capítulo 3. Bosques aleatorios de supervivencia, se amplía el horizonte de los métodos basados en árboles introduciendo los métodos de ensemble, como bagging y random forests. Aquí, se analiza cómo la combinación de múltiples ´arboles puede llevar a una mejora significativa en la precisión de las predicciones. Además, se presentan conceptos cruciales como el error out-of-bag y la importancia de los predictores, con subsecciones específicas que abordan la función de riesgo acumulada y el error de predicción en bosques de supervivencia. A pesar de que los árboles de supervivencia constituyen el núcleo de este trabajo, considero oportuno incluir una discusión sobre los bosques. Los bosques, al combinar múltiples árboles y agregar aleatoriedad en su construcción, no solo mejoran la robustez y la precisión de los modelos, sino que también permiten manejar mejor la variabilidad en los datos y las interacciones complejas entre variables. Esta sección es fundamental para entender cómo se pueden superar algunas limitaciones de los árboles de decisión individuales. Finalmente, en el capítulo 4. Ilustraciones con R Program, proporcionamos una serie de ejemplos prácticos que ilustran la implementación de ´arboles y bosques de supervivencia en R, aplicando los conceptos discutidos.
  • Acceso AbiertoTrabajo Fin de Grado
    Optimización Matemática y Machine Learning para la predicción de resultados futbolísticos
    (2024-06-03) Quintela González, Fernando; Delgado Ávila, Enrique; Rubino, Samuele
    El objetivo de este trabajo es aplicar métodos propios del Machine Learning para la simulación y predicción de los resultados de la temporada 2023-2024 de la liga española de fútbol. Para ello, en primer lugar serán introducidos y desarrollados conceptos teóricos relativos al aprendizaje estadístico. A partir de ellos veremos las claves para entender por qué los modelos regresivos dan buenas predicciones si son aplicados adecuadamente, y además obtendremos los criterios necesarios para la elegir un modelo regresivo que sea adecuado, como puede ser la minimización del error de generalización. Una parte fundamental en la implementación de modelos regresivos en el Machine Learning es la optimización matemática, es decir la resolución de problemas de optimización. Por tanto, gran parte del marco teórico consistirá en la introducción y desarrollo de estos conceptos teóricos. Además, se presentarán dos tipos de problemas de optimización que son cruciales para la consecución de un modelo estadístico fiable, los problemas de mínimos cuadrados y los problemas de programación cuadrática. Para la aplicación efectiva del modelo de aprendizaje estadístico se recurre a la metodología FiveThirtyEight, con algunas modificaciones. Los creadores de este método facilitan además un marco de datos que será utilizado como muestra en nuestro modelo predictivo. El modelo a desarrollar partirá de estos datos para intentar predecir de la manera más correcta posible, la clasificación final de los equipos de la liga al finalizar la temporada 2023-2024, no solo mediante la predicción de variables utilizando modelos regresivos, sino también a través de la simulación de temporadas completas, que nos permitirán dotar de aleatoriedad a nuestro modelo, tal y como ocurre en la realidad. Para ello se han realizado todas y cada una de las etapas necesarias en la construcción de un modelo de aprendizaje estadístico, como la depuración de datos, la elección de modelos regresivos adecuados o la predicción de variables regresivas. Como conclusión, se muestran los resultados obtenidos, es decir, la tabla clasificatoria predicha por el modelo, y se comparan con los resultados reales de la temporada en cuestión.
  • Acceso AbiertoTrabajo Fin de Grado
    Aleatorización adaptativa de covariables en ensayos clínicos
    (2024-06-03) González Acosta, Melisa; Muñoz Reyes, Ana María
    En los ensayos clínicos es habitual utilizar métodos de aleatorización para asignar los pacientes a los distintos tratamientos. Los métodos de aleatorización adaptativa de covariables son métodos de aleatorización que se han ido desarrollando en los últimos años, tras observar que los métodos de aleatorización tradicionales estaban dando ciertos problemas. Concretamente, los métodos de aleatorización adaptativa de covariables aprovechan las características de los distintos pacientes, de manera que se asignan secuencialmente según las características de los anteriores pacientes. Desarrollamos algunos de estos métodos junto con aspectos teóricos de los mismos, así como presentamos una ilustración de la librería carat de R, que trabaja con todos ellos.
  • Acceso AbiertoTrabajo Fin de Grado
    Competiciones en Kaggle: predicción de la calidad de la escritura
    (2024-06-05) Medina Gordillo, Elena; Romero Jiménez, Álvaro
    El objetivo de este trabajo es aplicar los conocimientos adquiridos durante la carrera en la construcción de modelos predictivos que permitan afrontar la realización de competiciones de ciencia del dato, como las disponibles en la plataforma Kaggle. En primer lugar, para familiarizarme con el funcionamiento de esa plataforma realicé una competición sencilla, que pedía predecir la supervivencia o no de los pasajeros del famoso trasantlántico Titanic, tristemente naufragado el 14 de abril de 1912. Sin embargo, el auténtico trabajo realizado ha consistido en abordar una competición más compleja, organizada por la Universidad de Vanderbilt y The Learning Agency Lab, que buscaba explorar la relación entre comportamiento de escritura y calidad de texto. Esta competición pedía predecir la calidad de un escrito a partir del comportamiento de tecleo durante el proceso de redacción. Para ello, proporcionaba un gran conjunto de registros de pulsaciones de teclas capturando características del proceso de escritura. El objetivo último de la competición era tratar de aportar perspectivas útiles para la enseñanza de la escritura, el desarrollo de técnicas de evaluación automatizadas y sistemas de tutoría inteligente.
  • Acceso AbiertoTrabajo Fin de Grado
    Métodos estadísticos y de simulación para el análisis de colas
    (2024-06-04) Jiménez Ordóñez, Javier; Pino Mejías, José Luis
    Este trabajo de fin de grado aborda la teoría de colas, una rama de la investigación operativa y la probabilidad, fundamental para el estudio y la optimización de sistemas donde se gestionan esperas. En primer lugar, se introduce el concepto de procesos estocásticos y se profundiza en los procesos de Markov y diversas distribuciones de probabilidad, como la determinística, exponencial, Poisson y Erlang. A continuación, se describe la estructura de un modelo de colas, explicando los parámetros clave y relaciones fundamentales, incluyendo el tiempo de espera y la Ley de Little. Se presentan diversos modelos de colas, haciendo énfasis en tres de los principales modelos markovianos (M/M/1, M/M/k y M/M/k/N) y también se mencionan algunos modelos no markovianos. El siguiente apartado trata sobre la inferencia estadística en los primeros, destacando las particularidades de los procesos estacionarios y ergódicos, la inferencia aplicada a procesos de Markov y los tests de hipótesis. Por último, en la sección de análisis en R, se revisan las librerías queueing, queuecomputer y simmer, mostrando su aplicación práctica para modelizar y analizar sistemas de colas.
  • Acceso AbiertoTrabajo Fin de Grado
    Modelos de predicción de incendios forestales
    (2024-06-05) Baeza Ruiz-Henestrosa, Juan; Valencia Cabrera, Luis; Rodríguez Gallego, José Antonio
    En el presente trabajo fin de estudios se aborda el problema de la predicción diaria de incendios forestales en la Comunidad Autónoma de Andalucía haciendo uso de técnicas de procesamiento de datos espaciales y modelos de Machine Learning. Se fija el marco temporal del estudio entre los años 2002 y 2022. Se consideran 27 variables correspondientes a 6 categorías: antropogénica, meteorológica, topográfica, demográfica, hidrológica y de vegetación. Se usan los perímetros de incendios forestales mayores de 100 ha ocurridos en Andalucía y obtenidos a partir de imágenes satélite y datos de campo disponibles en la Red de Información Ambiental de Andalucía (REDIAM). Se implementan métodos para procesar los conjuntos de datos espaciales recopilados y generar muestras adecuadas para entrenar modelos predictivos, con los cuales se genera una muestra de 21.546 registros que se usa para entrenar los modelos, considerando una partición temporal en entrenamiento-validación-test. Los modelos analizados han sido: Regresión Logística con penalización, Regresión Logística con penalización usando PCA, k-Nearest Neighbours, SVM lineal, SVM radial, Árboles de Decisión y Random Forest. Se han ajustado los valores de los hiperparámetros evaluando el rendimiento sobre el conjunto de validación y se ha comparado el rendimiento de los modelos construidos sobre el conjunto test considerando diversas métricas. Han destacado los modelos de Regresión Logística lasso y SVM, que han obtenido los mejores resultados en el conjunto test. Finalmente, se ha evaluado el desempeño de estos modelos en dos casos prácticos, obteniendo resultados prometedores.
  • Acceso AbiertoTrabajo Fin de Grado
    Métodos Estadísticos en Diagnóstico Clínico
    (2024-10-22) Guerrero Martín, Patricia; Pino Mejías, José Luis; García de las Heras, Joaquín Antonio
    En el presente Trabajo de Fin de Grado se aborda el uso de métodos estadísticos para el diagnóstico de enfermedades. Para ello, en el primer capítulo, hablaremos sobre qué es el diagnóstico clínico y cuales son los procedimientos más comunes actualmente para llevarlo a cabo mediante la estadística y las matemáticas. Tras ello, expondremos las bases teóricas de tres de estas técnicas: el método de k-Vecinos Más Cercanos en el siguiente capítulo y el algoritmo de Árboles de decisión y de Random Forests en sucesivos capítulos. Las tres serán vistas tanto para problemas de clasificación como para problemas de regresión. Los problemas de clasificación tienen como objetivo identificar las características que indican el grupo al que pertenece cada caso. Este patrón se puede utilizar para comprender los datos existentes y para predecir cómo se comportarán las nuevas instancias. La minería de datos crea modelos de clasificación examinando datos ya clasificados (casos) y encontrando por inducción un modelo predictivo. Por otro lado, la regresión se refiere a una tarea en la que el objetivo es predecir un valor numérico continuo basado en uno o más atributos de entrada. Una vez analizada la teoría, se complementa con una aplicación. En esta, se hace un estudio sobre si un individuo presenta o no diabetes de tipo II. Trabajamos sobre una base de datos de la plataforma ‘Kaggle’ con información relativa a un estudio en un grupo de mujeres donde se recogen variables explicativas como la presión arterial, índice de masa corporal. . . y su respectiva variable respuesta acerca de si son sanas o diabéticas. Hemos desarrollado los distintos algoritmos con un conjunto de funciones recogidas en la biblioteca ‘Scikit-Learn’ de Python. Nos quedamos con el mejor y haremos predicciones con nuevos datos.
  • Acceso AbiertoTrabajo Fin de Grado
    Modelos de Predicción para la Detección Prenatal del Síndrome de Down
    (2024-10-24) Hernández Barba, Noelia; Valencia Cabrera, Luis; Orellana Martín, David
    Este trabajo aborda el desarrollo de modelos de clasificación para la detección del síndrome de Down en el primer trimestre del embarazo. Se basa en datos sobre las características físicas de la mujer, como el peso, la edad, la altura y la etnia, así como en datos genéticos del ARN obtenido del plasma fetal, utilizando técnicas de aprendizaje automático que permiten una evaluación más precisa de los riesgos asociados. A lo largo del proceso, se llevan a cabo diferentes etapas. Comenzamos con un análisis descriptivo de los datos, intentando extraer características relevantes y patrones que puedan influir en la detección del síndrome de Down. A continuación, implementamos los modelos de clasificación utilizando tidymodels, lo que nos permite gestionar y optimizar los modelos de manera eficiente. Esta implementación se complementa con una discusión detallada sobre los resultados obtenidos, donde analizamos el rendimiento de cada modelo y su capacidad para discriminar entre las clases. Finalmente, se presentan las conclusiones sobre los objetivos planteados que impulsan el estudio, así como propuestas para mejorar ciertos aspectos en investigaciones futuras.
  • Acceso AbiertoTrabajo Fin de Grado
    Modelos Ocultos de Markov
    (2024-10-22) Ortega Cartelle, Cristina; Pino Mejías, Rafael
    Hidden Markov Models (HMM) are powerful probabilistic tools for analyzing sequential data where observations depend on unobservable internal states. Their flexibility allows them to model a wide range of complex phenomena across various fields, including speech recognition, bioinformatics, finance, and cognitive analysis. HMMs are particularly useful in situations where underlying processes cannot be directly measured, enabling the inference of hidden dynamics from observable data. Over time, these models have proven effective in uncovering hidden patterns, predicting future behaviors, and segmenting time series based on internal states. This work explores the fundamental principles of HMMs and their applicability, emphasizing their value in understanding and representing complex sequential systems.
  • Acceso AbiertoTrabajo Fin de Grado
    Introducción a la Minería de Texto con R
    (2023-10-19) Lobato Cantos, Alejandro; Luque Calvo, Pedro Luis; Universidad de Sevilla. Departamento de Estadística e Investigación Operativa
    En este trabajo se ofrecen unos primeros pasos para introducirse en el campo de la minería de textos, desde una base teórica de las principales tareas hasta una implementación utilizando el software “R”. El objetivo principal es intentar dar una visión general de las tareas de las que se encarga esta rama así como representar algunas de sus aplicaciones. Los resultados y la teoría vienen de una diversidad de fuentes. A la hora de la implementación práctica utilizamos tanto aplicaciones construidas para este trabajo así como una serie de librerías específicas de R creadas para la minería de texto. Las subramas de la minería de texto que se desarrollan en este trabajo son la reducción de dimensionalidad, el resumen de textos, la clasificación de textos y la extracción de información.
  • Acceso AbiertoTrabajo Fin de Grado
    Análisis de conglomerados con series temporales
    (2023-06) Veas Lerdo de Tejada, Mencía; Beato Moreno, Antonio; Universidad de Sevilla. Departamento de Estadística e Investigación Operativa
    El análisis de conglomerados con series temporales es una técnica estadística novedosa y aplicable a numerosos campos como las fi nanzas y las telecomunicaciones. Se trata de agrupar series temporales semejantes. Aquí radica el problema, pues es necesario de finir una distancia entre series temporales que minimice la pérdida de información. Sin embargo, a priori es posible no saber qué metodología se adaptaría mejor a los datos, por ello es esencial hacer un estudio de diferentes distancias y aplicar diferentes métodos de análisis cluster para hacer una comparación de resultados. Para desarrollar esta investigación se han de asentar las bases teóricas mínimas en las que se fundamenta. Por ello, se introducen conceptos de análisis de conglomerdos, de series temporales, así como de distancias y teoría de conjuntos. A continuación, se propone una relación de distancias entre series temporales que tiene en cuenta diferentes aspectos de las mismas, de modo que ninguna de ellas aporta resultados exactamente iguales. Por último, se muestra el código heurístico de cómo aplicar todo lo explicado sobre un conjunto de datos inventado en Python. Además, a título ilustrativo, también se incluye la aplicación real de este procedimiento con datos del Índice de Precios del Consumo (IPC) con el correspondiente análisis de los resultados.
  • Acceso AbiertoTrabajo Fin de Grado
    Forecast combinations
    (2023-06) Tobar Fernández, Cristina; Carrizosa Priego, Emilio José; Universidad de Sevilla. Departamento de Estadística e Investigación Operativa
    In the forecasting community, forecast combinations have grown dramatically. Their uses in time series span a multitude of fields, including assisting in recent years to predict COVID-19 deaths and hospital admissions with excellent accuracy, thus helping the organization of public health in different countries. Since the 1960s, a multitude of studies have confirmed the benefits of using a combination of different base predictions. These base predictions involve a given model. They highlight the improved accuracy of the combination methods, avoiding the need to identify the "best model". Combining techniques range from the simplest to the most challenging methods, including the optimization of different evaluation metrics. There are also many methods to measure the performance and accuracy of our predictions depending on the target of interest. In this thesis the problem of combined point forecasts is addressed, after describing several methods we discuss their application according to the characteristics of our time series and our objectives. Finally, we will conclude with a couple of experiments using different time series in order to empirically test our assumptions. We will also end with a proposal for different research lines for the future.
  • Acceso AbiertoTrabajo Fin de Grado
    Lógica Epistémica Dinámica
    (2023-07) Romero Vinogradov, Alexander; Cordón Franco, Andrés; Universidad de Sevilla. Departamento de Ciencias de la Computación e Inteligencia Artificial
    En este trabajo hacemos un repaso de algunas de las principales propuestas en el área de la lógica epistémica dinámica, rama de la lógica modal: lógica epistémica (interpretada sobre la clase semántica S5), lógica epistémica con anuncios públicos y lógica epistémica probabilística. Se exponen propiedades básicas y conceptos de interés para cada uno de estos sistemas, y se discuten en el contexto de ejemplos, muchos de ellos clásicos, que ponen de manifiesto su relevancia en diversos ámbitos de la realidad práctica. En aras de integrar los sistemas anteriormente mencionados, y en particular la lógica epistémica con anuncios públicos y la lógica epistémica probabilística, se propone una generalización de los anuncios públicos que es coherente con los aspectos probabilísticos de nuestro lenguaje, y se estudian también las propiedades teóricas básicas de esta propuesta. Se discuten varias conjeturas, de las que se espera obtener resultados adicionales en investigaciones futuras, sobre el comportamiento formal de esta nueva construcción.
  • Acceso AbiertoTrabajo Fin de Grado
    Muestreo espacialmente balanceado. Aplicaciones en R
    (2023-06) Ojeda Silva, Cintia María; Muñoz Reyes, Ana María; Universidad de Sevilla. Departamento de Estadística e Investigación Operativa
    Las técnicas de muestreo tradicionales no suelen contemplar las características propias de los datos distribuidos espacialmente, como la dependencia espacial. Vamos a estudiar procedimientos a partir del muestreo aleatorio simple sin reemplazamiento, del muestreo exponencial y del método pivotal, con probabilidades de inclusión iguales o distintas, en los que integraremos la dependencia espacial. El enfoque adoptado nos servirá para corroborar argumentos intuitivos sobre la necesidad de integrar la dependencia en el muestreo. Podemos trabajar en cualquier dimensión, pero en el caso de datos con tendencia espacial, si seleccionamos una muestra bien distribuida (balanceada), conseguiremos mejores estimadores.
  • Acceso AbiertoTrabajo Fin de Grado
    Machine Learning Techniques for Natural Language Processing
    (2023-07) Jareño García, Amparo; Pino Mejías, Rafael; Universidad de Sevilla. Departamento de Estadística e Investigación Operativa
    Language is such a powerful tool that enables communication between humans. However, there have been some barriers, historically, which arose the need for automatisation of linguistic tasks. After overcoming setbacks, a balance between linguistics and computer science was achieved, which was based mainly on artificial intelligence. The objective of this work is to understand the text preprocessing so that machine learning algorithms can be applied to draw insights. For this purpose, we will dive into supervised learning theory together with discriminative and generative algorithms that will be perform text classification tasks: a fake news classifier and a film reviews sentiment analysis. Furthermore, we will explore the variety of purposes and the industrial applications that Natural Language Processing has.
  • Acceso AbiertoTrabajo Fin de Grado
    Aplicación de técnicas estadísticas, matemáticas y de Inteligencia Artificial para la modelización ecológica
    (2023-06) Jáñez Vaz, Magdalena; Valencia Cabrera, Luis; Universidad de Sevilla. Departamento de Ciencias de la Computación e Inteligencia Artificial
    La modelización ecológica trata de comprender y traducir las complejas interacciones presentes en un ecosistema y expresarlas como un modelo matemático de forma más esquematizada de cara a ayudarnos a comprender mejor la realidad que estamos estudiando, explicar mejor su comportamiento ante determinados escenarios de interés y tratar de predecir la respuesta del sistema ante nuevos casos. El presente proyecto trabaja con datos de campo recogidos en el parque natural de Doñana, Huelva, relativos al Cangrejo Rojo Americano, Procambarus clarkii. En él se intentará procesar la información recolectada para presentarla de forma más clara y sencilla, descifrar el comportamiento de las variables implicadas, sus interacciones, vislumbrar patrones de respuesta temporal, así como utilizarla para modelizar distintos aspectos de esta especie y del ecosistema. Al tratarse de una especie invasora, es de interés analizar formas de controlar su población, y poder comprender mejor el desarrollo y comportamiento que tiene en las localizaciones estudiadas. Entre los modelos con los que se trabajará hay algunos dedicados a predecir las capturas en trampas de cangrejos según las condiciones climáticas, lo que nos sirve como una posible estimación del tamaño de la población, así como para poder observar cuál es la tendencia local, global o ante distintos posibles escenarios. Otros modelos se dedican a estudiar características de individuos en concreto como su tamaño, sexo y etapa de madurez. Por último, simplemente matizar que este estudio trata de atacar un problema real, con todo lo que ello conlleva. Al tratarse de una situación auténtica, el interés es mayor, ya que puede ayudar a comprender mejor un problema existente que se está enfrentando. Por otro lado, implica un aumento en la dificultad debido a las limitaciones de los datos frente a los conjuntos de datos que suelen darse en problemas ficticios ya preparados para realizar el estudio.
  • Acceso AbiertoTrabajo Fin de Grado
    Estudio matemático-computacional de la producción oleícola en explotaciones agrarias
    (2023-07) Bejarano Segado, Manuel; Valencia Cabrera, Luis; Universidad de Sevilla. Departamento de Ciencias de la Computación e Inteligencia Artificial
    En este trabajo se ha llevado a cabo a través del lenguaje R, a través del entorno RStudio, un análisis exhaustivo de los datos de producción de aceite de oliva, utilizando métodos matemáticos y modelos computacionales avanzados. Se han aplicado técnicas de análisis de series temporales, modelización estadística y aprendizaje automático para comprender los factores que influyen en la producción y realizar predicciones precisas. El enfoque multidisciplinario adoptado en este estudio ha permitido integrar conceptos y herramientas de las ciencias matemáticas y de la computación, en combinación con el conocimiento agrícola y los datos empíricos recopilados. Esto ha posibilitado una visión integral y enriquecedora de la producción oleícola, proporcionando nuevas perspectivas y oportunidades para mejorar los procesos y la toma de decisiones en el sector. Se han explorado diferentes enfoques estadísticos y de aprendizaje automático para comprender la naturaleza de las variables, identificar interacciones significativas y desarrollar modelos predictivos precisos. Los resultados obtenidos han proporcionado un mayor conocimiento sobre el tema y han permitido realizar aportaciones relevantes al campo de estudio. Se han planteado las conclusiones derivadas del estudio y posibles trabajos futuros para ampliar la investigación en esta área.
  • Acceso AbiertoTrabajo Fin de Grado
    Algebraic tools in quantum computing algorithms
    (2023) Absalom Bautista, Lucía; Tornero Sánchez, José María; Universidad de Sevilla. Departamento de Álgebra
    Universal quantum gates play a crucial role in quantum computing as they form the building blocks for quantum circuits. Unlike classical circuits which are made up of classical gates such as AND, OR, and NOT gates, quantum circuits are composed of quantum gates that operate on qubits instead of classical bits. These gates can be used to perform various operations on qubits such as rotations, phase shifts, and entanglement, allowing for the execution of quantum algorithms. In this dissertation, we will explore the fundamental principles behind universal quantum gates and their significance in quantum computing.We will examine the various types of quantum gates including the single-qubit gates such as the Hadamard gate, Pauli gates, and phase gates, as well as the multi-qubit gates such as the ????? gate. This work aims to provide an introductory overview of universal quantum gates and their applications in quantum computing, leaving aside the current state of the art in research and development of quantum gate technology. We hope that this dissertation will shed some light on the ongoing effort to build more powerful and reliable quantum computers that will pave the way for groundbreaking advances in a variety of fields, including cryptography, chemistry, and optimization.
  • Acceso AbiertoTrabajo Fin de Grado
    Reconocimiento de imágenes con TensorFlow desde R
    (2022-06-07) Quirós Pérez, Francisco de Paula; Luque Calvo, Pedro Luis; Universidad de Sevilla. Departamento de Estadística e Investigación Operativa
    La presente investigación se refiere al aprendizaje automático, definido como un tipo de inteligencia artificial que proporciona a los ordenadores la capacidad de aprender centrándose en el desarrollo de programas informáticos y que haga que estos actúen de distinta forma en función de los datos expuestos. La prioridad es utilizar herramientas que nos permitan desarrollar dicho aprendizaje en el reconocimiento y clasificación de imágenes y todo ello en torno a la introducción de las redes neuronales convolucionales, lo cual, supone un antes y un después en el concepto de automatización, como veremos. Conoceremos el funcionamiento de dichas redes desde dentro con la formulación matemática que se lleva a cabo en cada capa y cómo la lectura idónea ante cualquier anomalía en una neruona será desde la última capa a la primera. Para un análisis en profundidad, necesitamos echar la vista atrás y observar cuánto ha avanzado la tecnología en este terreno desde mediados del siglo XX, desde el primer momento en el que se consideró oportuno un símil entre la red de neuronas de nuestro cerebro y el funcionamiento interno de programas informáticos. La finalidad será, por tanto, avanzar en la historia de las redes neuronales desde sus inicios, saber cómo funcionan y qué grandes progresos se han hecho recientemente para, más tarde, exponer ejemplos sencillos de aplicación de redes neruonales convolucionales a la creación, entrenamiento, compilación y predicción de un modelo de redes neruonales capaz de clasificar imágenes, apoyados en paquetes de aprendizaje automático como Keras o TensorFlow y a través de R.
  • Acceso AbiertoTrabajo Fin de Grado
    Evaluación de la Información demográfica publicada en los ayuntamientos de Andalucía
    (2022-06-06) Blázquez Molino, Álvaro; Luque Calvo, Pedro Luis; Universidad de Sevilla. Departamento de Estadística e Investigación Operativa
    En este Trabajo Fin de Grado se estudiarán las páginas web de los ayuntamientos andaluces de más de 50.000 habitantes para elaborar varias clasificaciones de las páginas web de mejor a peor, y así ver cuáles son los mejores y peores, qué cosas se hacen bien y qué otras se pueden mejorar. Se aplicarán métodos de Teoría de la Decisión a los datos recogidos de las páginas web para elaborar los rankings. Los procedimientos serán explicados y ofrecerán resultados, que serán analizados individual y conjuntamente para extraer las conclusiones finales.