Delgado Ávila, EnriqueRubino, Samuele2024-12-182024-12-182024-06-03Quintela González, F. (2024). Optimización Matemática y Machine Learning para la predicción de resultados futbolísticos. (Trabajo Fin de Grado Inédito). Universidad de Sevilla, Sevilla.https://hdl.handle.net/11441/165922El objetivo de este trabajo es aplicar métodos propios del Machine Learning para la simulación y predicción de los resultados de la temporada 2023-2024 de la liga española de fútbol. Para ello, en primer lugar serán introducidos y desarrollados conceptos teóricos relativos al aprendizaje estadístico. A partir de ellos veremos las claves para entender por qué los modelos regresivos dan buenas predicciones si son aplicados adecuadamente, y además obtendremos los criterios necesarios para la elegir un modelo regresivo que sea adecuado, como puede ser la minimización del error de generalización. Una parte fundamental en la implementación de modelos regresivos en el Machine Learning es la optimización matemática, es decir la resolución de problemas de optimización. Por tanto, gran parte del marco teórico consistirá en la introducción y desarrollo de estos conceptos teóricos. Además, se presentarán dos tipos de problemas de optimización que son cruciales para la consecución de un modelo estadístico fiable, los problemas de mínimos cuadrados y los problemas de programación cuadrática. Para la aplicación efectiva del modelo de aprendizaje estadístico se recurre a la metodología FiveThirtyEight, con algunas modificaciones. Los creadores de este método facilitan además un marco de datos que será utilizado como muestra en nuestro modelo predictivo. El modelo a desarrollar partirá de estos datos para intentar predecir de la manera más correcta posible, la clasificación final de los equipos de la liga al finalizar la temporada 2023-2024, no solo mediante la predicción de variables utilizando modelos regresivos, sino también a través de la simulación de temporadas completas, que nos permitirán dotar de aleatoriedad a nuestro modelo, tal y como ocurre en la realidad. Para ello se han realizado todas y cada una de las etapas necesarias en la construcción de un modelo de aprendizaje estadístico, como la depuración de datos, la elección de modelos regresivos adecuados o la predicción de variables regresivas. Como conclusión, se muestran los resultados obtenidos, es decir, la tabla clasificatoria predicha por el modelo, y se comparan con los resultados reales de la temporada en cuestión.The objective of this work is to apply Machine Learning methods to simulate and predict the results of the 2023-2024 season of the Spanish football league. To achieve this, we will first introduce and develop theoretical concepts related to statistical learning. Based on these concepts, we will understand the key reasons why regression models provide good predictions when applied correctly and obtain the necessary criteria to choose an appropriate regression model, such as minimizing generalization error. A fundamental part of implementing regression models in Machine Learning is mathematical optimization, which involves solving optimization problems. Therefore, a significant portion of the theoretical framework will consist of introducing and developing these theoretical concepts. Additionally, we will present two types of optimization problems that are crucial for achieving a reliable statistical model: least squares problems and quadratic programming problems. For the effective application of the statistical learning model, we will use the FiveThirtyEight methodology, with some modifications. The creators of this method also provide a data framework that will be used as a sample in our predictive model. The model to be developed will start from this data to try to predict the final classification of the league teams as accurately as possible by the end of the 2023-2024 season. This will be done not only by predicting variables using regression models but also by simulating entire seasons, which will introduce randomness into our model, as occurs in reality. All the necessary steps in building a statistical learning model have been carried out, such as data cleaning, selecting appropriate regression models or predicting regressive variables. Finally, the obtained results are shown, specifically the predicted league standings by the model, and these are compared with the actual results of the season in question.application/pdf106 p.spaAttribution-NonCommercial-NoDerivatives 4.0 Internationalhttp://creativecommons.org/licenses/by-nc-nd/4.0/Optimización Matemática y Machine Learning para la predicción de resultados futbolísticosinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/openAccess