Simois Tirado, Francisco JoséCarpio de la Fuente, José Alfonso2025-07-152025-07-152025Carpio de la Fuente, J.A. (2025). Predicción de la probabilidad de inundaciones utilizando técnicas de inteligencia artificial. (Trabajo Fin de Grado Inédito). Universidad de Sevilla, Sevilla.https://hdl.handle.net/11441/175336En este Trabajo de Fin de Grado se abordará el problema de predicción de la probabilidad de inundaciones en distintas regiones utilizando técnicas de aprendizaje automático. Para ello se ha trabajado con un dataset extraído de la plataforma Kaggle que contiene más de un millón de muestras etiquetadas con 21 variables relacionadas con factores de riesgo. Se han implementado y comparado tres algoritmos principales: K-Nearest Neighbors (KNN), Random Forest (basado en Decision Trees) y Adaboost. Además, se ha realizado un análisis exploratorio de los datos (EDA) para ver la naturaleza y comportamiento de los mismos y una selección de características y ajuste de hiperparámetros mediante técnicas como RFE y GridSearchCV. El número de muestras usado implica obtener mejor o peores resultados, haciendo que cuando se usan todas las muestras se obtengan mucho mejores resultados que al usar un número acotado de estas obtenidos por RFE. Era algo de esperar ya que al tener más información nuestra predicción iba a ser más exacta. En cuanto al uso de los diferentes algoritmos, encontramos que el algoritmo a priori más sencillo, en este caso el KNN, es el más completo basándonos en las paramétricas usadas para las evaluaciones. No obstante, solo valorando el tema de la paramétrica principal (R²) se obtendría el mejor resultado con el algoritmo más complejo, Adaboost, el único algoritmo de boosting, siendo a priori algo lógico ya que este tipo de algoritmos te aseguran un mayor rendimiento. Estos resultados demuestran el potencial del aprendizaje automático para ayudar en la detección temprana de riesgos de inundación, lo cual puede tener un impacto relevante en la prevención de desastres naturales.In this Final Degree Project we will address the problem of predicting the probability of flooding in different regions using machine learning techniques. For this purpose, we have worked with a dataset extracted from the Kaggle platform containing more than one million samples labeled with 21 variables related to risk factors. Three main algorithms have been implemented and compared: K-Nearest Neighbors (KNN), Random Forest (based on Decision Trees) and Adaboost. In addition, an exploratory data analysis (EDA) has been performed to see the nature and behavior of the data and a feature selection and hyperparameter fitting using techniques such as RFE and GridSearchCV. The number of samples used implies obtaining better or worse results, making that when all samples are used, much better results are obtained than when using a limited number of samples obtained by RFE. This was to be expected since having more information would make our prediction more accurate. Regarding the use of the different algorithms, we found that a priori simplest algorithm, in this case KNN, is the most complete based on the parametrics used for the evaluations. However, only by evaluating the main parametric (R²) would the best result be obtained with the most complex algorithm, Adaboost, the only boosting algorithm, which is a priori logical since this type of algorithm ensures higher performance. These results demonstrate the potential of machine learning to help in the early detection of flood risks, which can have a relevant impact on the prevention of natural disasters.application/pdf76 p.spaAttribution-NonCommercial-NoDerivatives 4.0 Internationalhttp://creativecommons.org/licenses/by-nc-nd/4.0/Predicción de la probabilidad de inundaciones utilizando técnicas de inteligencia artificialinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/openAccess