Muñoz Pichardo, Juan ManuelTirado Carballo, José Antonio2024-12-182024-12-182024-06-05Tirado Carballo, J.A. (2024). Análisis de supervivencia a través de árboles de decisión. (Trabajo Fin de Grado Inédito). Universidad de Sevilla, Sevilla.https://hdl.handle.net/11441/165924El análisis de datos es una herramienta esencial en diversas disciplinas, permitiendo extraer información valiosa y realizar predicciones basadas en datos históricos. Entre las múltiples técnicas disponibles, los árboles de decisión se destacan por su simplicidad, interpretabilidad y versatilidad. Este trabajo de fin de grado se centra en los ´arboles de supervivencia, abordando su base en los árboles de decisión. En el capítulo 1. Introducción, se realiza una breve introducción a los árboles de decisión y su aplicabilidad en el estudio del análisis de supervivencia. En el capítulo 2. Arboles de decisión ´ , comenzamos con una introducción general que da paso a la discusión sobre árboles de regresión y árboles de clasificación, detallando los procesos de construcción y poda de estos modelos. Además, exploramos las ventajas y desventajas inherentes a los árboles de decisión, ofreciendo una visión equilibrada sobre cuándo y cómo utilizarlos de manera efectiva. Esta sección también incluye una introducción al análisis con datos censurados, preparando el terreno para la discusión más especializada en árboles de supervivencia. En el capítulo 3. Bosques aleatorios de supervivencia, se amplía el horizonte de los métodos basados en árboles introduciendo los métodos de ensemble, como bagging y random forests. Aquí, se analiza cómo la combinación de múltiples ´arboles puede llevar a una mejora significativa en la precisión de las predicciones. Además, se presentan conceptos cruciales como el error out-of-bag y la importancia de los predictores, con subsecciones específicas que abordan la función de riesgo acumulada y el error de predicción en bosques de supervivencia. A pesar de que los árboles de supervivencia constituyen el núcleo de este trabajo, considero oportuno incluir una discusión sobre los bosques. Los bosques, al combinar múltiples árboles y agregar aleatoriedad en su construcción, no solo mejoran la robustez y la precisión de los modelos, sino que también permiten manejar mejor la variabilidad en los datos y las interacciones complejas entre variables. Esta sección es fundamental para entender cómo se pueden superar algunas limitaciones de los árboles de decisión individuales. Finalmente, en el capítulo 4. Ilustraciones con R Program, proporcionamos una serie de ejemplos prácticos que ilustran la implementación de ´arboles y bosques de supervivencia en R, aplicando los conceptos discutidos.Data analysis is an essential tool in various disciplines, enabling the extraction of valuable information and making predictions based on historical data. Among the many available techniques, decision trees stand out for their simplicity, interpretability, and versatility. This thesis focuses on survival trees, addressing their foundation in decision trees. In chapter 1. Introduction, a brief introduction to decision trees and their applicability in the study of survival analysis is provided. In chapter 2. Decision trees, we begin with a general introduction that leads to a discussion on regression trees and classification trees, detailing the processes of constructing and pruning these models. Additionally, we explore the inherent advantages and disadvantages of decision trees, providing a balanced view of when and how to use them effectively. This section also includes an introduction to censored data analysis, setting the stage for the more specialized discussion on survival trees. In chapter 3. Random Survival Forests, we broaden the scope of treebased methods by introducing ensemble methods such as bagging and random forests. Here, we analyze how the combination of multiple trees can lead to a significant improvement in prediction accuracy. Additionally, crucial concepts such as out-of-bag error and predictor importance are presented, with specific subsections addressing the cumulative hazard function and prediction error in survival forests. Although survival trees constitute the core of this work, I find it appropriate to include a discussion on forests. By combining multiple trees and introducing randomness in their construction, forests not only enhance the robustness and accuracy of the models but also allow better handling of data variability and complex interactions between variables. This section is fundamental to understanding how some limitations of individual decision trees can be overcome. Finally, in chapter 4. Illustrations with R Program, we provide a series of practical examples illustrating the implementation of survival trees and forests in R, applying the discussed concepts.application/pdf109 p.spaAttribution-NonCommercial-NoDerivatives 4.0 Internationalhttp://creativecommons.org/licenses/by-nc-nd/4.0/Análisis de supervivencia a través de árboles de decisióninfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/openAccess