Pino Mejías, José LuisGarcía de las Heras, Joaquín Antonio2024-12-022024-12-022024-10-22Guerrero Martín, P. (2024). Métodos Estadísticos en Diagnóstico Clínico. (Trabajo Fin de Grado Inédito). Universidad de Sevilla, Sevilla.https://hdl.handle.net/11441/165196En el presente Trabajo de Fin de Grado se aborda el uso de métodos estadísticos para el diagnóstico de enfermedades. Para ello, en el primer capítulo, hablaremos sobre qué es el diagnóstico clínico y cuales son los procedimientos más comunes actualmente para llevarlo a cabo mediante la estadística y las matemáticas. Tras ello, expondremos las bases teóricas de tres de estas técnicas: el método de k-Vecinos Más Cercanos en el siguiente capítulo y el algoritmo de Árboles de decisión y de Random Forests en sucesivos capítulos. Las tres serán vistas tanto para problemas de clasificación como para problemas de regresión. Los problemas de clasificación tienen como objetivo identificar las características que indican el grupo al que pertenece cada caso. Este patrón se puede utilizar para comprender los datos existentes y para predecir cómo se comportarán las nuevas instancias. La minería de datos crea modelos de clasificación examinando datos ya clasificados (casos) y encontrando por inducción un modelo predictivo. Por otro lado, la regresión se refiere a una tarea en la que el objetivo es predecir un valor numérico continuo basado en uno o más atributos de entrada. Una vez analizada la teoría, se complementa con una aplicación. En esta, se hace un estudio sobre si un individuo presenta o no diabetes de tipo II. Trabajamos sobre una base de datos de la plataforma ‘Kaggle’ con información relativa a un estudio en un grupo de mujeres donde se recogen variables explicativas como la presión arterial, índice de masa corporal. . . y su respectiva variable respuesta acerca de si son sanas o diabéticas. Hemos desarrollado los distintos algoritmos con un conjunto de funciones recogidas en la biblioteca ‘Scikit-Learn’ de Python. Nos quedamos con el mejor y haremos predicciones con nuevos datos.In this Bachelor’s Thesis, the use of statistical methods for disease diagnosis is addressed. To this end, in the first chapter, we will discuss what clinical diagnosis is and what the most common procedures currently used to carry it out through statistics and mathematics are. Following this, we will present the theoretical foundations of three of these techniques: the k-Nearest Neighbors method in the next chapter, and the Decision Trees and Random Forest algorithms in subsequent chapters. All three will be examined for both classification and regression problems. Classification problems aim to identify the characteristics that indicate the group to which each case belongs. This pattern can be used to understand existing data and to predict how new instances will behave. Data mining creates classification models by examining already classified data (cases) and finding a predictive model through induction. On the other hand, regression refers to a task in which the objective is to predict a continuous numerical value based on one or more input attributes. Once the theory has been analyzed, it will be complemented with an application. In this application, a study will be conducted on whether an individual has type II diabetes or not. We work with a database from the ‘Kaggle’ platform containing information related to a study on a group of women, where explanatory variables such as blood pressure, body mass index, etc., are collected, along with the corresponding response variable indicating whether they are healthy or diabetic. We have developed the different algorithms using a set of functions gathered in the ‘Scikit-Learn’ library of Python. We will keep the best one and make predictions with new data.application/pdf89 p.spaAttribution-NonCommercial-NoDerivatives 4.0 Internationalhttp://creativecommons.org/licenses/by-nc-nd/4.0/Métodos Estadísticos en Diagnóstico Clínicoinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/openAccess