Gálvez Ruiz, DavidConde Suso, José2025-02-032025-02-032023-10-12Conde Suso, J. (2023). Estudio de aplicación de Support Vector Machines sobre datos con variables explicativas cualitativas. (Trabajo Fin de Grado Inédito). Universidad de Sevilla, Sevilla.https://hdl.handle.net/11441/168138El Análisis de Correspondencias es una técnica dentro del campo estadístico especializada en la reducción de la dimensión de un conjunto de variables de naturaleza cualitativa, con la finalidad de poder averiguar posibles influencias entre las mismas. Todo esto se realiza a partir de un conjunto de observaciones en estas mismas variables. Las Máquinas Vector Soporte son un método dentro del campo de la Investigación Operativa cuya finalidad es proporcionarnos un método de clasificación de datos a partir de un conjunto de entrenamiento, es decir, clasificación supervisada. El objetivo de este estudio es combinar ambos procedimientos y construir así un nuevo método de clasificación supervisada basado únicamente en variables explicativas cualitativas. Posteriormente evaluaremos la eficiencia del mismo, comparándolo con el método Random Forest, el cual es de los más usados en la actualidad para realizar este tipo de tareas. El trabajo comenzará con una introducción para luego profundizar en el apartado teórico y práctico de cada una de las técnicas que utilizaremos. Finalizaremos aplicando el procedimiento a una base de datos y realizaremos interpretaciones de los resultados, así como una aplicación del Random Forest a la misma base de datos como referencia.Correspondence Analysis is a technique within the Statistics field specialized in the dimension reduction of a set of qualitative variables, in order to be able to find out correlations that might be otherwise impossible to discover. This is obtained from a set of observations on the mentioned variables. Support Vector Machines are a set of procedures within the area of Operations Research that belong to the Supervised Classification Methods, thus a training set is required. The aim of this study is to combine both concepts and therefore develop a new Supervised Classification Method based exclusively on qualitative variables. We will then evaluate its efficiency, comparing it with the Random Forest method, which is considered as one of the most popular techniques to be used for this kind of task. The work begins with a brief introduction, followed by a deeper look into the theoretical and practical section of each procedure to be used later. Finally, the method will be applied to a given database and the results will be interpreted, along with an application of the Random Forest method to the same database to be used as a comparison.application/pdf60 p.spaAttribution-NonCommercial-NoDerivatives 4.0 Internationalhttp://creativecommons.org/licenses/by-nc-nd/4.0/Estudio de aplicación de Support Vector Machines sobre datos con variables explicativas cualitativasinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/openAccess