Muñoz Pichardo, Juan ManuelRomero Pavón, Andrés2024-12-232024-12-232024-07-10Romero Pavón, A. (2024). Estadística multivariante: algunos problemas con la alta dimensionalidad. (Trabajo Fin de Grado Inédito). Universidad de Sevilla, Sevilla.https://hdl.handle.net/11441/166108El presente trabajo aborda la problemática asociada a la alta dimensionalidad en el ámbito de la estadística multivariante. La investigación se centra en describir y presentar algunas soluciones y estrategias enfocadas a resolver este problema, bien desde el enfoque de la reducción de la dimensión, bien directamente para abordar técnicas de clasificación o predicción, planteando desafíos sustanciales en la inferencia estadística y el análisis de datos. Un problema muy presente en la actualidad al que tiene que enfrentarse la estadística es el análisis de conjuntos de datos de altas dimensiones, especialmente cuando “p ≫ N”, es decir, cuando la dimensión o número de variables es superior al tamaño muestral o número de casos. La alta dimensionalidad presenta obstáculos críticos en la identificación de patrones y la interpretación de relaciones entre variables. En este contexto, se exploran en profundidad las limitaciones de los métodos clásicos de estadística multivariante y se proponen enfoques innovadores para hacer frente a la falta de observaciones en relación con la abundancia de variables. Se examinan técnicas de reducción de dimensionalidad, como el análisis de componentes principales, así como métodos más avanzados como la regularización y la selección de características. Además, se aborda la problemática de la selección de modelos y la mejora de la eficiencia computacional en entornos de alta dimensionalidad. Los resultados de este trabajo proporcionan ideas valiosas para investigadores y profesionales en campos donde la alta dimensionalidad es una característica inherente, como la genómica, la minería de datos y la inteligencia artificial. Se espera que estas contribuciones fomenten el avance en la comprensión y el tratamiento de la alta dimensionalidad en el análisis estadístico multivariante.This paper addresses the problems associated with high dimensionality in the field of multivariate statistics. Entitled “Multivariate statistics: Problems with high dimensionality’ ’, the research focuses on situations where the number of explanatory variables p significantly exceeds the number of observations N, posing substantial challenges in statistical inference and data analysis. High dimensionality presents critical obstacles in identifying patterns and interpreting relationships between variables. In this context, the limitations of classical multivariate statistical methods are explored in depth and innovative approaches are proposed to cope with the lack of observations in relation to the abundance of variables. Dimensionality reduction techniques, such as principal component analysis, as well as more advanced methods such as regularisation and feature selection are discussed. In addition, the issue of model selection and improving computational efficiency in high dimensionality environments is addressed. The results of this paper provide valuable insights for researchers in fields where high dimensionality is an inherent feature, such as genomics, data mining and artificial intelligence. It is hoped that these contributions will further advance the understanding and treatment of high dimensionality in multivariate statistical analysis.application/pdf72 p.spaAttribution-NonCommercial-NoDerivatives 4.0 Internationalhttp://creativecommons.org/licenses/by-nc-nd/4.0/Estadística multivariante: algunos problemas con la alta dimensionalidadinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/openAccess