Mostrar el registro sencillo del ítem

Trabajo Fin de Grado

dc.contributor.advisorPino Mejías, Rafaeles
dc.creatorEspinar Lara, Rocíoes
dc.date.accessioned2018-07-23T11:12:42Z
dc.date.available2018-07-23T11:12:42Z
dc.date.issued2018-06
dc.identifier.citationEspinar Lara, R. (2018). Modelos de clasificación con datos no balanceados. (Trabajo Fin de Grado Inédito). Universidad de Sevilla, Sevilla.
dc.identifier.urihttps://hdl.handle.net/11441/77518
dc.description.abstractEl problema de las distribuciones de datos no balanceados entre clases, ha recibido una atención considerable en disciplinas como el Aprendizaje Automático o Machine Learning, en inglés y Minería de Datos, entre otros. En el contexto de problemas de clasificación, se dice que un conjunto de datos no está balanceado si una de las clases (mayoritaria) está sensiblemente más representada que el resto de clases. Esta problemática puede conducir, en términos de clasificación, a aprendizajes sesgados en perjuicio de la clase minoritaria, que usualmente, contiene los casos de mayor interés. En esta memoria se aborda el problema de clases no balanceadas, en la que se estudian diferentes técnicas de clasificación con las que solventar o disminuir dicho problema. En la introducción, se describe el problema de la distribución desigual de clases. En el capítulo 2, se presentan diversos conceptos del Aprendizaje Estadístico utilizados en este trabajo. Posteriormente, se hablará de los árboles de clasificación y los modelos Random Forests, describiendo sus principales características. En el capítulo 4, se verán algunas de las medidas de rendimiento que serán usadas para medir la eficiencia de un modelo de clasificación. En el capítulo 5, se proponen técnicas para solventar el problema descrito en este trabajo, como por ejemplo técnicas de remuestreo, para reducir/incrementar el tamaño muestral de la clase mayoritaria/minoritaria y ténicas basadas en costes que penalizan la clasificación eróonea, entre otros. Por último, se realiza una comparación empírica de los métodos descritos sobre un conjuntos de datos (insolvencias). Se ha utilizado para ello el entorno de programación estadístico R.es
dc.formatapplication/pdfes
dc.language.isospaes
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacional*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectDistribuciónes
dc.subjectDatos no balanceadoses
dc.titleModelos de clasificación con datos no balanceadoses
dc.typeinfo:eu-repo/semantics/bachelorThesises
dc.type.versioninfo:eu-repo/semantics/publishedVersiones
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses
dc.contributor.affiliationUniversidad de Sevilla. Departamento de Estadística e Investigación Operativaes
dc.description.degreeUniversidad de Sevilla. Grado en Matemáticases
idus.format.extent88 p.es

FicherosTamañoFormatoVerDescripción
Espinar Lara Rocío TFG.pdf1.320MbIcon   [PDF] Ver/Abrir  

Este registro aparece en las siguientes colecciones

Mostrar el registro sencillo del ítem

Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Excepto si se señala otra cosa, la licencia del ítem se describe como: Attribution-NonCommercial-NoDerivatives 4.0 Internacional