Final Degree Project
La dimensión Vapnik-Chervonenkis en Ciencia de los datos
Author/s | Vázquez Caraballo, Miguel |
Director | Borrego Díaz, Joaquín |
Department | Universidad de Sevilla. Departamento de Ciencias de la Computación e Inteligencia Artificial |
Publication Date | 2022-06-05 |
Deposit Date | 2023-02-22 |
Academic Title | Universidad de Sevilla. Grado en Matemáticas |
Abstract | En esta memoria se expone la dimensión de VC, un concepto originalmente definido por V. N. Vapnik y A. Ya. Chervonenkis que es una medida de la capacidad que tiene una familia de funciones para realizar clasificación binaria ... En esta memoria se expone la dimensión de VC, un concepto originalmente definido por V. N. Vapnik y A. Ya. Chervonenkis que es una medida de la capacidad que tiene una familia de funciones para realizar clasificación binaria de un conjunto de datos, de gran importancia en la teoría de Aprendizaje Estadístico. Se aporta su definición y algunas propiedades importantes, así como una colección de ejemplos de su cálculo. Para mostrar su relación con la Ciencia de los datos, se desarrolla el marco de aprendizaje PAC como modelo fundacional de la noción de aprendibilidad automatizada de un problema. Así, se identifican las clases de funciones aprendibles a partir de su dimensión VC mediante el Teorema Fundamental del Aprendizaje Estadístico. In this report we present the VC dimension, a concept originally defined by V. N. Vapnik and A. Ya. Chervonenkis, which is a measure of the ability of a family of functions to perform binary classification of a data set, ... In this report we present the VC dimension, a concept originally defined by V. N. Vapnik and A. Ya. Chervonenkis, which is a measure of the ability of a family of functions to perform binary classification of a data set, of great importance in Statistical Learning theory. Its definition and some important properties are provided, as well as a collection of examples of its computation. To show its relation to Data Science, the PAC learning framework is developed as a foundational model of the notion of automated problem learning. Thus, the classes of learnable functions are identified from their VC dimension by means of the Fundamental Theorem of Statistical Learning |
Citation | Vázquez Caraballo, M. (2022). La dimensión Vapnik-Chervonenkis en Ciencia de los datos. (Trabajo Fin de Grado Inédito). Universidad de Sevilla, Sevilla. |
Files | Size | Format | View | Description |
---|---|---|---|---|
GM VAZQUEZ CARABALLO, MIGUEL.pdf | 490.5Kb | [PDF] | View/ | |