Repositorio de producción científica de la Universidad de Sevilla

Ciencia del dato aplicada: competiciones en Kaggle

 

Advanced Search
 
Opened Access Ciencia del dato aplicada: competiciones en Kaggle
Cites
Show item statistics
Icon
Export to
Author: Barrios Marín, Antonio José
Director: Romero Jiménez, Álvaro
Department: Universidad de Sevilla. Departamento de Ciencias de la Computación e Inteligencia Artificial
Date: 2016-09
Document type: Final Degree Work
Academic Title: Universidad de Sevilla. Grado en Estadística
Abstract: El objetivo de este trabajo es la aplicación de algoritmos de aprendizaje automático para resolver problemas de modelización predictiva planteados en la plataforma Kaggle. El trabajo comienza con una introducción a lo que se entiende por aprendizaje automático, describiéndose los diversos tipos de algoritmos aplicables y los diferentes tipos de aprendizaje existentes. Además, se explica en que consiste la plataforma web Kaggle, detallando su funcionamiento así como los diferentes tipos de competiciones que incluye. Tras describir brevemente algunos algoritmos de aprendizaje automático que se aplicarán posteriormente en el trabajo, luego se desarrollará el núcleo del mismo: la participación en dos competiciones de Kaggle, de diferentes rangos de dificultad cada una, enfrentándonos de esta manera al tratamiento y utilización de conjuntos de datos ‘reales’ para el desarrollo de un modelo predictivo. The aim of this work is Application of machine learning algorithms to solve problems raised in predictive modeling platform Kaggle. This Work begins with an introduction to what is meant by Machine Learning, describing various types of algorithms applicable and different Ttypes of learning existing. In addition, it explains what the Web platform Kaggle, detailing how it´s work and the Different Types of competitions that are including on the web. After describing briefly some algorithms machine learning that subsequently apply at this work, then it will develop the core of: the Participation in two competitions Kaggle of different ranges of difficulty each one, facing the treatment and use of ‘real’ data sets for the development of a predictive model.
Cite: Barrios Marín, A.J. (2016). Ciencia del dato aplicada: competiciones en Kaggle. (Trabajo fin de grado inédito). Universidad de Sevilla, Sevilla.
Size: 1.170Mb
Format: PDF

URI: http://hdl.handle.net/11441/46274

This work is under a Creative Commons License: 
Attribution-NonCommercial-NoDerivatives 4.0 Internacional

This item appears in the following Collection(s)