Trabajo Fin de Grado
Explotación y modelos para predicción de datos de un centro educativo
Autor/es | Barrera Gómez. Francisco José |
Director | Beato Moreno, Antonio |
Departamento | Universidad de Sevilla. Departamento de Estadística e Investigación Operativa |
Fecha de publicación | 2016-06 |
Fecha de depósito | 2016-07-12 |
Titulación | Universidad de Sevilla. Grado en Estadística |
Resumen | El presente documento constituye la memoria del Trabajo Fin de Grado en Estadística por la Facultad de Matemáticas de la Universidad de Sevilla y su título es “Explotación y modelos para predicción de datos de un centro ... El presente documento constituye la memoria del Trabajo Fin de Grado en Estadística por la Facultad de Matemáticas de la Universidad de Sevilla y su título es “Explotación y modelos para predicción de datos de un centro educativo”. El trabajo está organizado en varios capítulos que se detallan a continuación: En el capítulo uno a modo de introducción, se contextualiza cuál es la situación y características del centro educativo referenciado mostrando brevemente la plataforma de formación online sobre la que se trabaja, esta es, Moodle en su versión 2.5.9. Se concluye con los objetivos propuestos que se pretenden conseguir. El segundo capítulo está dedicado a la explotación descriptiva de datos. Para ello, previamente se detalla la estructura general de los mismos, el proceso de obtención y concretamente cuáles son los datos disponibles con los que vamos a trabajar. A continuación, se realiza un análisis estadístico descriptivo inicial con el fin de conocer y visualizar la distribución de los mismos. La última parte de este capítulo se centra en detallar el diseño y construcción de un informe automático de estadísticas descriptivas para agilizar la obtención de resultados según unos requisitos establecidos. En el tercer capítulo abordaremos la parte dedicada a los modelos de predicción para dar respuesta a los dos problemas que en principio se han planteado: predicción de alumnos que pueden causar baja en su matrícula con un mes de antelación y estimación de la calificación en la convocatoria ordinaria de mayo/junio con los datos relativos hasta la segunda evaluación. Seguidamente, en el cuarto capítulo se exponen las conclusiones obtenidas con este proyecto, detallando las aportaciones al centro. En el último apartado de este capítulo, se reflejan algunas de las líneas futuras de trabajo. En el quinto y último capítulo, se detallan a modo de anexos, los códigos fuente de los scripts en lenguaje R construidos para implementar las técnicas y metodologías propuestas. Por último, se indican las referencias bibliográficas y documentación online consultados. This document is the end-of-degree project in Statistics at the Faculty of Mathematics of the University of Seville. Its title is "Data Exploitation and Forecasting Models for a school". This project is organized as ... This document is the end-of-degree project in Statistics at the Faculty of Mathematics of the University of Seville. Its title is "Data Exploitation and Forecasting Models for a school". This project is organized as follows: Chapter 1 is an introduction. It presents the situation and specific characteristics of the mentioned school, showing the online education platform (Moodle) version 2.5.9 under usage. It ends with the objectives planned. Chapter 2 is devoted to the descriptive analysis of the data. Firstly, their general structure is described. Secondly, the collection process and specifically the exact data under analysis are presented. Next, an initial descriptive analysis is made in order to know and visualize their distribution. The last section of this chapter is focused on explaining in detail the design and implementation of an automatic report of descriptive statistics which eases the data collection according to some pre-established requirements. Chapter 3 is about the proposed forecasting models to solve the two challenges initially posed: i) Forecasting one month in advance the amount of students un-enrolling, ii) Estimating the grade of a student at the end of the third term of the course given the grades of the first two terms. Chapter 4 establishes the conclusions of this project, detailing the contributions. Potential future research lines are also identified. Chapter 5 – Annexes include the R scripts that implement the techniques and methodologies proposed. Finally, the bibliography is shown in the References. |
Cita | Barrera Gómez. Francisco José, (2016). Explotación y modelos para predicción de datos de un centro educativo. (Trabajo fin de grado inédito). Universidad de Sevilla, Sevilla. |
Ficheros | Tamaño | Formato | Ver | Descripción |
---|---|---|---|---|
Barrera Gómez, Francisco José ... | 2.599Mb | [PDF] | Ver/ | |