Trabajo Fin de Grado
Técnicas estadísticas en minería de textos
Autor/es | Doctor Bracho, Elena Auxiliadora |
Director | Pino Mejías, José Luis |
Departamento | Universidad de Sevilla. Departamento de Estadística e Investigación Operativa |
Fecha de publicación | 2018-06 |
Fecha de depósito | 2018-07-23 |
Titulación | Universidad de Sevilla. Grado en Matemáticas |
Resumen | El objetivo de este trabajo es realizar una revisión de las bases teóricas de las técnicas estadísticas aplicables a la minería de textos, la programación en R de las principales técnicas y la aplicación a conjuntos de ... El objetivo de este trabajo es realizar una revisión de las bases teóricas de las técnicas estadísticas aplicables a la minería de textos, la programación en R de las principales técnicas y la aplicación a conjuntos de datos extraídos mediante el uso de las librerías específicas para ello. En los primeros cuatro capítulos, se introducen nociones introductorias relativas a la minería de textos, así como la relación de este campo con la minería de datos, un breve recorrido histórico por su desarrollo y algunos ejemplos de aplicaciones. En el quinto capítulo, se explican las diferentes etapas que conforman un proceso de minería de textos, mientras que, en el sexto, nos centramos en las diferentes técnicas. Posteriormente, se aplican algunos de los métodos de los capítulos anteriores a través del software R. En concreto, nos centramos en tres de las técnicas de clasificación y la Asignación Latente de Dirichlet. Por último, se hace una breve reflexión acerca de los objetivos a los que se enfrenta la minería de textos en su desarrollo futuro, basándonos en la situación en la que se encuentra actualmente. The objective of this work is to review the theoretical bases of the statistical techniques applicable to text mining, the R programming of the main techniques and the application to extracted data sets through the use of ... The objective of this work is to review the theoretical bases of the statistical techniques applicable to text mining, the R programming of the main techniques and the application to extracted data sets through the use of specific libraries for this purpose. In the first four chapters, introductory notions related to text mining are introduced, as well as the relationship of this field with data mining, a brief historical overview of its development and some application examples. In the fifth chapter, the different stages that make up a text mining process are explained, while, in the sixth, we focus on the different techniques. Subsequently, some of the methods of the previous chapters are applied through the R software. Specifically, we focus on three of the classification techniques and the Latent Dirichlet Allocation. Finally, a brief reflection is made about the objectives that text mining faces in its future development, based on the situation in which it is currently. |
Cita | Doctor Bracho, E.A. (2018). Técnicas estadísticas en minería de textos. (Trabajo Fin de Grado Inédito). Universidad de Sevilla, Sevilla. |
Ficheros | Tamaño | Formato | Ver | Descripción |
---|---|---|---|---|
Doctor Bracho Elena TFG.pdf | 479.6Kb | [PDF] | Ver/ | |