Enterprise Information Integration: New Approaches to Web Information Extraction

Jiménez Aguirre, Patricia

Tesis Doctoral

dc.contributor.advisor	Corchuelo Gil, Rafael
dc.creator	Jiménez Aguirre, Patricia
dc.date.accessioned	2016-02-01T17:46:13Z
dc.date.available	2016-02-01T17:46:13Z
dc.date.issued	2015-10-19
dc.identifier.citation	Jiménez Aguirre, P. (2015). Enterprise Information Integration: New Approaches to Web Information Extraction. (Tesis doctoral inédita). Universidad de Sevilla, Sevilla.
dc.identifier.uri	http://hdl.handle.net/11441/33761
dc.description.abstract	La manera de entender la información ha cambiado radicalmente en las últimas décadas gracias a la Web, que impulsa a las personas a hacer uso de Internet a un ritmo cada vez más vertiginoso. No es de extrañar, pues, que se haya convertido en uno de los canales de distribución de datos más usados y universalmente accesible. Sin embargo, los datos por sí solos no tienen suficiente valor; es necesario convertirlos en información a partir de la cual se pueda inferir conocimiento útil. Éste es el propósito de la inteligencia de negocio, que involucra un proceso de integración y transformación de datos en información y posterior obtención de conocimiento con el objetivo de llevar a cabo una toma de decisiones eficaz. Para que ese proceso de integración y transformación de datos tenga lugar, es necesario hacer uso de extractores de información, que son las herramientas que permiten extraer datos de la Web y dotarlos de estructura y semántica de modo que puedan ser interpretados por las personas o incorporados en procesos de negocios automáticos con el objetivo de explotarlos de una forma inteligente. En esta tesis nos centramos en el aprendizaje de reglas para extraer información de documentos web semi-estructurados y en cómo evaluar diferentes propuestas con el objetivo de obtener un ranking de una forma totalmente automática. Nuestras dos propuestas de extracción de información son TANGO y ROLLER; ambas están basadas en un catálogo abierto de características y en técnicas inductivas. Nuestra propuesta para obtener rankings se llama VENICE; proporciona un método automático, abierto y agnóstico que está basado en técnicas estadísticas. Esperamos que nuestras contribuciones en esta tesis puedan ser de utilidad tanto a investigadores como profesionales y que ayuden a reducir los costes en los proyectos que requieren extraer información de la Web.	es
dc.format	application/pdf	es
dc.language.iso	eng	es
dc.rights	Atribución-NoComercial-SinDerivadas 4.0 España
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/	*
dc.subject	Enterprise Information Integration
dc.subject	Web Information Extraction
dc.subject	Web Wrapper Generation
dc.subject	Domain-Specific Architectures
dc.subject	Performance Evaluation
dc.subject	Automated Ranking of Information Extractors
dc.subject	Learning Information Extraction Rules
dc.subject	Propositio-Relational Approaches
dc.subject	Inductive Relational Approaches
dc.subject	Dynamic Flattening Approaches
dc.title	Enterprise Information Integration: New Approaches to Web Information Extraction	es
dc.type	info:eu-repo/semantics/doctoralThesis	es
dcterms.identifier	https://ror.org/03yxnpp24
dc.type.version	info:eu-repo/semantics/publishedVersion	es
dc.rights.accessRights	info:eu-repo/semantics/openAccess	es
dc.contributor.affiliation	Universidad de Sevilla. Departamento de Lenguajes y Sistemas Informáticos	es
dc.identifier.idus	https://idus.us.es/xmlui/handle/11441/33761

Ficheros	Tamaño	Formato	Ver	Descripción
Memoria Tesis - Patricia Jiménez ...	2.921Mb	[PDF]	Ver/Abrir

Este registro aparece en las siguientes colecciones

Mostrar el registro sencillo del ítem

Excepto si se señala otra cosa, la licencia del ítem se describe como: Atribución-NoComercial-SinDerivadas 4.0 España

Tesis Doctoral

Enterprise Information Integration: New Approaches to Web Information Extraction

Este registro aparece en las siguientes colecciones

Items relacionados

NLC: A Measure Based on Projections ﻿

Electricity Market Price Forecasting: Neural Networks versus Weighted-Distance k Nearest Neighbours ﻿

NLC: A Measure Based on Projections

Electricity Market Price Forecasting: Neural Networks versus Weighted-Distance k Nearest Neighbours