Mostrar el registro sencillo del ítem

Tesis Doctoral

dc.contributor.advisorCorchuelo Gil, Rafael
dc.creatorJiménez Aguirre, Patricia
dc.date.accessioned2016-02-01T17:46:13Z
dc.date.available2016-02-01T17:46:13Z
dc.date.issued2015-10-19
dc.identifier.citationJiménez Aguirre, P. (2015). Enterprise Information Integration: New Approaches to Web Information Extraction. (Tesis doctoral inédita). Universidad de Sevilla, Sevilla.
dc.identifier.urihttp://hdl.handle.net/11441/33761
dc.description.abstractLa manera de entender la información ha cambiado radicalmente en las últimas décadas gracias a la Web, que impulsa a las personas a hacer uso de Internet a un ritmo cada vez más vertiginoso. No es de extrañar, pues, que se haya convertido en uno de los canales de distribución de datos más usados y universalmente accesible. Sin embargo, los datos por sí solos no tienen suficiente valor; es necesario convertirlos en información a partir de la cual se pueda inferir conocimiento útil. Éste es el propósito de la inteligencia de negocio, que involucra un proceso de integración y transformación de datos en información y posterior obtención de conocimiento con el objetivo de llevar a cabo una toma de decisiones eficaz. Para que ese proceso de integración y transformación de datos tenga lugar, es necesario hacer uso de extractores de información, que son las herramientas que permiten extraer datos de la Web y dotarlos de estructura y semántica de modo que puedan ser interpretados por las personas o incorporados en procesos de negocios automáticos con el objetivo de explotarlos de una forma inteligente. En esta tesis nos centramos en el aprendizaje de reglas para extraer información de documentos web semi-estructurados y en cómo evaluar diferentes propuestas con el objetivo de obtener un ranking de una forma totalmente automática. Nuestras dos propuestas de extracción de información son TANGO y ROLLER; ambas están basadas en un catálogo abierto de características y en técnicas inductivas. Nuestra propuesta para obtener rankings se llama VENICE; proporciona un método automático, abierto y agnóstico que está basado en técnicas estadísticas. Esperamos que nuestras contribuciones en esta tesis puedan ser de utilidad tanto a investigadores como profesionales y que ayuden a reducir los costes en los proyectos que requieren extraer información de la Web.es
dc.formatapplication/pdfes
dc.language.isoenges
dc.rightsAtribución-NoComercial-SinDerivadas 4.0 España
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectEnterprise Information Integration
dc.subjectWeb Information Extraction
dc.subjectWeb Wrapper Generation
dc.subjectDomain-Specific Architectures
dc.subjectPerformance Evaluation
dc.subjectAutomated Ranking of Information Extractors
dc.subjectLearning Information Extraction Rules
dc.subjectPropositio-Relational Approaches
dc.subjectInductive Relational Approaches
dc.subjectDynamic Flattening Approaches
dc.titleEnterprise Information Integration: New Approaches to Web Information Extractiones
dc.typeinfo:eu-repo/semantics/doctoralThesises
dcterms.identifierhttps://ror.org/03yxnpp24
dc.type.versioninfo:eu-repo/semantics/publishedVersiones
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses
dc.contributor.affiliationUniversidad de Sevilla. Departamento de Lenguajes y Sistemas Informáticoses
dc.identifier.idushttps://idus.us.es/xmlui/handle/11441/33761

FicherosTamañoFormatoVerDescripción
Memoria Tesis - Patricia Jiménez ...2.921MbIcon   [PDF] Ver/Abrir  

Este registro aparece en las siguientes colecciones

Mostrar el registro sencillo del ítem

Atribución-NoComercial-SinDerivadas 4.0 España
Excepto si se señala otra cosa, la licencia del ítem se describe como: Atribución-NoComercial-SinDerivadas 4.0 España