dc.contributor.advisor | Hernández Salmerón, Inmaculada Concepción | es |
dc.contributor.advisor | Ruiz Cortés, David | es |
dc.creator | Borrego Díaz, Agustín | es |
dc.date.accessioned | 2023-09-28T10:35:57Z | |
dc.date.available | 2023-09-28T10:35:57Z | |
dc.date.issued | 2023-07-07 | |
dc.identifier.citation | Borrego Díaz, A. (2023). On Data Engineering and Knowledge Graphs: a Context-Aware Proposal for Web-Scale Knowledge Graph Completion. (Tesis Doctoral Inédita). Universidad de Sevilla, Sevilla. | |
dc.identifier.uri | https://hdl.handle.net/11441/149207 | |
dc.description.abstract | Nowadays, Knowledge Graphs are a widely used means to store structured
information for a variety of different domains and applications. However,
due to the fact that they are usually constructed using automated information
extraction techniques, they are often incomplete, either because these techniques failed
to extract the relevant information, or because it was not present altogether in the
original sources.
The problem that we address in this dissertation is how to find this missing
knowledge and complete Knowledge Graphs in an automatic manner. In the literature,
there are already many proposals to perform this task. However, they have important
drawbacks, namely: they rely on embedded representations, which are
computationally expensive to generate and demand frequent regenerations, they
require human intervention or human-provided data, they rely on external sources of
information, they cannot produce new knowledge on their own, or they do not scale
properly to very large Knowledge Graphs.
In this dissertation, we present a new automated proposal for completing
Knowledge Graphs that does not suffer from any of the previous drawbacks. Our
contribution is threefold: CHAI, a technique for automatically generating tractable sets
of candidate triples; CAFE, a high-accuracy triple classification proposal; and
SciCheck, a technique specifically tailored for completing scientific Knowledge Graphs.
Our theoretical and practical validation suggests that our proposal is very efficient and
effective in practice, and that it is able to successfully complete Knowledge Graphs of
varying natures. | es |
dc.description.abstract | Hoy en día, los grafos de conocimiento son una herramienta ampliamente
usada para almacenar y representar información estructurada para una
gran variedad de dominios y aplicaciones prácticas. Sin embargo, debido
a que generalmente son construidos usando técnicas de extracción automática de
información, éstos suelen estar incompletos. Esto se debe a que las citadas técnicas
pueden no extraer satisfactoriamente la información deseada, o a que la fuente original
no contenía suficiente información.
El problema tratado en esta tesis doctoral es cómo encontrar este conocimiento
que falta y completar un grafo de conocimiento de manera automática. En la
bibliografía existen numerosas propuestas para lograr este objetivo, pero tienen
importantes inconvenientes, concretamente: necesitan utilizar embeddings, que son
computacionalmente costosos de obtener y requieren ser regenerados frecuentemente,
necesitan intervención humana o datos generados manualmente, tienen una
dependencia fuerte con fuentes externas de información, no tienen ningún modo para
generar nuevo conocimiento por ellas mismas, o no son aplicables a grafos de
conocimiento muy grandes.
En esta tesis presentamos una nueva propuesta automatizada para completar
grafos de conocimiento que no sufre de los problemas anteriores. Nuestra contribución
tiene tres elementos principales: CHAI, una técnica para generar automáticamente
conjuntos manejables de tripletas candidatas; CAFE, una propuesta de clasificación
de tripletas de alta precisión; y SciCheck, una técnica especialmente diseñada para
completar grafos de conocimiento científicos. Nuestra validación, tanto teórica como
basada en una aplicación práctica, sugiere que nuestra propuesta es muy eficiente y
efectiva en casos de uso reales, y que es capaz de completar satisfactoriamente grafos
de conocimiento de todo tipo. | es |
dc.format | application/pdf | es |
dc.format.extent | 169 p | es |
dc.language.iso | eng | es |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 Internacional | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.title | On Data Engineering and Knowledge Graphs: a Context-Aware Proposal for Web-Scale Knowledge Graph Completion | es |
dc.type | info:eu-repo/semantics/doctoralThesis | es |
dcterms.identifier | https://ror.org/03yxnpp24 | |
dc.type.version | info:eu-repo/semantics/publishedVersion | es |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | es |
dc.contributor.affiliation | Universidad de Sevilla. Departamento de Lenguajes y Sistemas Informáticos | es |