Buscar
Mostrando ítems 1-5 de 5
Artículo
Ampliación automática de corpus mediante la colaboración de varios etiquetadores
(Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN), 2006)
La disponibilidad de grandes corpus con texto etiquetado es un aspecto esencial en muchas tareas del procesamiento del lenguaje natural. El esfuerzo que se requiere para etiquetar manualmente este gran número de frases ...
Artículo
Una herramienta para la edición y manipulaciòn de corpus
(Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN), 2006)
La anotación de corpus es una tarea muy laboriosa aunque esencial a la hora de desarrollar algoritmos estadísticos para el procesamiento del lenguaje. Presentamos la primera versión de una herramienta, encargada de aliviar ...
Artículo
Generación Semiautomática de Recursos
(Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN), 2007)
Los resultados de muchos algoritmos que se aplican en tareas de procesamiento del lenguaje natural dependen de la disponibilidad de grandes recursos lingüíısticos, de los que extraen el conocimiento necesario para ...
Artículo
PolaritySpam: Propagating Content-based Information Through a Web-Graph to Detect Web Spam
(ICIC International, 2012)
Spam web pages have become a problem for Information Retrieval systems due to the negative effects that this phenomenon can cause in their results. In this work we tackle the problem of detecting these pages with a ...
Artículo
InstanceRank: Bringing order to datasets
(Elsevier, 2010)
In this paper we present InstanceRank, a ranking algorithm that reflects the relevance of the instances within a dataset. InstanceRank applies a similar solution to that used by PageRank, the web pages ranking algorithm ...