idUS - Buscar

Artículo

Ampliación automática de corpus mediante la colaboración de varios etiquetadores

Enríquez de Salamanca Ros, Fernando; Troyano Jiménez, José Antonio; Cruz Mata, Fermín; Ortega Rodríguez, Francisco Javier (Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN), 2006)

La disponibilidad de grandes corpus con texto etiquetado es un aspecto esencial en muchas tareas del procesamiento del lenguaje natural. El esfuerzo que se requiere para etiquetar manualmente este gran número de frases ...

Artículo

Una herramienta para la edición y manipulaciòn de corpus

Ortega Rodríguez, Francisco Javier; Díaz Madrigal, Víctor Jesús; Romero Moreno, Luisa María (Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN), 2006)

La anotación de corpus es una tarea muy laboriosa aunque esencial a la hora de desarrollar algoritmos estadísticos para el procesamiento del lenguaje. Presentamos la primera versión de una herramienta, encargada de aliviar ...

Artículo

Generación Semiautomática de Recursos

Enríquez de Salamanca Ros, Fernando; Troyano Jiménez, José Antonio; Cruz Mata, Fermín; Ortega Rodríguez, Francisco Javier (Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN), 2007)

Los resultados de muchos algoritmos que se aplican en tareas de procesamiento del lenguaje natural dependen de la disponibilidad de grandes recursos lingüíısticos, de los que extraen el conocimiento necesario para ...

Artículo

PolaritySpam: Propagating Content-based Information Through a Web-Graph to Detect Web Spam

Ortega Rodríguez, Francisco Javier; Troyano Jiménez, José Antonio; Cruz Mata, Fermín; García Vallejo, Carlos Antonio (ICIC International, 2012)

Spam web pages have become a problem for Information Retrieval systems due to the negative effects that this phenomenon can cause in their results. In this work we tackle the problem of detecting these pages with a ...

Artículo

InstanceRank: Bringing order to datasets

García Vallejo, Carlos Antonio; Troyano Jiménez, José Antonio; Ortega Rodríguez, Francisco Javier (Elsevier, 2010)

In this paper we present InstanceRank, a ranking algorithm that reflects the relevance of the instances within a dataset. InstanceRank applies a similar solution to that used by PageRank, the web pages ranking algorithm ...

Buscar

Filtros

Ampliación automática de corpus mediante la colaboración de varios etiquetadores

Una herramienta para la edición y manipulaciòn de corpus

Generación Semiautomática de Recursos

PolaritySpam: Propagating Content-based Information Through a Web-Graph to Detect Web Spam

InstanceRank: Bringing order to datasets