Por motivos de mantenimiento se ha deshabilitado el inicio de sesión temporalmente. Rogamos disculpen las molestias.

Mostrar el registro sencillo del ítem

Artículo

dc.creatorEnríquez de Salamanca Ros, Fernandoes
dc.creatorTroyano Jiménez, José Antonioes
dc.creatorCruz Mata, Fermínes
dc.creatorOrtega Rodríguez, Francisco Javieres
dc.date.accessioned2020-07-14T07:43:52Z
dc.date.available2020-07-14T07:43:52Z
dc.date.issued2006
dc.identifier.citationEnríquez de Salamanca Ros, F., Troyano Jiménez, J.A., Cruz Mata, F. y Ortega Rodríguez, F.J. (2006). Ampliación automática de corpus mediante la colaboración de varios etiquetadores. Procesamiento del lenguaje natural, 37
dc.identifier.issn1135-5948es
dc.identifier.urihttps://hdl.handle.net/11441/99327
dc.description.abstractLa disponibilidad de grandes corpus con texto etiquetado es un aspecto esencial en muchas tareas del procesamiento del lenguaje natural. El esfuerzo que se requiere para etiquetar manualmente este gran número de frases ha animado a los investigadores a crear aplicaciones automáticas para este trabajo. Nuestra propuesta representa un método para incrementar el tamaño de un corpus pequeño de manera totalmente automática o con un mínimo esfuerzo, hasta que adquiera el número deseado de frases. El contenido que se añade al corpus se obtiene de cualquier fuente como puede ser Internet, de la cual se puedan extraer frases sin etiquetar para ser analizadas. Si consideramos el pequeño corpus etiquetado como la semilla, nuestro método hace que evolucione hasta lograr el tamaño deseado. El proceso se basa en la opinión de varios etiquetadores mediante la técnica de co-training y de la aplicación de un segundo nivel de aprendizaje mediante stacking. Esta última sería la técnica que nos serviría para decidir cuáles de las nuevas frases etiquetadas serían seleccionadas para pasar a formar parte del corpus.es
dc.description.abstractThe availability of extense tagged data corpus is an essential aspect in many NLP tasks. The effort required for tagging manually this large number of phrases has encouraged many researchers like us to create automatic applications for this issue. Our approach represents a completely automatic method (optionally applying a minimum effort) for enlarging an already existing corpus, so it acquires the desired number of tagged phrases. The extra content of the corpus will be obtained from any knowledge source like the web, from where we extract untagged sentences to be analyzed. Considering the initial small corpus as the seed, our method makes it evolve until it reaches the goal size. The process is based on several taggers using the co-training technique, achieving the results after a number of iterations and applying the stacking scheme for deciding which new tagged sentences must be incorporated to the new corpus.es
dc.description.sponsorshipMinisterio de Educación y Ciencia TIN2004-07246-C03-03es
dc.formatapplication/pdfes
dc.format.extent7es
dc.language.isospaes
dc.publisherSociedad Española para el Procesamiento del Lenguaje Natural (SEPLN)es
dc.relation.ispartofProcesamiento del lenguaje natural, 37
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacional*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectGeneración de recursoses
dc.subjectResource generationes
dc.subjectaprendizaje automáticoes
dc.subjectMachine learninges
dc.subjectCombinación de sistemases
dc.subjectsystem combinationes
dc.titleAmpliación automática de corpus mediante la colaboración de varios etiquetadoreses
dc.typeinfo:eu-repo/semantics/articlees
dcterms.identifierhttps://ror.org/03yxnpp24
dc.type.versioninfo:eu-repo/semantics/publishedVersiones
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses
dc.contributor.affiliationUniversidad de Sevilla. Departamento de Lenguajes y Sistemas Informáticoses
dc.relation.projectIDTIN2004-07246-C03-03es
dc.relation.publisherversionhttp://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/2727es
dc.journaltitleProcesamiento del lenguaje naturales
dc.publication.volumen37es
dc.identifier.sisius6488695es
dc.contributor.funderMinisterio de Educación y Ciencia (MEC). Españaes

FicherosTamañoFormatoVerDescripción
Ampliación automática de corpus.pdf169.5KbIcon   [PDF] Ver/Abrir  

Este registro aparece en las siguientes colecciones

Mostrar el registro sencillo del ítem

Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Excepto si se señala otra cosa, la licencia del ítem se describe como: Attribution-NonCommercial-NoDerivatives 4.0 Internacional