Mostrar el registro sencillo del ítem

Artículo

dc.creatorEnríquez de Salamanca Ros, Fernandoes
dc.creatorCruz Mata, Fermínes
dc.creatorOrtega Rodríguez, Francisco Javieres
dc.creatorTroyano Jiménez, José Antonioes
dc.date.accessioned2020-08-05T08:41:53Z
dc.date.available2020-08-05T08:41:53Z
dc.date.issued2017
dc.identifier.citationEnríquez de Salamanca Ros, F., Cruz Mata, F., Ortega Rodríguez, F.J. y Troyano Jiménez, J.A. (2017). Similitud español-inglés a través de word embeddings. Procesamiento del Lenguaje Natural, 59, 31-38.
dc.identifier.issn1135-5948es
dc.identifier.urihttps://hdl.handle.net/11441/100110
dc.description.abstractEn este trabajo hemos afrontado la tarea de similitud de textos multilingüe mediante representaciones vectoriales de las palabras. Hemos experimentado con varias colecciones de textos con pares de frases en español e inglés, adaptando dos técnicas basadas en word embeddings que han mostrado su eficacia en la similitud de textos monolingüe: la agregación de vectores y el alineamiento. La agregación permite construir una representación vectorial de un texto a partir de los vectores de las palabras que lo componen, y el algoritmo de alineamiento aprovecha los word embeddigs para decidir el emparejamiento de palabras de los dos textos a comparar. En el proceso se han utilizado dos estrategias distintas: usar traductores automáticos para poder aplicar directamente las técnicas de similitud monolingüe, y aplicar una técnica de transformación de modelos para trasladar los vectores de un idioma al espacio del otro. Las dos estrategias han funcionado razonablemente bien por separado, y los resultados mejoran cuando las salidas de los dos tipos de sistemas se integran mediante técnicas de ensemble learning.es
dc.description.abstractIn this paper we have faced the cross-lingual text similarity task using vector representations of words. We have experimented with several collections of texts with pairs of sentences in Spanish and English, adapting two techniques based on word embeddings that have shown their e ectiveness in the similarity of monolingual texts: vector aggregation and vector-based text alignment. The aggregation allows to construct a vector representation of a text from the vectors of the words that compose it, and the algorithm of alignment takes advantage of word embeddigs to decide the pairing of words of the two texts to be compared. Two di erent strategies have been used in the process: using automatic translators to be able to directly apply monolingual similarity techniques, and applying a model transformation technique to translate the vectors of one language into the space of the other. Both strategies have worked reasonably well separately, and the results improve when the outputs of the two types of systems are integrated by means of ensemble learning techniques.es
dc.formatapplication/pdfes
dc.format.extent8es
dc.language.isospaes
dc.publisherSociedad Española para el Procesamiento del Lenguaje Natural (SEPLN)es
dc.relation.ispartofProcesamiento del Lenguaje Natural, 59, 31-38.
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacional*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectSimilitud bilingüees
dc.subjectCross-lingual similarityes
dc.subjectWord embeddingses
dc.subjectAlineamiento de textoses
dc.subjectText alignmentes
dc.subjectTransformación de modeloses
dc.subjectModel Transformationses
dc.titleSimilitud español-inglés a través de word embeddingses
dc.title.alternativeSpanish-English similarity through word embeddingses
dc.typeinfo:eu-repo/semantics/articlees
dc.type.versioninfo:eu-repo/semantics/publishedVersiones
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses
dc.contributor.affiliationUniversidad de Sevilla. Departamento de Lenguajes y Sistemas Informáticoses
dc.relation.publisherversionhttp://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/5490es
dc.journaltitleProcesamiento del Lenguaje Naturales
dc.publication.issue59es
dc.publication.initialPage31es
dc.publication.endPage38es
dc.identifier.sisius21481072es

FicherosTamañoFormatoVerDescripción
Similitud español-inglés.pdf1.299MbIcon   [PDF] Ver/Abrir  

Este registro aparece en las siguientes colecciones

Mostrar el registro sencillo del ítem

Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Excepto si se señala otra cosa, la licencia del ítem se describe como: Attribution-NonCommercial-NoDerivatives 4.0 Internacional