Artículo
ML-SentiCon: Un lexicón multilingüe de polaridades semánticas a nivel de lemas
Título alternativo | ML-SentiCon: a multilingual, lemma-level sentiment lexicon |
Autor/es | Cruz Mata, Fermín
Troyano Jiménez, José Antonio Pontes Balanza, Beatriz Ortega Rodríguez, Francisco Javier |
Departamento | Universidad de Sevilla. Departamento de Lenguajes y Sistemas Informáticos |
Fecha de publicación | 2014 |
Fecha de depósito | 2020-08-04 |
Publicado en |
|
Resumen | En este trabajo presentamos un conjunto de lexicones de polaridades semánticas a nivel de lemas para inglés, español, catalán, gallego y euskera. Estos lexicones están estructurados en capas, lo que permite seleccionar ... En este trabajo presentamos un conjunto de lexicones de polaridades semánticas a nivel de lemas para inglés, español, catalán, gallego y euskera. Estos lexicones están estructurados en capas, lo que permite seleccionar distintos compromisos entre la cantidad de estimaciones de positividad y negatividad y la precisión de dichas estimaciones. Los lexicones se han generado automáticamente a partir de una mejora del método utilizado para generar SentiWordNet, un recurso ampliamente utilizado que recoge estimaciones de positividad y negatividad a nivel de synsets. Nuestras evaluaciones sobre los lexicones para inglés y español muestran altos niveles de precisión en todas las capas. El recurso que contiene todos los lexicones obtenidos, llamado ML-SentiCon ,está disponible de forma pública para su uso. In this work, we present a set of lemma-level sentiment lexicons for English, Spanish, Catalan, Basque and Galician. These lexicons are layered, allowing to trade o between the amount of available words and the accuracy ... In this work, we present a set of lemma-level sentiment lexicons for English, Spanish, Catalan, Basque and Galician. These lexicons are layered, allowing to trade o between the amount of available words and the accuracy of the estimations. The lexicons have been automatically generated from an improved version of SentiWordNet, a very popular resource which contains estimations of the positivity and negativity of synsets. Our evaluations on the English and Spanish lexicons show high accuracies in all cases. The resource containing all the lexicons, ML-SentiCon, is publicly available. |
Agencias financiadoras | Ministerio de Ciencia e Innovación (MICIN). España Ministerio de Ciencia e Innovación (MICIN). España Junta de Andalucía |
Identificador del proyecto | TIN2012-38536-C03-02
TIN2011-14726-E P11-TIC-7684 MO |
Cita | Cruz Mata, F., Troyano Jiménez, J.A., Pontes Balanza, B. y Ortega Rodríguez, F.J. (2014). ML-SentiCon: Un lexicón multilingüe de polaridades semánticas a nivel de lemas. Procesamiento del Lenguaje Natural, 53, 113-120. |
Ficheros | Tamaño | Formato | Ver | Descripción |
---|---|---|---|---|
ML-SentiCon.pdf | 732.8Kb | [PDF] | Ver/ | |