dc.creator | Ortega Rodríguez, Francisco Javier | es |
dc.creator | Troyano Jiménez, José Antonio | es |
dc.creator | Cruz Mata, Fermín | es |
dc.creator | Enríquez de Salamanca Ros, Fernando | es |
dc.date.accessioned | 2022-03-10T10:08:09Z | |
dc.date.available | 2022-03-10T10:08:09Z | |
dc.date.issued | 2011 | |
dc.identifier.citation | Ortega Rodríguez, F.J., Troyano Jiménez, J.A., Cruz Mata, F. y Enríquez de Salamanca Ros, F. (2011). Detecciòn de Spam en la Web mediante el análisis de texto y de grafos. En TIMM 2011: IV Jornadas de Tratamiento de Información Multilingüe y Multimodal (13-16), Torres, Jaén, España: Escuela Politécnica Superior, Universidad de Jaén. | |
dc.identifier.uri | https://hdl.handle.net/11441/130646 | |
dc.description.abstract | El spam en la web representa un grave problema para los
sistemas de Recuperación de Información, debido al perjuicio que puede
ocasionar en la calidad de los resultados de los mismos. En este trabajo
se presenta un sistema de detección de spam en la web basado en un
algoritmo de ranking que ordena las páginas web de acuerdo a su reevancia, penalizando aquellas páginas susceptibles de ser consideradas
spam. La novedad de este sistema reside en conjugar técnicas de procesamiento de textos con técnicas de análisis de grafos. Las técnicas de
procesamiento de textos se utilizan para asignar a determinadas páginas
una puntuación a priori, de acuerdo a la probabilidad de que sean spam o
no, según su contenido. Nuestro algoritmo de ranking procesará el grafo
de las páginas web y las puntuaciones a priori para obtener el ranking
de webs. En los experimentos se comprueba que nuestro sistema mejora
los resultados de otras técnicas muy utilizadas. | es |
dc.format | application/pdf | es |
dc.language.iso | spa | es |
dc.publisher | Escuela Politécnica Superior, Universidad de Jaén | es |
dc.relation.ispartof | TIMM 2011: IV Jornadas de Tratamiento de Información Multilingüe y Multimodal (2011), pp. 13-16. | |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 Internacional | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.subject | Detección de spam | es |
dc.subject | Recuperación de información | es |
dc.subject | Algoritmos de ranking | es |
dc.title | Detecciòn de Spam en la Web mediante el análisis de texto y de grafos | es |
dc.type | info:eu-repo/semantics/conferenceObject | es |
dcterms.identifier | https://ror.org/03yxnpp24 | |
dc.type.version | info:eu-repo/semantics/submittedVersion | es |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | es |
dc.contributor.affiliation | Universidad de Sevilla. Departamento de Lenguajes y Sistemas Informáticos | es |
dc.relation.publisherversion | http://timm.ujaen.es/iv-jornadas-timm/ | es |
dc.publication.initialPage | 13 | es |
dc.publication.endPage | 16 | es |
dc.eventtitle | TIMM 2011: IV Jornadas de Tratamiento de Información Multilingüe y Multimodal | es |
dc.eventinstitution | Torres, Jaén, España | es |
dc.relation.publicationplace | Jaén, España | es |