Show simple item record

Presentation

dc.creatorOrtega Rodríguez, Francisco Javieres
dc.creatorTroyano Jiménez, José Antonioes
dc.creatorCruz Mata, Fermínes
dc.creatorEnríquez de Salamanca Ros, Fernandoes
dc.date.accessioned2022-03-10T10:08:09Z
dc.date.available2022-03-10T10:08:09Z
dc.date.issued2011
dc.identifier.citationOrtega Rodríguez, F.J., Troyano Jiménez, J.A., Cruz Mata, F. y Enríquez de Salamanca Ros, F. (2011). Detecciòn de Spam en la Web mediante el análisis de texto y de grafos. En TIMM 2011: IV Jornadas de Tratamiento de Información Multilingüe y Multimodal (13-16), Torres, Jaén, España: Escuela Politécnica Superior, Universidad de Jaén.
dc.identifier.urihttps://hdl.handle.net/11441/130646
dc.description.abstractEl spam en la web representa un grave problema para los sistemas de Recuperación de Información, debido al perjuicio que puede ocasionar en la calidad de los resultados de los mismos. En este trabajo se presenta un sistema de detección de spam en la web basado en un algoritmo de ranking que ordena las páginas web de acuerdo a su reevancia, penalizando aquellas páginas susceptibles de ser consideradas spam. La novedad de este sistema reside en conjugar técnicas de procesamiento de textos con técnicas de análisis de grafos. Las técnicas de procesamiento de textos se utilizan para asignar a determinadas páginas una puntuación a priori, de acuerdo a la probabilidad de que sean spam o no, según su contenido. Nuestro algoritmo de ranking procesará el grafo de las páginas web y las puntuaciones a priori para obtener el ranking de webs. En los experimentos se comprueba que nuestro sistema mejora los resultados de otras técnicas muy utilizadas.es
dc.formatapplication/pdfes
dc.language.isospaes
dc.publisherEscuela Politécnica Superior, Universidad de Jaénes
dc.relation.ispartofTIMM 2011: IV Jornadas de Tratamiento de Información Multilingüe y Multimodal (2011), pp. 13-16.
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacional*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectDetección de spames
dc.subjectRecuperación de informaciónes
dc.subjectAlgoritmos de rankinges
dc.titleDetecciòn de Spam en la Web mediante el análisis de texto y de grafoses
dc.typeinfo:eu-repo/semantics/conferenceObjectes
dcterms.identifierhttps://ror.org/03yxnpp24
dc.type.versioninfo:eu-repo/semantics/submittedVersiones
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses
dc.contributor.affiliationUniversidad de Sevilla. Departamento de Lenguajes y Sistemas Informáticoses
dc.relation.publisherversionhttp://timm.ujaen.es/iv-jornadas-timm/es
dc.publication.initialPage13es
dc.publication.endPage16es
dc.eventtitleTIMM 2011: IV Jornadas de Tratamiento de Información Multilingüe y Multimodales
dc.eventinstitutionTorres, Jaén, Españaes
dc.relation.publicationplaceJaén, Españaes

FilesSizeFormatViewDescription
timm2011_submission_5.pdf214.2KbIcon   [PDF] View/Open  

This item appears in the following collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Except where otherwise noted, this item's license is described as: Attribution-NonCommercial-NoDerivatives 4.0 Internacional