Mostrar el registro sencillo del ítem

Dataset

dc.coverage.spatialEuropaes
dc.coverage.temporal2014-2023es
dc.creatorRomero-Domínguez, Lorena R.es
dc.date.accessioned2024-02-14T11:18:15Z
dc.date.available2024-02-14T11:18:15Z
dc.date.created2023-08-17
dc.date.issued2024-02-14
dc.identifier.citationRomero-Domínguez, L.R. (2024). Redefining Hallin and Mancini’s Media System: Cross-Border Investigative Networks in Europe [Dataset]. idUS (Depósito de Investigación de la Universidad de Sevilla). https://doi.org/10.12795/11441/155231.
dc.identifier.urihttps://hdl.handle.net/11441/155231
dc.description.abstractEn este trabajo se han analizado un total de 1015 documentos relativos a los resúmenes de las conferencias celebradas por Dataharvest (the European Investigative Journalism Conference) durante el período 2014-2023. Para el análisis se ha utilizado Python con los paquetes pandas, spacy, sklearn, sentences_transformers y matplotlib, además de algunos otros paquetes auxiliares y R con el paquete ggplot2 para las representaciones. Las técnicas empleadas a lo largo del análisis han sido: • Análisis frecuentista de textos, que permite hacer el conteo de aparición en documentos de tamaño variable. Se consideran diferentes términos gramaticalmente relacionados y sinónimos, habiéndose eliminado las stopwords. Se han utilizado distintas matrices de frecuencias: BoW (Bag of Words) con los conteos por palabra sin ninguna transformación, y TF-IDF utilizando una reducción logarítmica de la frecuencia para resaltar palabras que pueden ser menos comunes, pero aun así relevantes. También se han utilizado n-gramas para detectar apariciones adyacentes de términos. • Análisis de asociaciones entre términos: se trata de detectar apariciones conjuntas de términos en documento, sin necesidad de que las palabras aparezcan de forma consecutiva en el texto. Se ha utilizado un índice de coincidencia para ordenar la relevancia de las parejas de términos según sus apariciones en documentos. • Análisis de agrupamiento: se ha utilizado transformers (redes neuronales) aplicadas a vectores de documentos con sBERT. Con los resultados obtenidos se ha realizado un agrupamiento utilizando el método métrico k-means. Este método establece, a partir de un número determinado de centros propuesto por el analista (con el apoyo de método elbow curve), el mismo número de grupos de documentos de forma que se minimiza la distancia cuadrática entre los vectores de documento y cada uno de los centros. Entre todas las posibles opciones, el resultado es el que sitúa esos centros y establece una partición de todos los documentos asociando cada uno de ellos a un centro de forma que se minimiza el error cuadrático medio.es
dc.description.tableofcontentsAnálisis por años (BoW y TF-IDF) Análisis por secciones (BoW y TF-IDF) Clustering Kmeans_frecuencia Cluster 0 Kmeans_frecuencia Cluster 1 Kmeans_frecuencia Cluster 2 Kmeans_frecuencia Cluster 3 Pertenencia Clusters Kmeans N-gramas Frecuencia bigramas Frecuencia trigramas Asociaciones de palabras Frecuencia Totales
dc.formatapplication/vnd.ms-exceles
dc.language.isospaes
dc.language.isoenges
dc.rightsAtribución 4.0 Internacional*
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/*
dc.subjectPeriodismo de investigación transfronterizoes
dc.subjectdatoses
dc.subjectEuropaes
dc.subjectsistemas de medios de comunicaciónes
dc.subjectorganizaciones sin ánimo de lucroes
dc.subjectredes transnacionaleses
dc.subjectCross-border investigative journalismes
dc.subjectdataes
dc.subjectEuropees
dc.subjectmedia systemses
dc.subjectnon-profit organisationses
dc.subjecttransnational networkes
dc.titleRedefining Hallin and Mancini’s Media System: Cross-Border Investigative Networks in Europe [Dataset]es
dc.typeinfo:eu-repo/semantics/datasetes
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses
dc.contributor.affiliationUniversidad de Sevilla. Departamento de Periodismo IIes
dc.identifier.doi10.12795/11441/155231
dc.contributor.groupUniversidad de Sevilla. SEJ528: Medios, Políticas de Comunicación y Democracia en la Unión Europea (DEMOC-MEDIA)es
dc.contributor.datacuratorRomero-Domínguez, Lorena R.es
dc.contributor.datacuratorSánchez-Arnau, Claudiaes
dc.type.resourcetypeBases de datoses

FicherosTamañoFormatoVerDescripción
BoW_years.xlsx344.6KbIcon   [Microsoft Excel 2007] Ver/Abrir
TFIDF_years.xlsx371.9KbIcon   [Microsoft Excel 2007] Ver/Abrir
BoW_secciones.xlsx1.171MbIcon   [Microsoft Excel 2007] Ver/Abrir
TFIDF_secciones.xlsx371.9KbIcon   [Microsoft Excel 2007] Ver/Abrir
kmeans_frecuencias_cluster_0.xlsx71.15KbIcon   [Microsoft Excel 2007] Ver/Abrir
kmeans_frecuencias_cluster_1.xlsx32.64KbIcon   [Microsoft Excel 2007] Ver/Abrir
kmeans_frecuencias_cluster_2.xlsx59.87KbIcon   [Microsoft Excel 2007] Ver/Abrir
kmeans_frecuencias_cluster_3.xlsx48.97KbIcon   [Microsoft Excel 2007] Ver/Abrir
pertenencia_clusters_kmeans.xlsx14.75KbIcon   [Microsoft Excel 2007] Ver/Abrir
frecuencia_bigramas.xlsx662.9KbIcon   [Microsoft Excel 2007] Ver/Abrir
frecuencia_trigramas.xlsx883.4KbIcon   [Microsoft Excel 2007] Ver/Abrir
asociaciones_palabras.xlsx215.3KbIcon   [Microsoft Excel 2007] Ver/Abrir
frecuencia_total.xlsx145.5KbIcon   [Microsoft Excel 2007] Ver/Abrir

Este registro aparece en las siguientes colecciones

Mostrar el registro sencillo del ítem

Atribución 4.0 Internacional
Excepto si se señala otra cosa, la licencia del ítem se describe como: Atribución 4.0 Internacional