Redefining Hallin and Mancini’s Media System: Cross-Border Investigative Networks in Europe [Dataset]

Romero-Domínguez, Lorena R.

doi:10.12795/11441/155231

Dataset

dc.coverage.spatial	Europa	es
dc.coverage.temporal	2014-2023	es
dc.creator	Romero-Domínguez, Lorena R.	es
dc.date.accessioned	2024-02-14T11:18:15Z
dc.date.available	2024-02-14T11:18:15Z
dc.date.created	2023-08-17
dc.date.issued	2024-02-14
dc.identifier.citation	Romero-Domínguez, L.R. (2024). Redefining Hallin and Mancini’s Media System: Cross-Border Investigative Networks in Europe [Dataset]. idUS (Depósito de Investigación de la Universidad de Sevilla). https://doi.org/10.12795/11441/155231.
dc.identifier.uri	https://hdl.handle.net/11441/155231
dc.description.abstract	En este trabajo se han analizado un total de 1015 documentos relativos a los resúmenes de las conferencias celebradas por Dataharvest (the European Investigative Journalism Conference) durante el período 2014-2023. Para el análisis se ha utilizado Python con los paquetes pandas, spacy, sklearn, sentences_transformers y matplotlib, además de algunos otros paquetes auxiliares y R con el paquete ggplot2 para las representaciones. Las técnicas empleadas a lo largo del análisis han sido: • Análisis frecuentista de textos, que permite hacer el conteo de aparición en documentos de tamaño variable. Se consideran diferentes términos gramaticalmente relacionados y sinónimos, habiéndose eliminado las stopwords. Se han utilizado distintas matrices de frecuencias: BoW (Bag of Words) con los conteos por palabra sin ninguna transformación, y TF-IDF utilizando una reducción logarítmica de la frecuencia para resaltar palabras que pueden ser menos comunes, pero aun así relevantes. También se han utilizado n-gramas para detectar apariciones adyacentes de términos. • Análisis de asociaciones entre términos: se trata de detectar apariciones conjuntas de términos en documento, sin necesidad de que las palabras aparezcan de forma consecutiva en el texto. Se ha utilizado un índice de coincidencia para ordenar la relevancia de las parejas de términos según sus apariciones en documentos. • Análisis de agrupamiento: se ha utilizado transformers (redes neuronales) aplicadas a vectores de documentos con sBERT. Con los resultados obtenidos se ha realizado un agrupamiento utilizando el método métrico k-means. Este método establece, a partir de un número determinado de centros propuesto por el analista (con el apoyo de método elbow curve), el mismo número de grupos de documentos de forma que se minimiza la distancia cuadrática entre los vectores de documento y cada uno de los centros. Entre todas las posibles opciones, el resultado es el que sitúa esos centros y establece una partición de todos los documentos asociando cada uno de ellos a un centro de forma que se minimiza el error cuadrático medio.	es
dc.description.tableofcontents	Análisis por años (BoW y TF-IDF) Análisis por secciones (BoW y TF-IDF) Clustering Kmeans_frecuencia Cluster 0 Kmeans_frecuencia Cluster 1 Kmeans_frecuencia Cluster 2 Kmeans_frecuencia Cluster 3 Pertenencia Clusters Kmeans N-gramas Frecuencia bigramas Frecuencia trigramas Asociaciones de palabras Frecuencia Total	es
dc.format	application/vnd.ms-excel	es
dc.language.iso	spa	es
dc.language.iso	eng	es
dc.rights	Atribución 4.0 Internacional	*
dc.rights.uri	http://creativecommons.org/licenses/by/4.0/	*
dc.subject	Periodismo de investigación transfronterizo	es
dc.subject	datos	es
dc.subject	Europa	es
dc.subject	sistemas de medios de comunicación	es
dc.subject	organizaciones sin ánimo de lucro	es
dc.subject	redes transnacionales	es
dc.subject	Cross-border investigative journalism	es
dc.subject	data	es
dc.subject	Europe	es
dc.subject	media systems	es
dc.subject	non-profit organisations	es
dc.subject	transnational network	es
dc.title	Redefining Hallin and Mancini’s Media System: Cross-Border Investigative Networks in Europe [Dataset]	es
dc.type	info:eu-repo/semantics/dataset	es
dc.rights.accessRights	info:eu-repo/semantics/openAccess	es
dc.contributor.affiliation	Universidad de Sevilla. Departamento de Periodismo II	es
dc.identifier.doi	10.12795/11441/155231
dc.contributor.group	Universidad de Sevilla. SEJ528: Medios, Políticas de Comunicación y Democracia en la Unión Europea (DEMOC-MEDIA)	es
dc.contributor.datacurator	Romero-Domínguez, Lorena R.	es
dc.contributor.datacurator	Sánchez-Arnau, Claudia	es
dc.type.resourcetype	Bases de datos	es

Ficheros	Tamaño	Formato	Ver
BoW_years.xlsx	344.6Kb	[Microsoft Excel 2007]	Ver/Abrir

TFIDF_years.xlsx	371.9Kb	[Microsoft Excel 2007]	Ver/Abrir

BoW_secciones.xlsx	1.171Mb	[Microsoft Excel 2007]	Ver/Abrir

TFIDF_secciones.xlsx	371.9Kb	[Microsoft Excel 2007]	Ver/Abrir

kmeans_frecuencias_cluster_0.xlsx	71.15Kb	[Microsoft Excel 2007]	Ver/Abrir

kmeans_frecuencias_cluster_1.xlsx	32.64Kb	[Microsoft Excel 2007]	Ver/Abrir

kmeans_frecuencias_cluster_2.xlsx	59.87Kb	[Microsoft Excel 2007]	Ver/Abrir

kmeans_frecuencias_cluster_3.xlsx	48.97Kb	[Microsoft Excel 2007]	Ver/Abrir

pertenencia_clusters_kmeans.xlsx	14.75Kb	[Microsoft Excel 2007]	Ver/Abrir

frecuencia_bigramas.xlsx	662.9Kb	[Microsoft Excel 2007]	Ver/Abrir

frecuencia_trigramas.xlsx	883.4Kb	[Microsoft Excel 2007]	Ver/Abrir

asociaciones_palabras.xlsx	215.3Kb	[Microsoft Excel 2007]	Ver/Abrir

frecuencia_total.xlsx	145.5Kb	[Microsoft Excel 2007]	Ver/Abrir

Este registro aparece en las siguientes colecciones

Mostrar el registro sencillo del ítem

Excepto si se señala otra cosa, la licencia del ítem se describe como: Atribución 4.0 Internacional