Formato de publicación de la escuela técnica

Márquez Tristán, Antonio

Final Degree Project

dc.contributor.advisor	Durán Díaz, Iván	es
dc.creator	Márquez Tristán, Antonio	es
dc.date.accessioned	2019-04-03T13:23:31Z
dc.date.available	2019-04-03T13:23:31Z
dc.date.issued	2018
dc.identifier.citation	Márquez Tristán, A. (2018). Formato de publicación de la escuela técnica. (Trabajo Fin de Grado Inédito). Universidad de Sevilla, Sevilla.
dc.identifier.uri	https://hdl.handle.net/11441/85170
dc.description.abstract	En este trabajo se presenta una solución para el problema de Separación Ciega de Fuentes, especialmente para el caso de fuentes de audio unísonas y moduladas, tanto en tiempo como en frecuencia mediante un vibrato. A partir de una base teórica sobre el problema y sobre el método para solucionarlo, la Factorización No Negativa de Matrices, se expone un modelo de forma teórica y práctica y su posible ejecución en Matlab ® mediante un algoritmo. El caso en el que se centra este trabajo, el de dos fuentes moduladas y unísonas, representa un gran desafío ya que con NMF no se pueden asumir ciertas suposiciones de importante relevancia para una correcta separación. En la búsqueda de una solución eficiente, vamos a trabajar con tensores, haciendo uso de la Factorización No Negativa de Tensores, que es una ampliación de NMF a tensores. Dividiremos la STFT de la señal de audio original en parches solapados y calcularemos la 2D-DFT a cada parche, obteniendo así un tensor de 4 dimensiones. A esto es a lo que se ha llamado Transformada de Destino Recurrente, que se incluye en el Modelo de Destino Recurrente. Sobre este tensor aplicaremos el algoritmo multiplicativo de separación, lo que marca la diferencia frente a NMF, que lo aplica sobre la STFT. Obtenida la separación, resulta necesario evaluar la calidad de la misma, para lo que se ha usado la herramienta BSS Eval. Después se ha hecho un estudio sobre la dependencia del algoritmo a los parámetros alfa y beta. Se han buscado valores óptimos de separación en función de estos parámetros. Por último, se presentan diversas simulaciones con las que se ha buscado comprobar las ventajas de este modelo y sus posibles carencias, así como sus posibles líneas futuras y las conclusiones que hemos obtenido tras el trabajo realizado.	es
dc.description.abstract	In this paper we present a solution for the Blind Source Separation problem, especially in the case of unison and modulated audio sources, both in time and frequency because of a vibrato. From a theoretical base on the problem and on the method to solve it, the Non-Negative Matrix Factorization, a model is exposed in a theoretical and practical way, and its possible execution in Matlab through an algorithm. The case in which we have focus this work, the two unisons and modulated sources, has represented a great challenge because NMF can’t assume certain assumptions, specially important for a correct separation. In the search of an efficient solution, we have worked with tensors, using the Non-Negative Tensor Factorization, which is an ampliaton of NMF to tensors.We will divide the original audio signal STFT in overlapped patches and then, 2D-DFT should be compute to every patch, obtaining a 4 dimensions tensor. This procces has been called Common Fate Transform, included in the Common Fate Model. A multiplicative algorithm will be applied to the computed tensor, this marks the difference with NMF, which apply this algorithm directly to the whole STFT. Once the separation is obtained, it is necessary to evaluate the quality of the separation, for which the tool BSS Eval has been used. Then, a study on the dependences of the algorithm on the alpha and beta parameters was made. Optimal separation values have been sought as a function of these parameters. Finally, some different simulations are presented, with these simulations we have tried to check the advantages of this model, and their possibles lacks, as well as its possible future lines y and the conclusions we have obtained after the work done.	es
dc.format	application/pdf	es
dc.language.iso	spa	es
dc.rights	Atribución-NoComercial-CompartirIgual 4.0 Internacional	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-sa/4.0/	*
dc.subject	Audio	es
dc.subject	Frecuencias	es
dc.subject	NMF	es
dc.title	Formato de publicación de la escuela técnica	es
dc.type	info:eu-repo/semantics/bachelorThesis	es
dc.type.version	info:eu-repo/semantics/publishedVersion	es
dc.rights.accessRights	info:eu-repo/semantics/openAccess	es
dc.contributor.affiliation	Universidad de Sevilla. Departamento de Teoría de la Señal y Comunicaciones	es
dc.description.degree	Universidad de Sevilla. Grado en Ingeniería de las Tecnologías de Telecomunicación	es
idus.format.extent	80 p.	es

Files	Size	Format	View	Description
TFG-2034-MARQUEZ.pdf	3.616Mb	[PDF]	View/Open

This item appears in the following collection(s)

Grado en Ingeniería de las Tecnologías de Telecomunicación

Show simple item record

Except where otherwise noted, this item's license is described as: Atribución-NoComercial-CompartirIgual 4.0 Internacional