dc.contributor.advisor | Durán Díaz, Iván | es |
dc.creator | Márquez Tristán, Antonio | es |
dc.date.accessioned | 2019-04-03T13:23:31Z | |
dc.date.available | 2019-04-03T13:23:31Z | |
dc.date.issued | 2018 | |
dc.identifier.citation | Márquez Tristán, A. (2018). Formato de publicación de la escuela técnica. (Trabajo Fin de Grado Inédito). Universidad de Sevilla, Sevilla. | |
dc.identifier.uri | https://hdl.handle.net/11441/85170 | |
dc.description.abstract | En este trabajo se presenta una solución para el problema de Separación Ciega de Fuentes, especialmente
para el caso de fuentes de audio unísonas y moduladas, tanto en tiempo como en frecuencia mediante un
vibrato. A partir de una base teórica sobre el problema y sobre el método para solucionarlo, la Factorización
No Negativa de Matrices, se expone un modelo de forma teórica y práctica y su posible ejecución en Matlab ®
mediante un algoritmo.
El caso en el que se centra este trabajo, el de dos fuentes moduladas y unísonas, representa un gran desafío ya
que con NMF no se pueden asumir ciertas suposiciones de importante relevancia para una correcta separación.
En la búsqueda de una solución eficiente, vamos a trabajar con tensores, haciendo uso de la Factorización
No Negativa de Tensores, que es una ampliación de NMF a tensores. Dividiremos la STFT de la señal de
audio original en parches solapados y calcularemos la 2D-DFT a cada parche, obteniendo así un tensor de 4
dimensiones. A esto es a lo que se ha llamado Transformada de Destino Recurrente, que se incluye en el
Modelo de Destino Recurrente.
Sobre este tensor aplicaremos el algoritmo multiplicativo de separación, lo que marca la diferencia frente
a NMF, que lo aplica sobre la STFT.
Obtenida la separación, resulta necesario evaluar la calidad de la misma, para lo que se ha usado la
herramienta BSS Eval.
Después se ha hecho un estudio sobre la dependencia del algoritmo a los parámetros alfa y beta. Se han
buscado valores óptimos de separación en función de estos parámetros.
Por último, se presentan diversas simulaciones con las que se ha buscado comprobar las ventajas de este
modelo y sus posibles carencias, así como sus posibles líneas futuras y las conclusiones que hemos obtenido
tras el trabajo realizado. | es |
dc.description.abstract | In this paper we present a solution for the Blind Source Separation problem, especially in the case of unison
and modulated audio sources, both in time and frequency because of a vibrato. From a theoretical base
on the problem and on the method to solve it, the Non-Negative Matrix Factorization, a model is exposed in a
theoretical and practical way, and its possible execution in Matlab through an algorithm.
The case in which we have focus this work, the two unisons and modulated sources, has represented a
great challenge because NMF can’t assume certain assumptions, specially important for a correct separation.
In the search of an efficient solution, we have worked with tensors, using the Non-Negative Tensor Factorization,
which is an ampliaton of NMF to tensors.We will divide the original audio signal STFT in overlapped
patches and then, 2D-DFT should be compute to every patch, obtaining a 4 dimensions tensor. This procces
has been called Common Fate Transform, included in the Common Fate Model.
A multiplicative algorithm will be applied to the computed tensor, this marks the difference with NMF,
which apply this algorithm directly to the whole STFT.
Once the separation is obtained, it is necessary to evaluate the quality of the separation, for which the tool
BSS Eval has been used.
Then, a study on the dependences of the algorithm on the alpha and beta parameters was made. Optimal
separation values have been sought as a function of these parameters.
Finally, some different simulations are presented, with these simulations we have tried to check the
advantages of this model, and their possibles lacks, as well as its possible future lines y and the conclusions
we have obtained after the work done. | es |
dc.format | application/pdf | es |
dc.language.iso | spa | es |
dc.rights | Atribución-NoComercial-CompartirIgual 4.0 Internacional | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-sa/4.0/ | * |
dc.subject | Audio | es |
dc.subject | Frecuencias | es |
dc.subject | NMF | es |
dc.title | Formato de publicación de la escuela técnica | es |
dc.type | info:eu-repo/semantics/bachelorThesis | es |
dc.type.version | info:eu-repo/semantics/publishedVersion | es |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | es |
dc.contributor.affiliation | Universidad de Sevilla. Departamento de Teoría de la Señal y Comunicaciones | es |
dc.description.degree | Universidad de Sevilla. Grado en Ingeniería de las Tecnologías de Telecomunicación | es |
idus.format.extent | 80 p. | es |