Tesis (Ciencias de la Computación e Inteligencia Artificial)https://hdl.handle.net/11441/113052024-03-28T19:09:25Z2024-03-28T19:09:25ZControl del reloj circadiano por la señal fotoperiódica en plantashttps://hdl.handle.net/11441/1336102024-02-17T16:27:53Z2022-04-28T00:00:00ZControl del reloj circadiano por la señal fotoperiódica en plantas
Los organismos fotosintéticos son muy eficientes en la adaptación de su desarrollo a las
condiciones ambientales. Para conseguir esta adaptación monitorizan continuamente los
estímulos externos que les llegan del ambiente y promueven cambios fisiológicos, como ocurre
con las modificaciones del transcriptoma. La luz solar es esencial para la supervivencia de los
organismos fotosintéticos, ya que constituye su principal fuente de energía y controla múltiples
aspectos de su fisiología. En la percepción de la luz en plantas y algas participan un conjunto de
receptores y factores de transcripción que conectan las señales procedentes de la luz con
cambios específicos en la expresión génica. La existencia de eventos externos cíclicos muy
predecibles como la sucesión de días/noches o de las estaciones, permite coordinar y anticipar de
manera muy robusta los procesos biológicos. Esta medida del tiempo es llevada a cabo por un
oscilador interno denominado reloj circadiano. Por otra parte, la señalización de la vía
fotoperiódica permite a los organismos vegetales medir la longitud del día y así obtener
información estacional para controlar complejos procesos que son clave para su supervivencia
como la floración. Uno de los genes centrales en esta vía es CONSTANS, que está regulado a
nivel transcripcional y postraduccional por el reloj circadiano y por señales luminosas. En esta
tesis doctoral se ha seguido un enfoque de Biología Molecular de Sistemas para entender cómo
han evolucionado estos procesos a lo largo del linaje verde, se han generado herramientas para
su estudio y finalmente se ha descrito una nueva conexión entre el reloj circadiano y la vía
fotoperiódica en la planta modelo Arabidopsis thaliana.
En una primera aproximación investigamos la evolución de la expresión génica diaria en el
linaje vegetal, empleando las microalgas Ostreococcus tauri y Chlamydomonas reinhardtii y la
planta superior Arabidopsis thaliana. Inicialmente, realizamos un estudio de ortología que ha
revelado por una parte la aparición de genes específicos en Chamydomonas y Arabidopsis y por
otra parte la amplificación y diversificación de familias génicas. Además, hemos investigado cómo
ha cambiado la influencia de los ciclos día/noche sobre el transcriptoma a lo largo de la evolución
vegetal mediante la construcción de redes de co-expresión en ciclos de luz/oscuridad. Nuestros
resultados indican una mayor dependencia de los ciclos diurnos en microalgas que en plantas. En
cuanto a la evolución de los patrones de expresión, hemos observado un alto nivel de
conservación en genes que se expresan en las transiciones luz/oscuridad a pesar de la gran
distancia evolutiva entre algas y plantas. Estos resultados pueden ser explorados en la
herramienta CircadiaNet.
En segundo lugar, construimos la red transcripcional ATTRACTOR que integra datos
transcriptómicos y datos de ChIP-seq de factores de transcripción involucrados en el reloj
circadiano y en la señalización por luz. De esta forma, el estudio de la red permite investigar la
regulación coordinada del reloj circadiano y la señalización lumínica sobre la expresión génica en
Arabidopsis. Mediante el análisis topológico de ATTRACTOR hemos descrito que estos programas
transcripcionales poseen la característica conocida como “robusto pero frágil”, es decir, son
robustos frente a ataques aleatorios y frágiles frente a ataques dirigidos a genes altamente
conectados. Por otra parte, se ha demostrado que los genes cuya regulación es más dependiente
del reloj circadiano se expresan durante las primeras horas de la mañana, modulando procesos
concretos como respuesta inmune, respuesta a hormonas o crecimiento. Además, se ha descrito
que algunos motivos de red compuestos por varios factores de transcripción pueden explicar la
regulación de determinados aspectos del desarrollo, dando lugar a propiedades emergentes. Por
ejemplo, el motivo formado por CCA1, PIF y PRR5 participa en la respuesta a sequía y frío. Para
este fin, se ha desarrollado una aplicación web para su exploración por parte de la comunidad
científica.
Por último, utilizando estas herramientas, hemos demostrado un nuevo papel para CO en
la regulación del reloj circadiano en Arabidopsis. CO formaría parte de una señalización retrógrada
desde la vía fotoperiódica hacia el oscilador central, proporcionando información estacional al
reloj. En condiciones de día largo, CO se une a genes centrales del reloj circadiano para alterar su
perfil de expresión. Uno de estos genes es el PSEUDO RESPONSE REGULATOR 5 (PRR5), con
el que además comparte sitios de unión en el genoma. Por ello, CO y PRR5 establecen un motivo
de doble retroalimentación con salida múltiple regulando genes diana en común. Además, hemos
encontrado que CO se une a motivos de DNA G-box en estos promotores, probablemente a través
del factor de transcripción bZIP LONG HYPOCOTIL 5 (HY5).; Photosynthetic organisms are highly efficient in the adaptation of their development to
environmental conditions. To achieve this, they continuosly track the external stimuli and promote
physiological changes, which can be readily checked by transcriptome modifications. Sunlight is
essential for plant survival as it is the main energy source and controls multiple aspects of their
physiology. In plants and algae, light perception is carried out by several receptors and
transcription factors that connect light signals with specific changes in gene expression. The
existence of highly predictable cyclical external events, such as the succession of days/nights or
seasons, allows them to coordinate and anticipate biological processes in a robust way. This daily
time measurement is performed by an internal oscillator called circadian clock. Alternatively, the
photoperiodic regulatory pathway allows plants and algae to measure the day length and obtain
seasonal information to control complex processes that are key to their survival, such as flowering.
One of the key genes in this pathway is CONSTANS, which is regulated at transcriptional and posttranslational
levels by the circadian clock and by light signals. In this doctoral thesis, a Molecular
Systems Biology approach was chosen to try to understand how these processes have evolved
along the green lineage. Several tools have been generated for their study and a new connection
between the circadian clock and the photoperiodic pathway has been described in the model plant
Arabidopsis thaliana.
Firstly, we studied the diurnal gene expression evolution along the plant lineage, using the
microalgae Ostreococcus tauri and Chlamydomonas reinhardtii and the spermatophyte
Arabidopsis thaliana. Initially, we have carried out an orthology analysis that has revealed, on the
one hand, the emergence of specific genes in Chamydomonas and Arabidopsis and, on the other
hand, the amplification and diversification of gene families between plants and algae. In addition,
we have investigated the influence raised by day/night cycles on the transcriptome throughout
evolution by constructing gene networks of light/dark samples. Our results indicate a greater
dependence on diurnal cycles in microalgae than in plants. Regarding the evolution of expression
patterns, we have observed a high level of conservation in genes that are expressed in light/dark
transitions despite the great evolutionary distance between algae and plants. These results can be
explored in the CircadiaNet web.
Second, the ATTRACTOR transcriptional network allows to elucidate the coordinated
regulation of circadian clock and light signalling on Arabidopsis gene expression. Through the
topological analysis of the network, we have shown that these transcriptional programs have the
property known as “robust but fragile”, meaning that they are robust against random failures and
fragile against attacks directed at highly connected genes. Furthermore, we have shown that those
genes whose regulation is more dependent on the circadian clock are expressed during the first
hours of the morning, modulating specific processes such as the plant pathogen interaction,
response to hormones or growth. In addition, it has been described that network motifs constituted
by several transcription factors may help to explain the regulation of certain aspects of development, giving rise to emergent properties. For example, the CCA1/PIF5/PRR5 network motif
participates in the response to drought and cold. For this reason, a web application has been
developed and is available for the scientific community.
Finally, using these tools, we have demonstrated a new role for CO in the regulation of the
circadian clock in Arabidopsis. CO would participate in a retrograde signaling from the
photoperiodic pathway to the central oscillator, providing seasonal information to the system.
Under long-day conditions, CO could bind the promoter of core genes of the circadian clock to alter
its expression profile. One of these genes is the PSEUDO RESPONSE REGULATOR 5 (PRR5),
which also shares CO binding sites in the genome. Therefore, CO and PRR5 establish a double
feedback motif with multiple output regulating common target genes. Furthermore, we have found
that CO binds to G-box DNA motifs in these promoters, probably through a bZIP transcription
factor, such as LONG HYPOCOTIL 5 (HY5).
2022-04-28T00:00:00ZPromoting and inhibiting contexts in membrane computinghttps://hdl.handle.net/11441/991772024-02-14T19:35:54Z2005-11-29T00:00:00ZPromoting and inhibiting contexts in membrane computing
2005-11-29T00:00:00ZMembrane computing, neural inspirations, gene assembly in ciliateshttps://hdl.handle.net/11441/990332024-02-14T19:26:48Z2007-03-28T00:00:00ZMembrane computing, neural inspirations, gene assembly in ciliates
La Tesis enmarca dentro de la disciplina de la computación celular con membranas, un modelo de computación orientado a máquinas, inspirado en la estructura y funcionamiento de las células de los organismos vivos, Que fue creada por G. Paun a finales de 1998 y que, en Octubre de 2003, el prestigioso institute for scientific information (I.S.I., USA) designó a dicha disciplina como fast emergin research front in computes science. La memoria aporta nuevas vías para atacar una serie de problemas clásicos relativos a la potencia y la eficiencia computacional de modelos de computación bio-inspirados y no convencionales, así como resultados relevantes en dichos modelos, conformando una memoria de gran valor científico que cumple, con creces, los requisitos para ser considerados como una tesis doctoral con acreditación de doctorado europeo.
2007-03-28T00:00:00ZOptimization of high-throughput real-time processes in physics reconstructionhttps://hdl.handle.net/11441/913522024-02-13T20:25:52Z2019-11-29T00:00:00ZOptimization of high-throughput real-time processes in physics reconstruction
La presente tesis se ha desarrollado en colaboración entre
la Universidad de Sevilla y la Organización Europea para la
Investigación Nuclear, CERN.
El detector LHCb es uno de los cuatro grandes detectores
situados en el Gran Colisionador de Hadrones, LHC. En LHCb,
se colisionan partículas a altas energías para comprender la
diferencia existente entre la materia y la antimateria. Debido a la
cantidad ingente de datos generada por el detector, es necesario
realizar un filtrado de datos en tiempo real, fundamentado en
los conocimientos actuales recogidos en el Modelo Estándar de
física de partículas. El filtrado, también conocido como High
Level Trigger, deberá procesar un throughput de 40 Tb/s de datos,
y realizar un filtrado de aproximadamente 1 000:1, reduciendo
el throughput a unos 40 Gb/s de salida, que se almacenan para
posterior análisis.
El proceso del High Level Trigger se subdivide a su vez en
dos etapas: High Level Trigger 1 (HLT1) y High Level Trigger
2 (HLT2). El HLT1 transcurre en tiempo real, y realiza una reducción de datos de aproximadamente 30:1. El HLT1 consiste
en una serie de procesos software que reconstruyen lo que ha
sucedido en la colisión de partículas. En la reconstrucción del
HLT1 únicamente se analizan las trayectorias de las partículas
producidas fruto de la colisión, en un problema conocido como
reconstrucción de trazas, para dictaminar el interés de las colisiones.
Por contra, el proceso HLT2 es más fino, requiriendo más
tiempo en realizarse y reconstruyendo todos los subdetectores
que componen LHCb.
Hacia 2020, el detector LHCb, así como todos los componentes
del sistema de adquisici´on de datos, serán actualizados acorde
a los últimos desarrollos técnicos. Como parte del sistema
de adquisición de datos, los servidores que procesan HLT1 y
HLT2 también sufrirán una actualización. Al mismo tiempo, el
acelerador LHC será también actualizado, de manera que la
cantidad de datos generada en cada cruce de grupo de partículas
aumentare en aproxidamente 5 veces la actual. Debido a
las actualizaciones tanto del acelerador como del detector, se
prevé que la cantidad de datos que deberá procesar el HLT en
su totalidad sea unas 40 veces mayor a la actual.
La previsión de la escalabilidad del software actual a 2020
subestim´ó los recursos necesarios para hacer frente al incremento
en throughput. Esto produjo que se pusiera en marcha un
estudio de todos los algoritmos tanto del HLT1 como del HLT2,
así como una actualización del código a nuevos estándares, para
mejorar su rendimiento y ser capaz de procesar la cantidad de
datos esperada.
En esta tesis, se exploran varios algoritmos de la reconstrucción de LHCb. El problema de reconstrucción de trazas se analiza
en profundidad y se proponen nuevos algoritmos para su
resolución. Ya que los problemas analizados exhiben un paralelismo
masivo, estos algoritmos se implementan en lenguajes
especializados para tarjetas gráficas modernas (GPUs), dada su
arquitectura inherentemente paralela. En este trabajo se dise ˜nan
dos algoritmos de reconstrucción de trazas. Además, se diseñan
adicionalmente cuatro algoritmos de decodificación y un algoritmo
de clustering, problemas también encontrados en el HLT1.
Por otra parte, se diseña un algoritmo para el filtrado de Kalman,
que puede ser utilizado en ambas etapas.
Los algoritmos desarrollados cumplen con los requisitos esperados
por la colaboración LHCb para el año 2020. Para poder
ejecutar los algoritmos eficientemente en tarjetas gráficas, se
desarrolla un framework especializado para GPUs, que permite
la ejecución paralela de secuencias de reconstrucción en GPUs.
Combinando los algoritmos desarrollados con el framework, se
completa una secuencia de ejecución que asienta las bases para
un HLT1 ejecutable en GPU.
Durante la investigación llevada a cabo en esta tesis, y gracias
a los desarrollos arriba mencionados y a la colaboración de
un pequeño equipo de personas coordinado por el autor, se
completa un HLT1 ejecutable en GPUs. El rendimiento obtenido
en GPUs, producto de esta tesis, permite hacer frente al reto de
ejecutar una secuencia de reconstrucción en tiempo real, bajo
las condiciones actualizadas de LHCb previstas para 2020. As´ı
mismo, se completa por primera vez para cualquier experimento
del LHC un High Level Trigger que se ejecuta únicamente en
GPUs. Finalmente, se detallan varias posibles configuraciones
para incluir tarjetas gr´aficas en el sistema de adquisición de
datos de LHCb.; The current thesis has been developed in collaboration between
Universidad de Sevilla and the European Organization for Nuclear
Research, CERN.
The LHCb detector is one of four big detectors placed alongside
the Large Hadron Collider, LHC. In LHCb, particles are
collided at high energies in order to understand the difference
between matter and antimatter. Due to the massive quantity
of data generated by the detector, it is necessary to filter data
in real-time. The filtering, also known as High Level Trigger,
processes a throughput of 40 Tb/s of data and performs a selection
of approximately 1 000:1. The throughput is thus reduced
to roughly 40 Gb/s of data output, which is then stored for
posterior analysis.
The High Level Trigger process is subdivided into two stages:
High Level Trigger 1 (HLT1) and High Level Trigger 2 (HLT2).
HLT1 occurs in real-time, and yields a reduction of data of approximately
30:1. HLT1 consists in a series of software processes
that reconstruct particle collisions. The HLT1 reconstruction only
analyzes the trajectories of particles produced at the collision,
solving a problem known as track reconstruction, that determines
whether the collision data is kept or discarded. In contrast,
HLT2 is a finer process, which requires more time to execute
and reconstructs all subdetectors composing LHCb.
Towards 2020, the LHCb detector and all the components
composing the data acquisition system will be upgraded. As
part of the data acquisition system, the servers that process
HLT1 and HLT2 will also be upgraded. In addition, the LHC
accelerator will also be updated, increasing the data generated in
every bunch crossing by roughly 5 times. Due to the accelerator
and detector upgrades, the amount of data that the HLT will
require to process is expected to increase by 40 times.
The foreseen scalability of the software through 2020 underestimated
the required resources to face the increase in data
throughput. As a consequence, studies of all algorithms composing
HLT1 and HLT2 and code modernizations were carried
out, in order to obtain a better performance and increase the
processing capability of the foreseen hardware resources in the
upgrade.
In this thesis, several algorithms of the LHCb recontruction
are explored. The track reconstruction problem is analyzed
in depth, and new algorithms are proposed. Since the analyzed
problems are massively parallel, these algorithms are implemented
in specialized languages for modern graphics cards
(GPUs), due to their inherently parallel architecture. From this
work stem two algorithm designs. Furthermore, four additional
decoding algorithms and a clustering algorithms have been designed
and implemented, which are also part of HLT1. Apart
from that, an parallel Kalman filter algorithm has been designed
and implemented, which can be used in both HLT stages.
The developed algorithms satisfy the requirements of the
LHCb collaboration for the LHCb upgrade. In order to execute
the algorithms efficiently on GPUs, a software framework specialized
for GPUs is developed, which allows executing GPU
reconstruction sequences in parallel. Combining the developed
algorithms with the framework, an execution sequence is completed
as the foundations of a GPU HLT1.
During the research carried out in this thesis, the aforementioned
developments and a small group of collaborators coordinated
by the author lead to the completion of a full GPU
HLT1 sequence. The performance obtained on GPUs allows
executing a reconstruction sequence in real-time, under LHCb
upgrade conditions. The developed GPU HLT1 constitutes the
first GPU high level trigger ever developed for an LHC experiment.
Finally, various possible realizations of the GPU HLT1 to
integrate in a production GPU-equipped data acquisition system
are detailed.
2019-11-29T00:00:00Z