Upload
duongminh
View
214
Download
0
Embed Size (px)
Citation preview
UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS DEPARTAMENTO DE INGENIERÍA QUÍMICA Y BIOTECNOLOGÍA
Modelo integrado de redes de regulación génica y flujos metabólicos en levaduras
MEMORIA PARA OPTAR AL TÍTULO DE INGENIERO CIVIL EN BIOTECNOLOGÍA
MARKO ANTONIO BUDINICH ABARCA
PROFESOR GUÍA: DR. JUAN ASENJO
PROFESOR CO-GUÍA: DR. IVAN RAPAPORT
PROFESOR INTEGRANTE:
DRA. BARBARA ANDREWS
SANTIAGO DE CHILE AGOSTO 2007
RESUMEN DE LA MEMORIA PARA OPTAR AL TITULO DE INGENIERO CIVIL EN BIOTECNOLOGIA POR: MARKO BUDINICH A. FECHA: 20/08/2007 PROF. GUIA: Dr. JUAN ASENJO
El presente trabajo tiene como objetivo principal la modelación de la regulación
génica para genes que se expresen diferencialmente durante el salto diaúxico. Se asume que
los cambios de expresión de los genes de vías metabólicas son consecuencia de las
diferencias de concentración de los factores de transcripción y que esta varía de acuerdo a
las condiciones exteriores.
Para elegir los genes de vías metabólicas que se expresan diferencialmente se
utilizan los datos de microarrays de la tesis doctoral de Humberto Díaz para la cepa P(-)
creciendo en glucosa y etanol. Se elige como criterio de cambio una diferencia de expresión
de 1.5 veces en los genes que participan de las vías metabólicas: Metabolismo de 1-fosfato
glucosa, fermentación de glucosa, glicólisis, ciclo del TCA y respiración aeróbica, según la
información disponible en la base de datos Saccharomyces Genome Database, siendo
elegidos 36 genes, de los cuales 33 son regulados.
Para generar la red de regulación se utilizaron las asociaciones que reporta la base
de datos YEASTRACT para seleccionar factores de transcripción asociados a los genes de
vías metabólicas; además, se impuso que los factores presentaran un cambio de expresión
según un test de hipótesis para medias distintas y varianzas desconocidas en las distintas
condiciones de crecimiento y que poseyeran una ontología relevante. Mediante un
procedimiento iterativo se seleccionan 26 reguladores, de los cuales 23 regulan a genes de
vías metabólicas.
Se selecciona a HXK2 para modelar cuantitativamente su expresión utilizando
como activador y represor a Gcr2p y Rgt1p, simulando un cambio externo en la
concentración de glucosa. Si bien está en concordancia con datos publicados a nivel
cualitativo, las aproximaciones utilizadas distorsionan de manera perceptible el resultado
final.
2
1 INTRODUCCIÓN ...................................................................................................................... 3
1.1 FUNDAMENTOS ......................................................................................................................... 3 1.2 NOTA SOBRE LA NOMENCLATURA........................................................................................... 5 1.3 MOTIVACIÓN Y JUSTIFICACIÓN .............................................................................................. 6 1.4 OBJETIVOS ................................................................................................................................ 6 1.5 ALCANCES................................................................................................................................. 7 1.6 APORTE AL CAMPO O DISCIPLINA ........................................................................................... 7
2 METODOLOGÍA....................................................................................................................... 8
2.1 ELECCIÓN DE LOS GENES CON CAMBIOS EN NIVELES DE EXPRESIÓN................................... 8 2.2 GENERACIÓN DE LA RED DE REGULACIÓN ........................................................................... 10 2.2.1 VISUALIZACIÓN UTILIZANDO GRAPHVIZ.................................................................................. 11 2.2.2 ANÁLISIS DE LA RED UTILIZANDO PAJEK ................................................................................. 12 2.3 MODELACIÓN DE LA REGULACIÓN........................................................................................ 13
3 RESULTADOS Y DISCUSIONES ......................................................................................... 16
3.1 SELECCIÓN DE GENES............................................................................................................. 16 3.1.1 GENES DE VÍAS METABÓLICAS................................................................................................. 17 3.1.2 GENES FACTORES DE TRANSCRIPCIÓN ................................................................................... 21 3.1.3 ANÁLISIS DE LOS GENES SELECCIONADOS ............................................................................... 25 3.2 VISUALIZACIÓN DE LA RED.................................................................................................... 27 3.3 ANÁLISIS DE LA RED UTILIZANDO PAJEK ............................................................................. 28 3.3.1 RESULTADO DE LA APLICACIÓN DEL MÉTODO DE LOS K-NEIGHBORS A HXK2 ......................... 30 3.4 REVISIÓN DE LA LITERATURA ASOCIADA A LA REGULACIÓN DE HXK2 ............................ 31 3.5 MODELACIÓN DE LA EXPRESIÓN DE HXK2.......................................................................... 32 3.5.1 ECUACIONES EMPLEADAS....................................................................................................... 32 3.5.1.1 Nivel 1: RNA polimerasa II ............................................................................................... 35 3.5.1.2 Nivel 2: GCR2 ................................................................................................................... 37 3.5.1.3 Nivel 3: RGT1 ................................................................................................................... 38 3.5.2 RESOLUCIÓN DEL SISTEMA ..................................................................................................... 39 3.6 APLICACIÓN A PERFIL DE MRNA Y FLUJO METABÓLICO.................................................... 41
4 CONCLUSIONES .................................................................................................................... 43
4.1 RECOMENDACIONES............................................................................................................... 44
5 BIBLIOGRAFÍA ...................................................................................................................... 46
6 ANEXOS.................................................................................................................................... 51
A. CD ADJUNTO............................................................................................................................ 51 B. GRÁFICOS DE REGULACIÓN PARA LOS GENES DE VÍAS METABÓLICAS............................... 55
3
1 Introducción
El propósito del presente trabajo es integrar de manera cuantitativa información
sobre la regulación de los genes de las vías metabólicas en la levadura Saccharomyces
cerevisiae que aparece descrita en la literatura con objeto de calcular la expresión génica
durante el salto diáuxico. Para ello, es necesario en primer lugar construir una red de
regulación para genes de vías metabólicas que tenga significado biológico y luego utilizar
alguna metodología que permita modelar de el comportamiento de los reguladores sobre los
genes de interés.
1.1 Fundamentos
Una característica fundamental de los sistemas biológicos es la existencia de partes
que cumplen ciertas funciones y que interactúan entre sí. Esto es válido tanto a escala de
organismos (poblaciones, comunidades, ecosistemas, etc.) como a niveles celulares (redes
metabólicas, redes de regulación, compartimentos celulares, interacciones proteína-
proteína, etc.). La existencia de estas “unidades funcionales” separa a la biología del resto
de las disciplinas de las ciencias naturales y las acerca más a áreas de la informática y la
ingeniería. Ejemplos de unidad funcional son las enzimas, que transforman un sustrato en
otro y la expresión génica, que a partir de estímulos externos modula la cantidad de mRNA
que se genera. (Kremling et. al, 2000)
Las relaciones entre unidades funcionales pueden ser entendidas en términos de
redes. Siguiendo los ejemplos planteados, la transformación de un sustrato en un producto
puede requerir varias reacciones mediadas por diferentes enzimas, generando una red
metabólica. Los distintos elementos que regulan la expresión de un gen generan una red de
regulación. (Xia et. al, 2004)
4
La manera más directa de regulación génica consiste en que una proteína interactúe
con una región del DNA conocida como promotor, que antecede a la parte de un gen que
codifica efectivamente para una secuencia de aminoácidos, aumentando o disminuyendo
(fenómenos denominados activación o represión, respectivamente) la cantidad de mRNA
que es sintetizado por la proteína RNA polimerasa II.
Uno de los procesos en Saccharomyces cerevisiae que muestra una reestructuración
a nivel de transcritos es el salto o crecimiento diaúxico1. Es el proceso mediante el cual un
microorganismo cambia de una fuente de alimento a otra. En este caso, cepas estudiadas
por Humberto Díaz tienen una etapa de crecimiento en glucosa que deja como producto
etanol, que es consumido en la segunda parte de la fermentación. Este cambio de fuente de
alimento hace necesario un reajuste a nivel de rutas metabólicas lo que implica sintetizar
ciertas enzimas para activar nuevas rutas metabólicas, con el consiguiente cambio de los
perfiles de expresión.
Los cambios de expresión globales de un organismo pueden ser identificados
mediante la utilización de técnicas masivas como los microarrays. Esta técnica tiene como
resultado una gran cantidad de información, que puede ser analizada mediante métodos
estadísticos como el agrupamiento2 de perfiles similares. Para el presente trabajo se dispone
de los datos de la tesis doctoral de Humberto Díaz, realizados en cepas P+ y P- en las fases
de crecimiento en glucosa, crecimiento en etanol y fase estacionaria.
Adicionalmente existen bases de datos como Saccharomyces Genome Database
(SGD) y Yeast Search for Transcriptional Regulators And Consensus Tracking
(YEASTRACT) que mantienen numerosa información sobre el genoma y asociaciones
regulatorias de Saccharomyces cerevisiae, respectivamente. Ambas bases de datos son
mantenidas de manera manual, lo que garantiza la calidad de la información que entregan.
1 La expresión proviene del francés “diauxie” que significa crecimiento doble. 2 Clustering
5
Un tipo de descripción que se asocia a un gen es la denominada “ontología”. En un
sentido amplio, una ontología es una especificación de un vocabulario relacional; en otras
palabras, corresponde a un conjunto de términos definidos, acotados y relacionados
jerárquicamente para ser usados en un campo o disciplina. En este caso, lo términos de la
ontología son del tipo biológico. Por ejemplo, al estudiar la expresión de un determinado
gen, se puede utilizar como criterio de búsqueda las palabras “síntesis de proteínas”,
“expresión” o “transcripción”, por lo que puede ser difícil establecer cuáles resultados son
equivalentes entre sí.
El proyecto Gene Ontology (GO) es un esfuerzo conjunto para proveer de una
ontología común a diferentes bases de datos relacionadas con genes y productos génicos.
Siguiendo con ejemplo anterior, se podría utilizar la ontología “expresión” y este término
sería derivado de otro más general como “biosíntesis”. La base de datos SGD participa de
GO, por lo que contiene las asociaciones de las ontologías para cada gen.
El problema de las redes no es exclusivo de la biología, sino que abarca un gran
número de áreas de las ciencias e ingeniería. Para atacar estos problemas, se han generado
una serie de herramientas computacionales tanto de diagramación como de análisis. En el
presente trabajo se utilizarán dos softwares, Graphviz y Pajek, ambos programas de fuente
abierta y disponibles en sus sitios web.
1.2 Nota sobre la nomenclatura
La nomenclatura utilizada sigue las pautas recomendadas por SGD: Letras
mayúsculas para hablar de un gen (YFG1)3, primera letra mayúscula y el sufijo “p” para
hablar de proteína (Yfg1p), cursivas minúsculas para hablar de cepas mutantes que no
expresan el gen (yfg1) y mayúsculas cursivas (YFG1) para cepas que expresan el gen de
manera recombinante.
3 YFG es un acrónimo de Your Favorite Gene. Se utiliza como ejemplo frecuente en la literatura relacionada.
6
1.3 Motivación y Justificación
Las redes de interacción constituyen el primer paso para la modelación de la
dinámica celular, lo que constituye un desafío permanente para la biología de sistemas; la
generación de modelos mecanísticos que tengan poder predictivo son de una tremenda
importancia para la ciencia e ingeniería, pues permiten optimizar procesos, realizar
experimentos in silico, otorgar fundamentos para un diseño experimental, etc.
Además, Saccharomyces cerevisiae es uno de los organismos modelo más
ampliamente estudiados, lo que hace suponer a priori que existirá la información suficiente
para desarrollar un modelo cuantitativo; además, existe un set de datos (DeRisi et al., 1997)
que miden la expresión global de los genes de este organismo en el tiempo durante un
crecimiento diaúxico, lo que es fundamental para validar el modelo.
1.4 Objetivos
General
Integrar información proveniente de la regulación génica de forma cuantitativa a
flujos metabólicos en genes de la vía central del carbono en levadura.
Específicos
Desarrollar una metodología que permita seleccionar genes de vías metabólicas
y de factores de transcripción relevantes.
Generar una red de regulación para los genes de vías metabólicas.
Utilizar una metodología publicada que permita cuantificar las interacciones
entre los factores de transcripción y los genes de las vías metabólicas.
7
1.5 Alcances La presente memoria se centrará en los genes del metabolismo central del carbono,
no se analizarán otras rutas metabólicas. Además, sólo se estudiará el comportamiento a partir de los datos de la cepa P- (no recombinante)
Además, no se contempla realizar experiencias de laboratorio para recabar los datos
que sean necesarios, pues éstos se obtendrán de la literatura correspondiente. La metodología de modelación que se emplee se ajustará a los resultados que se
obtengan de la elaboración de la red; no se pretende ampliarla ni adaptarla para abarcar más casos.
1.6 Aporte al campo o disciplina El presente trabajo intenta cuantificar los efectos de la variación de la concentración
de factores de transcripción en la expresión génica en levadura dependiendo de la variación externa de glucosa, algo que no había sido ensayado con anterioridad.
Además, utiliza de manera intensiva base de datos y software asociado el análisis de
redes para identificar nodos importantes, añadiendo otro tipo de criterios para la elección de elementos interesantes para la modelación y no solo basándose en literatura descrita.
8
2 Metodología
En esta sección se describe los pasos seguidos para resolver la problemática planteada.
2.1 Elección de los genes con cambios en niveles de expresión
El primer criterio para seleccionar los genes de vías metabólicas interesantes de
estudiar es que estos se encuentren relacionados con las vías del metabolismo central del
carbono. Para ello, se obtiene la base de datos de vías metabólicas de SGD, se implementa
una rutina en MATLAB y se seleccionan aquellos genes que participan de alguna de las
siguientes vías4: Metabolismo de 1 fosfato glucosa, fermentación de glucosa, glicólisis,
ciclo del TCA y respiración aeróbica. Se almacenan esta selección en un archivo para su
posterior uso.
Paralelamente, para seleccionar aquellos genes que presentan cambios significativos
en su expresión se utiliza información proveniente de los experimentos realizados por
Humberto Díaz. En base a pruebas previas, se eligen dos criterios: Genes que presenten un
cambio en su nivel de expresión en un factor de 1.5 o más (que se dominará simplemente
1.5 Fold) y un test de hipótesis para igualdad de medias con varianza desconocida (se
denominará test). Ambos criterios responden a elegir elementos que sean interesantes de
modelar, pues lo que se persigue es explicar el reajuste interno de la célula en función de
una señal exterior. Se usa nuevamente una rutina de MATLAB para seleccionar los genes
desde los datos y se generan dos archivos de texto diferentes para cada criterio. En cada
archivo se almacena el promedio de intensidad para cada condición (crecimiento en glucosa
y crecimiento en etanol) y la tasa de cambio (nivel en glucosa / nivel en etanol).
4 Las tablas se encuentran en inglés, por lo que en las rutinas implementadas los nombres de las vías son: glucose 1-phosphate metabolism, glucose fermentation , glycolysis, TCA cycle y aerobic respiration.
9
Es razonable suponer que los mayores efectos de la regulación se vean reflejados en
los genes objetivos (en este caso, los genes de las vías) y que los cambios en el nivel de los
reguladores sean mucho menor. Por lo tanto, para seleccionar los genes de las vías
metabólicas elegidas que se expresan diferencialmente se elige como conjunto de búsqueda
los que presentan 1.5 Fold y para los factores de transcripción el conjunto de los
seleccionados por test de hipótesis.
Adicionalmente, es deseable seleccionar factores de transcripción que sean
relevantes para el fenómeno que se estudia. Para ello se seleccionarán factores que
presenten ontologías relevantes; se considerarán aquellas que presenten alguna de las
siguientes palabras claves en su descripción: glucosa, glicólisis, etanol, cAMP, TCA y
crecimiento.
Así, el conjunto de los genes a relacionar se divide en dos conjuntos con las
siguientes características:
1. Genes de Vías Metabólicas: Genes que presentan un nivel de cambio
superior a 1.5 y que participan de las vías metabólicas del Metabolismo de 1
fosfato glucosa, fermentación de glucosa, glicólisis, ciclo del TCA y
respiración aeróbica.
2. Factores de Transcripción: Genes que son reconocidos como factores de
transcripción en YEASTRACT, que presentan un nivel de cambio detectable
mediante un test de hipótesis y que presenten una ontología que contenga al
menos una de las siguientes palabras claves: glucosa, glicólisis, etanol,
cAMP, TCA y crecimiento.
10
2.2 Generación de la red de regulación La base de datos YEASTRACT permite buscar factores de transcripción para un
conjunto de genes mediante un formulario en pantalla via web. Sin embargo, no es posible
descargar la base de datos directamente. Por lo tanto, se utiliza MATLAB para solicitar los
datos a la página.
Con esto se diseña un procedimiento iterativo para ir obteniendo los factores de
transcripción que regulan a los factores de transcripción5:
1) Se parte de un núcleo formado por los genes de vías metabólicas que
presenten cambios de 1.5 Fold.
2) A este núcleo se le buscan los factores de transcripción sobre la totalidad de
la base de datos.
3) Se filtran los factores obtenidos sobre el conjunto de factores seleccionados.
4) Los factores obtenidos en el conjunto anterior se añaden al núcleo de
búsqueda.
5) Se vuelve al punto 2. Cuando la lista de genes no aumenta entre una etapa y
otra, se termina la iteración.
6) Como paso final, se realiza una búsqueda de los factores de transcripción del
conjunto final obtenido sobre los genes presentes en el conjunto final.
5 Al momento de realizar una búsqueda de factores de transcripción, YEASTRACT permite tres opciones: Búsqueda potencial, búsqueda documentada o ambas. En el presente trabajo las búsquedas se hace sobre información documentada.
11
Como respuesta a la consulta en YEASTRACT, se obtiene una tabla como la
mostrada en la figura 1. Si bien esta tabla contiene mucha información, la identificación de
la red no es fácil de ver, por lo que se hace necesario usar algún tipo de estrategia de
visualización.
Figura 1.- Tabla resultado de la búsqueda de factores en YEASTRACT. La primera columna corresponde a los factores que regulan los genes buscados; la segunda, a el porcentaje de genes que es regulado por el factor. La tercera columna contiene la lista de genes regulados por el factor. La figura es referencial
2.2.1 Visualización utilizando Graphviz
Con objeto de visualizar la tabla entregada por YEASTRACT, se crea una rutina en
MATLAB que genera un archivo de texto plano que contiene las instrucciones para dibujar
la red de regulación en Graphviz, en formato .dot a partir del código fuente de la página
web. Por ejemplo, tomando como referencia la novena fila de la figura 1, Hms1p (factor de
transcripción) está relacionado con HMS1, PDC1 y PDC6. Al procesar esta línea se
obtendría el siguiente resultado6: … HMS1 -> HMS1 ; HMS1 -> PDC1 ; HMS1 -> PDC6 ; … Este código es interpretado por el motor de dibujo dot, que jerarquiza los nodos. En
el ejemplo anterior, HMS1 sería asignado al primer nivel, mientras que PDC1 y PDC6 serían asignados al segundo y último nivel.
6 Más detalles sobre la sintaxis de Graphviz se encuentran en la documentación de su sitio web.
12
Si bien la estrategia de dibujar las relaciones ayuda a entender el marco general de
regulaciones, el resultado no permite centrarse en un solo gen objetivo, por lo que se requiere un mayor nivel de análisis.
2.2.2 Análisis de la red utilizando Pajek Quitando los símbolos particulares de la sintaxis de Graphviz (“ -> ”, “;” y el
encabezamiento del archivo) se tiene un archivo de texto de afiliación. Este nuevo archivo
puede ser interpretado por la utilidad txt2pajek (Juergen Pfeffer, Octubre 2004, disponible
en el sitio web del programa) para transformarlo a un archivo .net que pueda ser
procesado en Pajek:
… HMS1 HMS1 HMS1 PDC1 HMS1 PDC6 …
txt2pajek
*Vertices N … Xi “HMS1” Xj “PDC1” Xk “PDC6” … *Arcs … Xi Xi Xi Xj Xi Xk …
El primer encabezado del archivo de Pajek (*Vertices N) corresponde a la
declaración de los nodos. N representa el número total de vértices, mientras que Xi
representa el número de nodo asignado y el texto entre comilla el nombre. El segundo
encabezado (*Arcs) corresponden a las relaciones entre los nodos.
Una vez transformado el archivo de la red total, se carga en Pajek y para cada gen
de las vías metabólicas seleccionado, se aplica el método de los k-neighbors para
determinar la distancia de los nodos entrantes al nodo objetivo. El programa entrega un
reporte de la distancia de todos los nodos al nodo objetivo y asigna un valor particular
(9999998) si algún nodo no es alcanzable:
13
*Vertices N … Xi “HMS1” Xj “PDC1” Xk “PDC6” … *Arcs … Xi Xi Xi Xj Xi Xk …
Pajek, método de los k-neighbors, aplicado a PDC6
1. … … L. 1 – HMS1 L+1. 9999998 – PDC1 L+2. 0 – PDC6 …
L representa una numeración arbitraria para marcar las líneas de salida. Se aplica
este método para todos los genes de vías metabólicas y para cada uno se guarda el reporte
correspondiente.
Utilizando esta información, se modifica el archivo original de Graphviz para dejar
sólo los factores que se encuentren ligados al gen objetivo (distancia distinta a 9999998):
1. … … 2L. 1 – HMS1 L+1. 9999998 – PDC1 L+2. 0 – PDC6 …
Rutina de MATLAB para eliminar nodos no conectados
… HMS1 -> HMS1; HMS1 -> PDC6; …
Con este procedimiento, se obtienen los reguladores que intervienen directa o
indirectamente sobre el gen objetivo lo que permite analizar cada una de las relaciones.
2.3 Modelación de la regulación
Para modelar la red de regulación se utilizará el método propuesto por Kremling y
Gilles (2001)
El problema de la regulación puede ser expresado en términos del proceso de señales.
Ante una serie de entradas (p.ej, concentración de un metabolito, reguladores de expresión,
promotores, genes codificantes, etc.) es posible definir un objeto denominado
“coordinador”, llamado así pues coordina la distribución de los complejos de transcripción
(Kremling et al., 2001).
14
Figura 2.- Coordinador de la expresión génica. La figura muestra las entradas relevantes para un sistema de 3 proteínas (P, Act y Rep), 2 sitios de unión (D1 y D2) y los factores de transcripción necesarios (TFsII). P0, Act0, Rep0, D10, D20 y TFsII0 representan las concentraciones totales de Polimerasa, Activador de la transcripción, Represor de la transcripción, Sitio de unión 1 y 2 de las proteínas y factores de polimerasa II, respectivamente. Las salidas ψ1 y ψ2 son la fracción de RNA polimerasa II unida a los promotores.
Como respuesta a los estímulos, el coordinador genera una señal que modula la
expresión génica, como se ilustra en la figura 2. Sin embargo, el sistema que representa el
coordinador de la figura 2 es de 19 ecuaciones por 19 incógnitas, lo que es engorroso de
revisar y modificar en caso de querer incorporar más elementos para extender el modelo.
Adicionalmente, la influencia de los reguladores suele ser más específica que la de RNA
polimerasa II, por lo que se espera que un cambio en su concentración no afecte la
distribución de factores más generales en los sitios de unión.
Por lo tanto, desde un punto de vista biológico, es natural definir una jerarquía de
interacción, donde la señal se transmite desde el nivel superior pero no viceversa. Esto es lo
que se muestra en la figura 3. La señal se transmite desde el primer coordinador, es
modificada por el segundo coordinador que genera segunda señal que vuelve a ser
modificada por el tercer coordinador. Es esta última señal la que finalmente modula la
transcripción. Kremling y Gilles (2001) definen para tres niveles la manera en como
interactúan las proteínas, considerando los casos en que la presencia de una ayuda a que
otra se acople, que compitan por el sitio de unión las proteínas que se necesitan para iniciar
la transcripción, etc.
CoordinadorD10
D20
Rep0 P0 Act0
TFsII0
2ψ1ψ
15
Figura 3.- Modelo reducido propuesto. En este caso, se considera que la proteína Act tiene un rol más general que Rep para el gen D1. Los sitios de unión D2, D3 y D4 representan el resto de los sitios de unión para las proteínas del nivel correspondiente. El subíndice r indica que la señal es del modelo reducido. ψP2 es una señal auxiliar para el tercer nivel.
La señal entre niveles es considerada mediante la aparición de un sitio “virtual”. Por
ejemplo, en el segundo coordinador, se “activa” D1 en función de la señal ψr1 a D*, y es D*
y el complejo “D*·Act” los elementos que transcriben efectivamente, lo que puede
expresarse de la siguiente forma:
Donde
En Kremling y Gilles (2001) se pueden encontrar las definiciones de los distintos K
y las señales para los tres niveles de interacciones.
3rψ
2Pψ2rψ
2rψ1rψ
CoordinadorD10
D20
P0
TFsII0
CoordinadorD10
D30
Act0
CoordinadorD10
D40
Rept0
16
3 Resultados y Discusiones
3.1 Selección de genes
Según los dos criterios presentados, lo genes que presentan significancia para ser
analizados resultan ser los siguientes:
36 genes participan en las vías metabólicas y presentan cambios sobre 1.5
Fold:
ACO1, ADH1, ADH3, ADH4, ADH5, ALD6, CDC19, CIT1, CIT2, ENO1,
ENO2, FBA1, FUM1, GPM1, HXK1, HXK2, IDH2, KGD1, KGD2, LSC1,
LSC2, MDH2, PDC1, PDC6, PFK1, PGI1, PGK1, PYC1, SDH1, SDH3, SDH4,
TDH1, TDH2, TDH3, TPI1 y UGP1
26 genes pertenecen a genes catalogados como factores de transcripción en
la base de datos en YEASTRACT, presentan diferencias de medias según el test
de hipótesis y tienen una ontología relevante:
ADR1, ASH1, DOT6, FKH1, FKH2, FLO8, GCR1, GCR2, HMS1, MGA1,
MIG1, MIG2, MSN1, MSN2, MSN4, MSS11, NRG1, NRG2, PDC2, PHD1,
RGT1, SIP4, SOK2, STE12, TEC1 y TYE7.
A continuación, se describen cada uno de los 62 genes, separados por grupos de
pertenencia, en orden alfabético:
17
3.1.1 Genes de vías metabólicas ACO1: Aconitasa, requerida para el ciclo de los ácidos tricarboxílicos (TCA) y también es
requerido independientemente para el mantenimiento del genoma mitocondrial;
componente del nucloide mitocondrial; mutación lleva a auxotrofía de glutamato.
ADH1: Alcohol deshidrogenasa, isoenzima fermentativa activa como homo o
heterotetrámeros; requerida para la reducción de acetaldehído a etanol, el último paso en la
vía glicolítica.
ADH3: Alcohol deshidrogenasa isoenzima III; involucrado en el transporte de NADH
mitocondrial hacia el citosol bajo condiciones anaeróbicas y de producción de etanol.
ADH4: Alcohol deshidrogenasa isoenzima IV, enzima dimérica que ha demostrado ser
zinc-dependiente a pesar de la similaridad de secuencia a alcohol deshidrogenasas activadas
por hierro; transcripción es inducida en respuesta a deficiencia de zinc.
ADH5: Alcohol deshidrogenasa isoenzima V; involucrada en producción de etanol.
ALD6: Aldehído deshidrogenasa, activada por Mg2+ y utiliza NADP+ como coenzima
preferida; requerida para la conversión de acetaldehído a acetato; expresada
constitutivamente; se localiza en la membrana exterior de la mitocondria bajo estrés
oxidativo.
CDC19: Piruvato quinasa, funciona como un homotetramero en glicólisis para convertir
fosfoenolpiruvato a piruvato, la entrada para respiración aeróbica (cilco TCA) o anaeróbica
(fermentación de glucosa).
CIT1: Citrato sintetasa, cataliza la condensación de acetil coenzimo A y oxalacetato para
formar citrato; la enzima limitante del TCA; proteína codificada de la mitocondria.
También conocida como: CS1.
18
CIT2: Citrato sintetasa, cataliza la condensación de acetil coenzimo A y oxalacetato para
formar citrato; isoenzima peroxisomal involucrada en el ciclo del glioxilato; expresión está
controlada por los factores Rtg1p y Rtg2p.
ENO1: Enolasa I, una fosfopiruvato hidratasa que cataliza la conversión de 2-fosfoglicerato
a fosfoenolpiruvato durante glicólisis y la reacción reversa durante gluconeogénesis; la
expresión es reprimida en respuesta a la glucosa.
ENO2: Enolasa II, una fosfopiruvato hidratasa que cataliza la conversión de 2-
fosfoglicerato a fosfoenolpiruvato durante glicólisis y la reacción reversa durante
gluconeogénesis; expresión es reprimida en respuesta a la glucosa.
FBA1: Fructosa 1,6-bisfosfato aldolasa, requerida para glicólisis y gluconeogénesis;
cataliza conversión de fructosa 1,6 bisfosfato a gliceraldehído-3-P y dihidroxiacetona-P; se
ubica hacia la superficie externa de la mitocondria ante el estrés oxidativo.
FUM1: Fumarasa, convierte ácido fumárico a L-ácido málico en el ciclo del TCA;
localización citosólica y mitocondrial determinada por la secuencia blanco N-terminal
mitocondrial y proteína conformación.
GPM1: Fosfoglicerato mutasa tetramérica, media la conversión de 3-fosfoglicerato a 2-
fosfoglicerato durante la glicólisis y la reacción reversa durante gluconeogénesis.
HXK1: Isoenzima Hexokinasa 1, una proteína citosólica que cataliza fosforilación de
glucosa durante el metabolismo de glucosa; expresión es más altas durante el crecimiento
en fuentes de carbono diferentes a glucosa; represión inducida por glucosa involucra la
hexokinasa Hxk2p.
19
HXK2: Isoenzima Hexokinasa 2 que cataliza fosforilación de glucosa en el citosol;
hexokinasa predominante durante el crecimiento en glucosa; funciona en el núcleo para
reprimir expresión de HXK1 y GLK1 y para inducir expresión de su propio gen.
IDH2: Subunidad de la isocitrato deshidrogenasa mitocondrial dependiente de NAD(+),
que cataliza la oxidación de isocitrato a alfa-ketoglutarato en el ciclo del TCA.
KGD1: Componente del complejo mitocondrial alfa-ketoglutarato deshidrogenasa, que
cataliza un paso clave en el ciclo del TCA, la descarboxilación oxidativa de alfa-
ketoglutarato a succinil-CoA.
KGD2: Dihidrolipoil transsuccinilasa, componente del complejo mitocondrial alfa-
ketoglutarato deshidrogenasa, que cataliza un paso clave en el ciclo del TCA, la
descarboxilación oxidativa de alfa-ketoglutarato a succinil-CoA.
LSC1: Subunidad alfa de succinil-CoA ligasa, que es una enzima mitocondrial del ciclo del
TCA que cataliza la conversión dependiente de nucleótidos de succinil-CoA a succinato.
LSC2: Subunidad beta de succinil-CoA ligasa, que es una enzima mitocondrial del ciclo del
TCA que cataliza la conversión dependiente de nucleótidos de succinil-CoA a succinato.
MDH2: Malato deshidrogenasa citoplasmática, una de tres isoenzimas que cataliza la
interconversión de malato y oxaloacetato; involucrada en gluconeogénesis durante
crecimiento en etanol o acetato como fuente de carbono; interactúa con Pck1p y Fbp1p.
PDC1: Mayor de tres isoenzimas piruvato descarboxilasas, enzima clave en fermentación
alcohólica, descarboxila piruvato a acetaldehído; sujeto a glucosa, etanol, y auto regulación;
involucrada en catabolismo amino acido.
20
PDC6: Isoforma menor de piruvato descarboxilasa, enzima clave en fermentación
alcohólica, descarboxila piruvato a acetaldehído; sujeto a glucosa, etanol, y auto regulación;
involucrada en catabolismo amino acido.
PFK1: Subunidad alpha de fosfofructokinasa heterooctamérica involucrada en glicólisis,
indispensable para crecimiento anaeróbico, activada por fructosa-2,6-bisfosfate y AMP,
mutación inhibe inducción por glucosa de genes relacionados con el ciclo celular.
PGI1: Enzima glicolítica fosfoglucosa isomerasa, cataliza la interconversión de glucosa-6-
fosfate y fructosa-6-fosfato; requerida para la progresión del ciclo celular y completar los
eventos gluconeogénicos de la esporulación.
PGK1: 3-fosfoglicerato kinasa, cataliza transferencia de grupos fosfato de alta energía
desde el acil fosfato de 1,3-bisfosfoglicerato a ADP para producir ATP; enzima clave en
glicólisis y gluconeogénesis.
PYC1: Isoforma de piruvato carboxilasa, enzima citoplasmática que convierte piruvato a
oxalacetato; altamente similar a la isoforma Pyc2p pero diferencialmente regulada;
mutaciones en el homólogo humano están asociadas con acidosis láctica.
SDH1: Flavoproteína, subunidad de succinato deshidrogenasa (Sdh1p, Sdh2p, Sdh3p,
Sdh4p), que acopla la oxidación de succinato a la transferencia de electrones a ubiquinona.
SDH3: Citocromo b, subunidad de succinato deshidrogenasa (Sdh1p, Sdh2p, Sdh3p,
Sdh4p), que acopla la oxidación de succinato a la transferencia de electrones a ubiquinona.
SDH4: Subunidad de anclaje de membrana de succinato deshidrogenasa (Sdh1p, Sdh2p,
Sdh3p, Sdh4p), que acopla la oxidación de succinato a la transferencia de electrones a
ubiquinona.
21
TDH1: Gliceraldehído-3-fosfato dehidrogenasa, isoenzima 1, involucrada en glicólisis y
gluconeogénesis; tetrámero que cataliza la reacción de gliceraldehído-3-fosfato a 1,3 bis-
fosfoglicerato; detectado en el citoplasma y pared celular
TDH2: Gliceraldehído-3-fosfato dehidrogenasa, isoenzima 1, involucrada en glicólisis y
gluconeogénesis; tetrámero que cataliza la reacción de gliceraldehído-3-fosfato a 1,3 bis-
fosfoglicerato; detectado en el citoplasma y pared celular
TDH3: Gliceraldehído-3-fosfato dehidrogenasa, isoenzima 1, involucrada en glicólisis y
gluconeogénesis; tetrámero que cataliza la reacción de gliceraldehído-3-fosfato a 1,3 bis-
fosfoglicerato; detectado en el citoplasma y pared celular.
TPI1: Triosa fosfato isomerasa, enzima glicolítica abundante; vida media del mRNA es
regulada por disponibilidad de hierro; transcripción es controlada por activadores Reb1p,
Gcr1p, y Rap1p a través de sitios de unión en la región 5' no codificante.
UGP1: UDP-glucosa pirofosforilasa (UGPasa), cataliza la formación reversible de UDP-
Glc a partir de glucosa 1-fosfato y UTP, involucrado en una amplia variedad de vías
metabólicas, expresión modulada por Pho85p a través de Pho4p.
3.1.2 Genes Factores de Transcripción
ADR1: Factor de transcripción con dedos de zinc responsivo a fuente de carbono, requerida
para transcripción del gen reprimido por glucosa ADH2, de los genes para proteínas del
peroxisoma y de genes requeridos para la utilización de etanol, glicerol y ácidos grasos.
ASH1: Inhibidor tipo dedo de zinc de transcripción de HO; mRNA se localiza y se traduce
en la punta distal de las células en anafase, resultando en la acumulación de Ash1p en el
núcleo de la célula hija e inhibición de expresión de HO; sustrato potencial de Cdc28p.
22
DOT6: Proteína de función desconocida, involucrado en silenciamiento de genes
teloméricos y filamentación.
FHK1: Factor de transcripción de la familia Forkhead con un rol menor en la expresión de
los genes de fase G2/M; regula negativamente la elongación transcripcional; rol positivo en
silenciar cromatina HML y HMR; regula la preferencia del donador durante el switching.
FHK2: Factor de transcripción de la familia Forkhead con un rol menor en la expresión de
los genes de fase G2/M; regula negativamente la elongación transcripcional; rol positivo en
silenciar cromatina HML y HMR; regula la preferencia del donador durante el switching.
Substrato de la kinasa Cdc28p/Clb5p.
FLO8: Factor de transcripción requerida para floculación, crecimiento diploide
filamentoso, y crecimiento haploide invasivo; cepa S288C referencial del genoma y la
mayoría de las cepas de laboratorio tienen una mutación en este gen.
GCR1: Activador transcripcional de genes involucrados en la glicólisis; interactúa y
funciona con el factor de transcripción Gcr2p.
GCR2: Activador transcripcional de genes involucrados en la glicólisis; interactúa y
funciona con la proteína de unión al DNA Gcr1p.
HMS1: Proteína basic-Helix-Loop-Helix (bHLH) con similitud a la familia de factores de
transcripción myc; sobreexpresión confiere crecimiento hiperfilamentoso y suprime el
defecto de la filamentación pseudohifal de un diploide homocigoto mutante carente de
MEP1 y MEP2
MGA1: Proteína similar a factor de transcripción de shock calórico; supresor multicopia de
defectos de crecimiento pseudohifal de mutantes de amonio permeasa.
23
MIG2: Proteína que contiene “dedos de zinc”, involucrado en la represión, junto con
Mig1p, de expresión de SUC2 (invertasa) por altos niveles de glucosa; se une a sitios de
unión de Mig1p en SUC2 promotor.
MIG1: Factor de transcripción involucrado en la repression por glucosa; la secuencia
específica de la proteína de unión al DNA contiene dos motivos de dedos de zinc
Cys2His2; regulado por quinasa SNF1 y fosfatasa GLC7.
MSN1: Activador transcripcional involucrado en la regulación de la expression de invertasa
y glucoamilasa, crecimiento invasivo y diferenciación pseudohifal, incorporación de hierro,
acumulación de cromo y respuesta a estrés osmótico; se localiza en el núcleo.
MSN2: Activador transcripcional relacionado con Msn4p; se activa en condiciones de
estrés, que resulta en translocación desde el citoplasma al núcleo; se une al DNA en
elementos de respuesta de genes responsivos7, induciendo la expresión génica.
MSN4: Activador transcripcional relacionado con Msn2p; se activa en condiciones de
estrés, que resulta en translocación desde el citoplasma al núcleo; se une al DNA en
elementos de respuesta de genes responsivos, induciendo la expresión génica.
MSS11: Factor de transcripción involucrado en la regulación de crecimiento invasivo y
degradación de almidón; controla la activación de MUC1 y STA2 en respuesta a señales
nutricionales.
NRG1: Represor transcripcional que recluta el complejo Cyc8p-Tup1p a promotores; media
la represión por glucosa y regula negativamente una variedad de procesos incluyendo
crecimiento filamentoso y respuesta a pH alcalino.
NRG2: Represor transcripcional que media la represión por glucosa y regula negativamente
crecimiento filamentoso; es similar a Nrg1p.
7 Responsive en inglés.
24
PDC2: Factor de transcripción requerido para la síntesis de la enzima glicolítica piruvato
descarboxilasa, requerida para alto nivel de expresión de genes THI y PDC.
PHD1: Activador transcripcional que estimula crecimiento pseudohifal; regula expresión de
FLO11, una adhesina requerida para formación pseudohifal; similar a StuA, regulador de
desarrollo de A. nidulans; sustrato potencial de Cdc28p.
RGT1: Factor de transcripción de respuesta a glucosa que regula expresión de varios genes
transportadores de glucosa (HXT) en respuesta a glucosa; se une a promotores y actúa
como un a activador y represor transcripcional.
SIP4: Activador transcripcional C6 zinc cluster que se une a el elemento responsivo a la
fuente de carbono (CSRE) de genes gluconeogénicos; involucrado en la regulación positiva
de gluconeogénesis; regulado por Snf1p; se localiza en el núcleo.
SOK2: Proteína nuclear que juega un rol regulatorio en la vía de transducción dependiente
de la proteína quinasa (PKA) dependiente de AMP cíclico (cAMP); regula negativamente
diferenciación pseudohifal; homólogo a varios factores de transcripción.
STE12: Factor de transcripción que es activado por una señalización en cascada MAP
quinasa, activa genes involucrados en acoplamiento8 o en las vías de creciemiento
pseudohifal/invasivo; coopera con el factor de transcripción Tec1p para regular genes
específicos para crecimiento invasivo.
TEC1: Factor de transcripción requerido para expresión completa de Ty1, activación génica
mediada por Ty1, y crecimiento haploide invasivo y diploide pseudohifal; miembro de la
familia de dominios de unión TEA/ATTS.
8 Mating en la descripción original
25
TYE7: Proteína rica en serina que contiene un motivo de unión a DNA basic-helix-loop-
helix (bHLH); une E-boxes de genes glicolíticos y contribuye a su activación; puede
funcionar como un activador transcripcional en expresión génica mediada por Ty1.
3.1.3 Análisis de los genes seleccionados
Una clasificación de las ontologías de los procesos biológicos a nivel 4, realizado en
YEASTRACT, se entrega en la tabla 1:
Tabla 1.- Clasificación de genes de vías metabólicas según ontologías de procesos biológicos a nivel 4
Término GO Porcentaje ORF/Genes Proceso metabólico de carbohidratos
80.6 % ACO1, CDC19, CIT1, CIT2, ENO1, ENO2, FBA1, FUM1, GPM1, HXK1, HXK2, IDH2, KGD1, KGD2, LSC1, LSC2, MDH2, PFK1, PGI1, PGK1, PYC1, SDH1, SDH3, SDH4, TDH1, TDH2, TDH3, TPI1, UGP1
Proceso catabólico celular 69.4 % ACO1, CDC19, CIT1, ENO1, ENO2, FBA1, FUM1, GPM1, HXK1, HXK2, IDH2, KGD1, KGD2, LSC1, LSC2, PFK1, PGI1, PGK1, SDH1, SDH3, SDH4, TDH1, TDH2, TDH3, TPI1
Proceso metabólico de ácidos orgánicos
58.3 % ACO1, ALD6, CDC19, CIT1, CIT2, ENO1, ENO2, FBA1, FUM1, GPM1, IDH2, KGD1, KGD2, MDH2, PDC1, PGI1, PGK1, PYC1, TDH1, TDH2, TDH3
Proceso metabólico de alcohol
58.3 % ADH1, ADH5, CDC19, ENO1, ENO2, FBA1, GPM1, HXK1, HXK2, MDH2, PDC1, PDC6, PFK1, PGI1, PGK1, PYC1, TDH1, TDH2, TDH3, TPI1, UGP1
Proceso metabólico de cofactores
47.2 % ACO1, ADH1, ADH3, ADH4, ADH5, CIT1, FUM1, IDH2, KGD1, KGD2, LSC1, LSC2, PGI1, PYC1, SDH1, SDH3, SDH4
Derivación energética por oxidación de compuestos orgánicos
44.4 % ACO1, ADH1, ADH3, ADH4, ADH5, CIT1, FUM1, IDH2, KGD1, KGD2, LSC1, LSC2, PDC1, SDH1, SDH3, SDH4
Procesos celulares biosintéticos
38.9 % ADH1, ADH5, ALD6, ENO1, ENO2, FBA1, GPM1, MDH2, PGI1, PGK1, PYC1, TDH1, TDH2, TDH3
Proceso de macro moléculas 38.9 % CDC19, ENO1, ENO2, FBA1, GPM1, HXK1, HXK2, PFK1, PGI1, PGK1, TDH1, TDH2, TDH3, TPI1
Proceso de biosíntesis de macromoléculas
33.3 % ENO1, ENO2, FBA1, GPM1, MDH2, PGI1, PGK1, PYC1, TDH1, TDH2, TDH3, UGP1
Proceso metabólico de nucleobases, nucleósidos, nucleótidos y ácidos nucleicos
22.2 % ADH1, ADH3, ADH4, ADH5, HXK2, PGI1, PYC1, UGP1
Proceso metabólico de vitaminas
16.7 % ADH1, ADH3, ADH4, ADH5, PGI1, PYC1
Procesos metabólicos de aminoácidos y derivativos
11.1 % ACO1, CIT1, CIT2, IDH2
Proceso metabólico de aminas
11.1 % ACO1, CIT1, CIT2, IDH2
26
Tabla 1.- Clasificación de genes de vías metabólicas según ontologías de procesos biológicos a nivel 4, continuación.
Proceso de biosíntesis de compuestos nitrogenados
11.1 % ACO1, CIT1, CIT2, IDH2
Fosforilación oxidativa 8.3 % SDH1, SDH3, SDH4 Transporte de electrones 8.3 % SDH1, SDH3, SDH4 Organización de organelos y biogénesis 8.3 % ACO1, ENO1, ENO2 Proceso metabólico de biopolímeros 5.6 % HXK2, UGP1 Proceso metabólico de cetonas
5.6 % KGD1, KGD2
Transporte de carbohidratos 5.6 % HXK1, HXK2 Organización y biogénesis de membranas 5.6 % ENO1, ENO2 Regulación de componentes celulares y biogénesis
5.6 % ENO1, ENO2
Biogénesis y organización de estructura externa encapsulada
2.8 % UGP1
Proceso metabólico de proteínas 2.8 % UGP1 Proceso metabólico de macromoléculas celulares
2.8 % UGP1
Regulación de procesos metabólicos celulares
2.8 % HXK2
Envejecimiento celular 2.8 % HXK2 Regulación del tamaño celular 2.8 % HXK2 Respuesta a nutriente 2.8 % HXK2 Respuesta a drogas 2.8 % ACO1 Proceso metabólico de aldehído 2.8 % CIT2
Este resultado pone en evidencia que los genes de vías metabólicas seleccionados
corresponden efectivamente a genes relevantes para el problema a abordar. Un alto
porcentaje está ligado al metabolismo de carbohidratos, metabolismo del alcohol y procesos
catabólicos generales.
La tabla 2 repite el mismo procedimiento para los genes seleccionados como
factores de transcripción, pero esta vez clasificando por función molecular a nivel 2 en
YEASTRACT:
Tabla 2.- Clasificación de los Factores de Transcripción por ontología de función moleculares a nivel 2
Término GO Porcentaje ORF/Genes Actividad reguladora
de Transcripción 96.2 % ADR1, ASH1, FKH1, FKH2, FLO8, GCR1, GCR2, HMS1,
MGA1, MIG1, MIG2, MSN1, MSN2, MSN4, MSS11, NRG1, NRG2, PDC2, PHD1, RGT1, SIP4, SOK2, STE12, TEC1, TYE7
Unión 61.5 % ADR1, FKH1, FKH2, GCR1, HMS1, MGA1, MIG1, MIG2, MSN2, MSN4, NRG1, PHD1, RGT1, SOK2, STE12, TYE7
Actividad Catalítica 3.8 % ASH1
27
El único factor que no aparece clasificado con actividad reguladora es DOT6, cuya
función es desconocida. No registran función de unión ASH1, DOT6, FLO8, GCR2,
MSN1, MSS11, NRG2, PDC2, SIP4 y TEC1.
Según la descripción entregada en 3.1.2, Gcr2p actúa conjuntamente con Gcr1p
(que si presenta función de unión). Esto ha sido descrito por varios trabajos como los de
Sasaki et al., 2005 y Uemura & Fraenkel, 1999. Según este último, mutantes gcr2 son
capaces de crecer bien en glucosa, aunque es notorio el efecto de subexpresión de genes de
glicolíticos; en cambio, mutantes gcr1 no crecen en glucosa. Por lo tanto, para efectos del
presente modelo, se considera que Gcr1p y Gcr2p funcionan como un complejo en donde
Gcr1p actúa uniéndose efectivamente al DNA y que Gcr2p es el factor necesario para
activar la transcripción. En cuanto a FLO8 y TEC6, son dos factores que están más
relacionados con el crecimiento pseudohifal, por lo que no se estudia su comportamiento
más profundamente.
Por lo tanto, los factores de transcripción obtenidos pueden clasificarse en tres
grupos principales: Los que son respuesta al estrés, como MSN1 y MSN2, los de
crecimiento pseudohifal, como FLO8, SOK2 y STE12 y los relacionados más directamente
con la respuesta a glucosa, como GCR1, GCR2, MIG1 y RGT1.
3.2 Visualización de la red
La utilización de Graphviz entrega un diagrama de la red de regulación obtenida que
conecta los factores de transcripción entre sí y los genes de vías metabólicas. El resultado
se puede ver en el archivo “Seleccion_Genes\Red\redtotal.pdf”, en el CD anexo.
El formato gráfico para ver la red es bastante útil para hacer algunas observaciones.
En primer lugar se aprecia que KGD1, ADH3 y LSC1 no presentan reguladores, por lo que
se eliminan de la red; así también, los reguladores ASH1 y MSS11, no regulan ningún gen
de vías metabólicas seleccionado, por lo que también se eliminan de la red.
28
Además, es posible ver que existen nodos o grupos de nodos que no tienen arcos
entrantes, como FLO8, GCR2, RGT1 y FKH1/FKH2 (considerado como grupo). Esto está
relacionado con el hecho de que son elementos que están al final de cascadas de
señalización no mediadas por proteínas o bien no se han deducido aún otras interacciones:
Por ejemplo, Flo8p está al final de una cascada con respuesta a cAMP, requerida para el
crecimiento en hifas (Borneman et al. 2006); Rgt1p está bajo el control de señalización de
Snf3/Rgt2 (Palomino A., Herrero P. & Moreno F., 2005, Santangelo G, 2006); Gcr2p está
relacionado con Gcr1p y Rap1p (Zeng X, Deminoff SJ & Santangelo G, 1997) aunque el
mecanismo no es claro; FKH1 y FKH2 han sido identificados como factores sólo
recientemente (Hollenhorst et al., 2001). En cambio, otros genes que regulan genes
glicolíticos, si bien presentan interacción directa, también sirven como intermediarios, por
ejemplo MIG1, MIG2 y NRG1.
También es posible apreciar la importancia relativa de algunos factores que actúan
como “concentradores de señales”, es decir, muchas señales de entrada y pocas de salidas.
Sok2 y Tec1 son ejemplos de este tipo de comportamiento (Borneman et al., 2006).
Si bien la utilización de gráficos ayuda a dar una idea general de los factores que
participan del proceso regulatorio en el salto diaúxico, la cantidad de nodos hace que el
esquema sea poco claro. Para mejorar el análisis se utiliza, como se mencionó en la
metodología, el método de los k-neighbors para separar los nodos objetivos (en este caso,
genes de las vías metabólicas) en el programa Pajek. El resultado para los 33 genes de vías
metabólicas se encuentra completo en el anexo I.
3.3 Análisis de la red utilizando Pajek
La utilización de un software para el análisis de redes abre posibilidades de un
estudio topológico de la red obtenida. Si bien esto escapa a los alcances de esta memoria, se
entregan algunos datos relevantes (Xia et. al, 2004):
29
Distribución de Distancias: La distancia promedio entre pares alcanzables es
de 2.57, el número de pares inalcanzables es de 2350 (de un total de 3080
pares posibles, N·(N-1) ) y la distancia más larga es entre RGT1 y GPM1,
con 7 nodos intermedios.
Grados de entrada y salida: La tabla 3 detalla los grados de arcos entrantes y
salientes para cada nodo de la red. Destaca la alta regulación de HXK1 y los
nodos que tienen características de concentradores de señales (que es
indicado por la relación de número de arcos entrantes y salientes de un nodo
particular) de TYE7, SOK2, MGA1, PDH1.
Tabla 3.- Grados de entrada y salida para la red completa obtenida.
Nodo Grado Entrada
Grado Salida
Nodo Grado Entrada
Grado Salida
Nodo Grado Entrada
Grado Salida
ACO1 3 0 GPM1 3 0 PGI1 3 0 ADH1 3 0 HMS1 7 4 PGK1 3 0 ADH4 4 0 HXK1 11 0 PHD1 6 13 ADH5 2 0 HXK2 3 0 PYC1 5 0 ADR1 1 5 IDH2 4 0 RGT1 0 4 ALD6 3 0 KGD2 1 0 SDH1 1 0 CDC19 6 0 LSC2 3 0 SDH3 2 0 CIT1 3 0 MDH2 5 0 SDH4 2 0 CIT2 5 0 MGA1 8 9 SIP4 4 2 DOT6 1 2 MIG1 2 8 SOK2 4 23 ENO1 4 0 MIG2 2 2 STE12 7 11 ENO2 5 0 MSN2 3 14 TDH1 4 0 FBA1 4 0 MSN4 5 7 TDH2 5 0 FKH1 1 3 NRG1 3 5 TDH3 7 0 FKH2 2 4 NRG2 4 2 TEC1 5 8 FLO8 0 10 PDC1 6 0 TPI1 4 0 FUM1 3 0 PDC2 0 1 TYE7 8 10 GCR1 2 27 PDC6 2 0 UGP1 4 0 GCR2 0 26 PFK1 2 0
Este análisis permite identificar a los factores claves en la regulación, con más de 10
arcos salientes: GCR2, GCR1, MSN2, SOK2, PHD1, FLO8, STE12 y TYE7; además
indica qué genes de vías metabólicas son modelables según el esquema propuesto, pues el
número de interacciones debe estar entre 2 y 3, lo que deja como candidatos a ACO1,
ADH1, ADH5, ALD6, CIT1, FUM1, GPM1, HXK2, LSC2, PDC6, PFK1, PGI1, PGK1,
SDH3 y SDH4.
30
Por lo anterior y su ubicación al inicio de la vía de la glicólisis, se decide seguir
trabajando con más detalle la regulación de HXK2
3.3.1 Resultado de la aplicación del método de los k-neighbors a HXK2
La figura 5 muestra el resultado de eliminar los factores que no intervienen en la
regulación de HXK2; los resultados para todos los genes de vías metabólicas se encuentran
en el anexo II
Figura 4.- Regulación de HXK2. Al eliminar el resto de los FT y genes de vías metabólicas se puede entender mejor la regulación de un gen en particular. En el caso de la figura, sólo tres factores intervienen directamente sobre HXK2; además, en la región central de la figura da cuenta de la red relacionada con el crecimiento pseudohifal.
31
3.4 Revisión de la literatura asociada a la regulación de HXK2
Si bien la utilización de la estrategia expuesta en la metodología da como resultado
una red de regulación para cada uno de los genes en estudio, no proporciona información
sobre las características de las asociaciones. Una comprensión de estas debe pasar
necesariamente por una revisión de la literatura asociada.
Una buena parte de las regulaciones expuestas tienen como base trabajos que
utilizan técnicas con gran cantidad de datos de salida como son microarrays y técnicas de
inmuno precipitación de cromatina (ChIP chips, por sus siglas en inglés). Estas técnicas son
útiles para blancos de factores de transcripción bajo distintas condiciones (Lee et al., 2002,
Horak et al 2002., Borneman et al., 2006, Workman et al., 2006, Harbison et al., 2004),
pero no definen qué tipo de relación existe.
Por otro lado, GCR2, RGT1 y SOK2 han sido bien caracterizados individualmente;
estos factores intervienen directamente en la regulación de HXK2, como se puede ver en la
figura 5.
Gcr2p, como ya se ha mencionado, actúa en conjunto a Gcr1p (Sasaki & Uemura,
2005). Ha sido identificado como un activador en presencia de glucosa (Uemura &
Fraenkel, 1999; Chambers et al., 1997). Al parecer, GCR1 es necesario para el
crecimiento en glucosa; mutantes gcr2 muestran un decaimiento en la expresión de genes
glicolíticos, pero pueden crecer bien en glucosa (Uemura & Fraenkel, 1999). Microarrays
en cepas gcr1 muestran una disminución de entre 13.8 y 7.9 veces para genes glicolíticos
(López & Baker, 2000).
Rgt1p es un represor para HXK2 que se activa en ausencia de glucosa (Palomino,
Herrero y Moreno, 2005). Su actividad es regulada por Tpk3p y Snf1p y depende de la
concentración de glucosa. Para la represión de HXK2 necesita que el factor Med8p esté
unido a HXK2, generando un loop en el DNA que impide la expresión (Palomino, Herrero
y Moreno, 2006).
32
Sok2p fue identificado como regulador de HXK2 por un estudio de ChIP (Chua et
al., 2006). Aunque no hay información sobre su actividad específica en HXK2, ha sido
catalogado como represor de la familia bHLH. Se ha propuesto que contrarresta la acción
de Msn2p/Msn4p en la activación de genes de la fase estacionaria en presencia de glucosa y
parece jugar un rol importante en la adaptación para la sobrevivencia a largo plazo de
colonias de Saccharomyces cerevisiae (Váchová et al., 2004).
3.5 Modelación de la expresión de HXK2
Lo que se busca es encontrar una expresión que module la tasa de transcripción de
mRNA a partir de la cantidad de promotores disponibles y la fracción de promotores
ocupados, es decir, r = k*ψ3*Promotores de Hxk2. ψ3 es la fracción de promotores
ocupados, que es lo que se calcula utilizando el método de Kremling y Gilles.
Con los antecedentes recopilados en la revisión bibliográfica, se decide despreciar la
influencia de Sok2p, tanto por no conocer su actividad como por presentar un nivel de
cambio menor a 1.5 veces (1.26 Glucosa/Etanol). Además, Sok2p aparece más ligado a
procesos generales de crecimiento y no a una respuesta específica a glucosa. Por lo tanto, se
considerará solamente a Gcr2p y Rtg1p.
El esquema presentado en la figura 3 es el que se utilizará para modelar la expresión
de HXK2. En el rol de activador se utilizará GCR2 y como represor a RGT1. Una búsqueda
en YEASTRACT indica que hay 132 genes que son regulados por GCR2 (235 por GCR1)
y 64 controlados por RTG1. Por lo tanto, se asume que GCR2 está en un nivel de control
más general que RGT1, lo que es concordante con la información de la tabla 3.
3.5.1 Ecuaciones empleadas
En el siguiente apartado se describen las ecuaciones, parámetros y consideraciones
para cada uno de los niveles (RNA pol. II, GCR2 y RGT1).
33
Uno de los problemas del método de Kremling y Gilles es que se necesita conocer
las concentraciones iniciales de las proteínas involucradas, así como sus constantes de
disociación. Estas últimas fueron estimadas a partir de los datos de la literatura, pero no hay
información disponible sobre las concentraciones totales de Rgt1p y Gcr2p.
Para estimar las concentraciones totales de Gcr2p y Rgt1p, se utilizan los datos de
microarray de Humberto Diaz del siguiente modo:
Se calcula la intensidad total del chip de microarray sumando las
intensidades de cada spot. A esta intensidad se le denotará con la unidad
[Val MA]
Se supone que toda la intensidad corresponde a 15000 moléculas de mRNa
(Kal et al.,1999).
Suponiendo que un ribosoma tiene una velocidad de desplazamiento de 6
nucleótidos/segundo, que la vida media de un mRNA es de 1800 segundos y
que la distancia entre dos ribosomas es de 80 nucleótidos, se tiene que por
cada mRNA se sintetizan 135 proteínas. (Alberts, 2002).
Con lo anterior, se establece una proporción entre la intensidad leída para
cada gen y la cantidad de proteína (36.24 [Val MA]/[Nº Proteína]).
Una célula de levadura haploide tiene un peso seco promedio de 1.5·10-11 [g]
(Sherman, 1998) y el número de Avogadro se considera como 6.023·1017
[moléculas/μmol].
Con esto, se elabora la tabla 4 para estimar las concentraciones de Gcr2p, Gcr1p,
Rgt1p y Hxk2p.
34
Se asume demás que la unión de los factores a los sitios de unión es rápida en
comparación a la transcripción, por lo que las especies están en condiciones de equilibrio.
También se debe notar que la concentración de Gcr1p es mayor que la de Gcr2p;
por lo tanto, se puede considerar Gcr2p está siempre activa.
Otro supuesto a utilizar es que Gcr2p y Rgt1p son funciones de glucosa. A partir de
los datos de Humberto Díaz, ya que sólo se dispone de 2 puntos, se supone que la
concentración de estas proteínas es una función lineal de glucosa.
Tabla 4.- Cálculo de concentraciones iniciales de proteínas en base a datos de microarray y literatura
Valor Total Microarray 55880.98 [Val MA] Moléculas mRNA por célula 15000.00 Conversión [Nº mRNA/Val MA] 0.27 Conversión [Nº Proteína/mRNA] 135.00 Conversión [Nº Proteína/Val MA] 36.24 Glucosa Etanol [Val MA] GCR2 6.02 3.79 Moléculas Gcr2p 218.15 137.34 [Val MA] SOK2 5.75 4.54 Moléculas Sok2p 208.37 164.52 [Val MA] RTG1 4.65 7.15 Moléculas Rtg1p 168.51 259.10 [Val MA] HXK2 9.65 5.45 Moléculas Hxk2p 349.62 197.50 [Val MA] GCR1 7.36 6.49 Moléculas Gcr1p 266.71 235.18 Peso 1.50·10-11 [g DW] NºAvog 6.02·1017 [molec/μmol]
DW=peso seco
Condición Glucosa Etanol Unidades
Concentración Gcr2p 2.41·10-05 1.52·10-05 [μmol/g DW]
Concentración Sok2p 2.31·10-05 1.82·10-05 [μmol/g DW]
Concentración Rtg1p 1.87·10-05 2.87·10-05 [μmol/g DW]
Concentración Hxt2p 3.87·10-05 2.19·10-05 [μmol/g DW]
35
3.5.1.1 Nivel 1: RNA polimerasa II
Para este nivel se usan 3 ecuaciones de equilibrio y 4 de conservación, originando
un sistema de 7 ecuaciones y 7 incógnitas. Se utiliza la misma nomenclatura que en las
figuras 2 y 3.
Las ecuaciones de equilibrio corresponden a:
KbP* + TFsII P
P + D1
P + D2
Kp1
KP2
Y1
Y2
Las ecuaciones de conservación corresponden a:
D10 = D1 + Y1
D20 = D2 + Y2
P0 = P* + P + n1·Y1 + n2·Y2
TFsII0 = TFsII + P + Y1 + Y2
D1 corresponde a la concentración de promotores del gen de interés que está
disponible para unirse, D2 a la concentración (disponible para unirse) de genes que no
corresponden al gen de interés que unen RNA pol II, Y1 corresponde a la concentración de
promotores del gen de interés que se encuentran unidos a RNA polimerasa II, Y2
corresponde al resto de los promotores de genes de levadura que se encuentran unidos a
RNA polimerasa II. P* corresponde a la RNA polimerasa II que no se ha unido a los TFsII
(factores necesarios para iniciar la transcripción de cualquier gen en levadura9), P a la
polimerasa activa (unida a TFsII); n1 y n2 corresponden al número medio de moléculas de
9 Existen 6 factores de transcripción para iniciar la transcripción de RNA polimerasa II: TFIIB, TFIID, TFIIE, TFIIF, TFIIH y Mediador (Med8p)
36
polimerasa activa por promotor. Los subíndices 0 indican la concentración total de las
especies.
La estimación de n1 y n2 de Kremling y Gilles (2001) es de 3 y 10 respectivamente
para E. coli, suponiendo que existen promotores fuertes y débiles. Para este trabajo, se
considera que todos los promotores son iguales con n1 = n2 = 10. (Struhl K, 2007)
Para modelar P0 y TFsII0 se utiliza el mismo esquema que en Kremling y Gilles,
asimilando TFsII al factor σ de E. coli. Los valores correspondientes son de 30000
moléculas para P0 y 6000 moléculas para TFsII0, que corresponde al factor limitante en
levadura, TFIIH. (Borggrefe et al., 2001)
Las constantes de disociación, Kp1 y Kp2 también se toman de Kremling y Gilles,
considerando Kp1 = Kp2 = 2.44·10-5 [μmol/g DW]. Para Kb se utiliza un valor de 0.32·10-6
[μmol/g DW], que es la constante de disociación entre los factores TFIIE y TFIIH
(Bushnell et al., 1996).
D10 se estima en una unidad por célula, equivalentemente, 1.11·10-7 [μmol/g DW];
D20 considera el promotor resto de los genes, estimados en 6000, con una concentración de
6.64·10-4 [μmol/g DW].
La salida de este nivel es la fracción de promotores D1 ocupados, ψ1=Y1/D10
37
3.5.1.2 Nivel 2: GCR2
Las ecuaciones de equilibrio son:
K(ψ1)D1 D1*
G + D1
G + D1*
Kg
α•Kg
GD1
GD1*
Kg
G + D3 GD3
Las ecuaciones de conservación:
D10 = D1 + D1* + GD1 + GD1*
G0 = G + GD1 + GD1* + GD3
D30 = D3 + GD3
Donde G representa la concentración de Gcr2p y D3 los promotores que a los que se
une Gcr2p. D1* representa “sitios virtuales” que representan los sitios D1 que están unidos a
polimerasa que se calculan en el primer nivel. Además, K(ψ1) = (1- ψ1)/ ψ1. (Kremling y
Gilles, 2000).
Kg tiene un valor de 2.9·10-4 μM (Huie & Baker, 1996). α representa el nivel de
activación que tiene Gcr2p sobre la polimerasa; según la revisión bibliográfica, una
mutación en Gcr1p provoca una disminución entre 13.8 y 7.9 fold. Considerando que
Gcr1p y Gcr2p actúan en conjunto (a pesar de no haber sido demostrado para HXK2), se
estima α = 0.1 10.
10 Se recuerda que las constantes son de disociación, por lo tanto, α < 1 indica mayor unión y α > 1, menor unión.
38
Para tomar en cuenta el efecto de glucosa, se considera que G0 es una función lineal
de esta. De esta forma, utilizando los valores de la tabla 3,
G0 = 8.94·10-7 ([glucosa]) + 1.52·10-5;
Donde la concentración de glucosa está en [g/L].
Las señales de salida son ψ2=(GD1* + D1*)/D10 y ψP=GD1/D10
3.5.1.3 Nivel 3: RGT1
Las reacciones de equilibro para este nivel son:
K+(ψ2)
D1 D1+
Kr
R + D1
R + D1++
Kr
RD1
RD1++
KrR + D4 RD4
K++(ψp2)D1 D1
++
R representa a Rtg1p; el superíndice + indica cuáles son los sitios que están
activados en el nivel superior (RNA pol II y Gcr2p + RNA pol II) y el superíndice ++ los
que están solamente ocupados con Gcr2p. D4 representa el resto de los promotores a los que
se une Rgt1p.
39
Las ecuaciones de conservación:
D10 = D1 + D1+ + D1
++ + RD1 + RD1++
R0 = R + RD1 + RD1++ + RD4
D40 = D4 + RD4
Puesto que Rgt1p cambia la conformación de la cromatina, se considera que R
compite con RNA pol II y con Gcr2p, impidiendo la unión. Como no se tienen datos de Kr,
se considera igual a Kg. Análogamente a Gcr2p, se considera que la concentración de Rgt1p
es una función lineal de la concentración de glucosa:
R0 = -1.00·10-6 ([glucosa]) + 2.87·10-5;
Las definiciones de las constantes de equilibrio son las siguientes:
K+ = (1 – ψ2- ψp2)/ ψ2
K++ = (1 – ψ2- ψp2)/ ψp2
En este nivel es donde se obtiene la señal que modula la transcripción, ψ3=D1+/D10.
3.5.2 Resolución del sistema
El sistema planteado se resuelve utilizando el resolvedor de ecuaciones de
MATLAB fsolve para sistemas no lineales de la forma F(x)=0.
El primer nivel se resuelve una sola vez, pues se considera que no es afectado por
las condiciones externas de glucosa. Para el segundo y tercer nivel, se resuelve cambiando
la concentración de glucosa en función del tiempo y resolviendo para cada nueva
concentración de Gcr2p y Rgt1p. La curva de glucosa utilizada se basa en la obtenida por
Humberto Díaz: Desde el tiempo inicial (0 horas) hasta el inicio del crecimiento
exponencial en glucosa (25 horas) se mantiene constante en 10 [g/L]; luego, entre las 25
40
horas y las 42.5 horas tiene un decaimiento exponencial hasta 0 [g/L], permaneciendo ese
valor para cualquier tiempo mayor a 42.5, como se ilustra en la figura 5.
Figura 5.- Curva de glucosa utilizada. Se considera que hasta antes del inicio del crecimiento exponencial el nivel es constante en 10 [g/L] y que se acaba la glucosa a las 42.5 [h]
Un inconveniente de los resolvedores de problemas no lineales es que necesitan un
punto de partida para las iteraciones pues utilizan rutinas de optimización. Una prueba con
valores típicos (vector inicial cero o vector inicial con 1 en todas las posiciones) entrega
resultados incoherentes, por ejemplo, valores de concentración negativos para las
variables, aunque efectivamente se llega cerca de un cero de la función. Utilizando un
vector que contiene como supuesto inicial valores de un orden de magnitud menor que los
de las concentraciones totales, se obtienen valores positivos coherentes que cumplen
F(x)=0, con una precisión de 10-9. Las tres señales se pueden observar en la figura 6.
41
Figura 6.- Señales de salida de los tres coordinadores. La señal ψ1 de RNA polimerasa II no cambia pues no es afectada por glucosa; ψ2 sigue la misma forma de la curva de glucosa al igual que ψ3. Es interesante notar que ψ3 no es sólo una disminución en algún factor constante de ψ2.
3.6 Aplicación a perfil de mRNA y flujo metabólico
Considerando que la transcripción es constante con un tasa rtrans = 0.00074
mRNA/hora (García-Martínez, Aranda y Pérez-Ortín, 2004) independiente de la
concentración de promotores y que la transcripción es modulada por ψ3 de modo que
mRNA= rtrans* ψ3, se obtiene el perfil mostrado en la sección superior de la figura 7.
42
Figura 7.- Perfiles comparados de mRNA. Se compara el perfil de expresión calculado con el obtenido por DeRisi et. al, 1997, marcando los hitos relevantes.
Para un análisis cualitativo del resultado y a manera de validación, se compara con
el perfil de DeRisi et al. (1997), que estudia la evolución de la expresión génica durante el
salto diaúxico (figura 8 inferior). Se observa que el nivel de mRNA de DeRisi sigue
bajando después de consumirse totalmente la glucosa, lo que no ocurre en el perfil
calculado. Esto sucede porque se ocupa una ecuación algebraica y no una diferencial para
calcular el perfil de expresión; en términos biológicos, el perfil calculado considera un
cambio instantáneo en la concentración, sin considerar que el mRNA permanece un tiempo
sin ser degradado.
Es interesante notar que no se llega a una represión total de HXK2, lo que parecería
indicar que la célula no inactiva por completo su vía glicolítica aún en ausencia de glucosa,
quizás manteniendo la posibilidad de seguir utilizando glucosa como fuente de energía una
vez que aparezca.
Utilizando la concentración calculada de mRNA, sería posible predecir la
concentración de proteína e0, que podría utilizarse para el cálculo de las cinéticas de
reacción in vivo. Sin embargo, por las aproximaciones utilizadas, el resultado no sería
válido para un análisis más cuantitativo.
43
4 Conclusiones
Se dedujo una red de interacción a partir de los datos de Humberto Díaz, basada en
cambios de niveles de expresión; para un gen en particular, HXK2, se pudo aplicar la
metodología de Kremling & Gilles (2001) eligiendo una proteína como activador general
(Gcrp1) y un represor más específico (Rgt1p).
Se seleccionaron 33 genes de vías metabólicas y 23 factores de transcripción en
base a cambios transcripcionales. Los genes seleccionados a partir de cambios en sus
niveles de expresión, tanto de vías metabólicas como factores de transcripción, mostraron
ser relevantes según sus ontologías y la revisión bibliográfica correspondiente. La
visualización utilizando el programa Graphviz da como resultado un gráfico que es
engorroso de analizar vía inspección.
La utilización de Pajek para el análisis de la red permitió separar las regulaciones de
cada uno de los genes de interés, lo que facilita su estudio. Además, se identifican factores
importantes en función de las regulaciones que ejercen, así como genes factibles de ser
modelados mediante la metodología de Kremling & Gilles.
En este sentido, la metodología propuesta para generar la red y analizarla se puede
entender como un sistema que permite organizar la información disponible en las bases de
datos utilizadas, pues los nodos están relacionados mediante una publicación. Sin embargo,
esto está limitado por la cantidad de información colocada en YEASTRACT, por lo que se
depende de la capacidad de revisión de literatura de los curadores de la base de datos para ir
actualizando el modelo. Por ejemplo, Hxk2p es un regulador de otros genes, como HXK1
(Palomino, Herrero y Moreno, 2005), pero esta relación no aparece en YEASTRACT.
Las relaciones entregadas por YEASTRACT no indican función activadora y
represora por lo que es necesaria una revisión bibliográfica para entender el funcionamiento
de la red. Mediante el estudio de los trabajos que dan origen a la relación en las bases de
datos, se pudo determinar que Gcr2p y Rgt1p son importantes para la regulación de HXK2,
despreciando la influencia de Sok2p.
44
El método de Kremiling y Gilles permite calcular la fracción ocupada de
promotores por complejos que dan inicio a la transcripción. En el caso de HXK2,
considerando que Gcr2p activa la transcripción y que la unión de Rgt1p impide la
transcripción, se logra una respuesta que, desde el punto de vista cualitativo, tiene sentido.
La unión de Gcr2p eleva el nivel de sitos a los cuales se une RNA polimerasa II, a la vez
que Rgt1p lo disminuye. En la condición final estimada, el nivel de expresión (dado el
aumento de Rgt1p y la disminución de Gcr2p en función de glucosa) de HXK2 es cercano
al esperado sin los efectos de activadores y represores. Con los valores adecuados para las
constantes se podría cuantificar la concentración de proteína presente en la célula,
permitiendo estimar las cinéticas in vivo.
Sin embargo, la metodología presenta algunos inconvenientes. En primer lugar, se
asume que las diferencias de expresión de los genes de vías metabólicas son producto de
los cambios transcripcionales (y por ende de las concentraciones de proteínas) de los
factores de transcripción. Sin embargo, esto no es necesariamente cierto, pues un factor
puede ser expresado constitutivamente y estar regulada su actividad, por ejemplo, mediante
fosforilaciones u otras modificaciones estructurales.
El segundo gran problema es la cantidad de información necesaria para la
construcción del modelo, tanto en la elección de los factores como para cuantificar la
expresión. Algunos de estos datos (como constantes de unión y concentraciones de distintas
proteínas) no se encuentran disponibles o bien lo están para especies distintas, por lo que es
necesario estimar algunos valores.
4.1 Recomendaciones
Se recomienda una revisión de las constantes y parámetros utilizados. Por ejemplo,
un parámetro muy sensible es el número medio de Polimerasas por promotor (n1 y n2),
pues un cambio en su valor conduce a un comportamiento completamente distinto, sobre
todo en el nivel II (GCR2). Para ello sería muy útil un análisis de sensibilidad.
45
Una posible aplicación práctica de este trabajo podría ser el estudio de la producción
de enzimas recombinantes. Si se tiene el número medio de plasmidios con genes de interés
cuyos promotores se unen a polimerasa, podría estimarse el nivel de producción
considerando tanto si el promotor es constitutivo pero con afinidad distinta al resto o si está
bajo el control de reguladores.
46
5 Bibliografía
Alberts B, Johnson A, Lewis J, Raff M, Roberts K, Walter P. (2002). “Molecular Biology
of the cell”, Garland Science, New York, 1463 pp.
Borggrefe T, Davis R, Bareket-Samish A, Kornberg RD. (2001). “Quantitation of the RNA
polymerase II transcription machinery in yeast”, Journal of Biological Chemistry
276(50):47150-3.
Borneman A, Leigh-Bell J, Yu H, Bertone P, Gerstein M, Snyder M (2006). “Target hub
proteins serve as master regulators of development in yeast”, Genes & Development 20:
453-448.
Bushnell DA, Bamdad C, Kornberg RD. (1996). “A minimal set of RNA polymerase II
transcription protein interactions”, Journal of Biological Chemistry 271(33): 20170-4.
Chambers A, Packham EA, Graham IR (1997). “Control of glycolytic gene expression in
the budding yeast (Saccharomyces cerevisiae)”, Current Genetics 29(1):1-9.
Chua G, Morris QD, Sopko R, Robinson MD, Ryan O, Chan ET, Frey BJ, Andrews BJ,
Boone C, Hughes TR (2006). “Identifying transcription factor functions and targets by
phenotypic activation”, PNAS 103:12045-12050.
DeRisi J, Iyer V, Brown P (1997). “Exploring the Metabolic and Genetic Control of Gene
Expression on A Genomic Scale”, Science 278:680-686.
Diaz H (2006) “Análisis comparativo de una cepa nativa y otra recombinante de
Saccharomyces cerevisiae mediante el uso de datos de expresión génica (Biochips de
DNA) e Ingeniería metabólica” Memoria de Doctorado en Ciencias de la Ingeniería
mención Química área Biotecnología, Universidad de Chile
47
García-Martínez J, Aranda A, Pérez-Ortín JE (2004). “Genomic Run-On Evaluates
Transcription Rates for All Yeast Genes and Identifies Gene Regulatory Mechanisms”,
Molecular Cell 15:303-313.
Harbison CT, Gordon DB, Lee TI, Rinaldi NJ, Macisaac KD, Danford TW, Hannett NM,
Tagne JB, Reynolds DB, Yoo J, Jennings EG, Zeitlinger J, Pokholok DK, Kellis M, Rolfe
PA, Takusagawa KT, Lander ES, Gifford KD, Fraenkel E, Young RA (2004).
“Transcriptional regulatory code of a eukaryotic genome” Nature 431:99-104.
Hollenhorst PC, Pietz G, Fox CA (2001) “Mechanisms controlling differential promoter-
ocupancy by the yeast forkhead proteins Fhk1p and Fkh2p: implications for regulating the
cell cycle and differentiation” Genes & Development 15:2445-2456.
Horak CE, Luscombe NM, Qian J, Bertone P, Piccirrillo S, Gerstein M, Snyder M (2002).
“Complex transcriptional circuitry at the G1/S transition in Saccharomyces cerevisiae”
Genes & Development 16: 3017-3033.
Huie MA, Baker HV (1996). “DNA-binding properties of the yeast transcriptional
activator, Gcr1p” Yeast 12(4): 307-317.
Kal AJ, Zonneveld AJ, Benes V, Berg M, Koerkamp MG, Albermann K, Strack N, Ruijter
JM, Richter A, Dujon B, Ansorge W, Tabak HF (1999). “Dynamics of Gene Expression
Revealed by Comparision of Serial Analysis of Gene Expression Transcript Profile from
Yeast Grown on Two Different Carbon Sources” Molecular Biology of the Cell 10: 1859-
1872.
Kremling A, Jahreis K, Lengeler JW, Gilles ED (2000). “The Organization of Metabolic
Reaction Networks: A Signal-Oriented Approach to Cellular Models” Metabolic
Engineering 2: 190-200.
48
Kremling A, Gilles ED (2001). “The Organization of Metabolic Reaction Networks II.
Signaling Processing in Hierarchical Structured Functional Units” Metabolic Engineering
3: 138-150 (2001)
Kremling A, Bettenbrock K, Laube B, Jahreis K, Lengeler JW, Gilles ED (2001). “The
Organization of Metabolic Reaction Networks III. Application for Diauxic Growth on
Glucose and Lactose” Metabolic Engineering 3: 362-379.
Lee TI, Rinaldi NJ, Robert F, Odom DT, Bar-Joseph Z, Gerber GK, Hannett NM, Harbison
CT, Thomson CM, Simon I, Zeitlinger J, Jennings EG, Murray HL, Gordon DB, Ren B,
Wyric JJ, Tagne J, Volkert TL, Fraenkel E, Gifford D, Young RA (2002). “Transcriptional
Regulatory Networks in Saccharomyces cerevisiae” Science 298: 799-804.
López MC, Baker HV (2000). “Understanding the Growth Phenotype of the yeast gcr1
Mutant in Terms of Global Genomic Expression Patterns” Journal of Bacteriology 182(17):
4970-4978.
Palomino A, Herrero P, Moreno F (2005). “Rgt1, a glucose sensing transcription factor, is
required for transcriptional represion of the HXK2 gene in Saccharomyces cerevisiae”
Biochem. J. 388: 697-703.
Palomino A, Herrero P, Moreno F (2006). “Tpk3 and Snf1 protein kinases regulate Rgt1
association with Saccharomyces cerevisiae HXK2 promoter” Nucleic Acids Research
34(5): 1427-1438.
Santangelo GM (2006) “Glucose signaling in Saccharomyces cerevisiae” Microbiology and
Molecular Biology Reviews 70(1):253-282.
Sasaki H, Kishimoto T, Mizuno T, Shinzato T, Uemura H (2005) “Expression of GCR1,
the transcriptional activator of glycolytic enzyme genes in the yeast Saccharomyces
cerevisiae, is positively autoregulated by Gcr1p.” Yeast 22(4):305-319.
49
Sasaki H, Uemura H (2005) “Influence of low glycolytic activities in gcr1 and gcr2 mutants
on the expression of other metabolic pathway genes in Saccharomyces cerevisiae” Yeast
22(2):111-127.
Sherman F. (1998). “An Introduction to the Genetics and Molecular Biology of Yeast
Saccharomyces cerevisiae”. Publicado en:
http://dbb.urmc.rochester.edu/labs/sherman_f/yeast/index.html.
Struhl K (2007) “Transcriptional noise and the fidelity of initation by RNA polymerases
II”, Nature Structural & Molecular Biology 14(2):103-5.
Uemura H, Franekel DG (1999). “Glucose Metabolism in gcr Mutants of Saccharomyces
cerevisiae” Journal of Bacteriology 181(15):4719-4723.
Váchová L, Devaux F, Kučerová H, Řičicová M, Jacq C, Palková Z (2004) “Sok2p
transcription factor is involved in adaptive program relevant for long term suvirval of
Saccharomyces cerevisiae colonies” The Journal of Biological Chemistry 279(36): 37973-
37981.
Workman CT, Mak HC, McCuine S, Tagne J, Agarwal M, Ozier O, Begley TJ, Samsom
LD, Ideker T (2006) “A System Approach to Mapping DNA Damage Response Pathways”
Science 312:1054-1059
Xia Y, Yu H, Jansen R, Seringhaus M, Baxter S, Greenbaum D, Zhao H, Gerstein M
(2004) “Analyzing Cellular Biochemistry in Terms of Molecular Networks” Annual
Review Biochem. 73:1051-1087.
Zeng X, Deminoff SJ, Santangelo GM (1997) “Specialized Rap1p/Gcr1p transcriptional
activation through Gcr1p DNA contacts requires Gcr2p, as does hyperphosphorylation of
Gcr1p” Genetics 147(2): 493-505.
50
www.yeastgenome.org: Sitio web de Saccharomyces Genome Database. Revisado en Mayo
2007.
www.yeastract.com: Sitio web de YEASTRACT. Revisado en Mayo 2007.
www.graphviz.com: Sitio web de Graphviz. Revisado en Mayo 2007.
http://vlado.fmf.uni-lj.si/pub/networks/pajek/: Sitio web de Pajek. Revisado en Mayo 2007.
http://www.geneontology.org/: Sitio web del proyecto Gene Ontology.
51
6 Anexos
A. CD Adjunto
Este anexo consiste en un CD con la siguiente estructura, junto con el proceso para
utilizar los scripts de MATLAB para generar la red:
Carpeta “Selección_Genes”: Contiene todos los archivos utilizados para la
selección de los genes a estudiar y elaborar la red de regulación
o Carpeta “Búsqueda_Factores”: Contiene los archivos
correspondientes a las páginas web que descarga MATLAB al
ejecutar el script para la generación de la red
o Carpeta “Red” :
3 archivos por cada uno de los 33 genes de vías metabólicas.
Los archivos “.dot” corresponden a el archivo de texto que
sirve para graficar la red asociada al gen usando Graphviz;
los “.rep” corresponden a los reportes del método de los k-
neighbors de Pajek que se utilizan para elaborar los archivos
“.dot”. Los archivos “.ps” son archivos postcript para la
visualización de la red.
GradIn.rep y GradOut.rep, que corresponden al reporte de
Pajek de los grados de entrada y salida para cada nodo,
respectivamente.
Archivos redtotal.net y AnálisisRed.paj que corresponden a la
red implementada para Pajek y la sesión de trabajo
respectiva.
52
Archivo GDV.mat, corresponde al arreglo de celdas para
MATLAB que contiene los nombres de los 36 genes de vías
metabólicas.
ConversionRedTotal.m, que es el scritp para convertir el
archivo redtotal.dot a un archivo de texto plano
dot2txt.m, script que dado el número de líneas de
encabezamiento, convierte un archivo .dot a una archivo de
texto de afiliación
GenerarGraficosGen.m es el scritp para generar las redes de
regulación específica para los genes seleccionados.
Los archivos redtotal.dot, redtotal.txt, redtotal.ps que
corresponden a las red total (33 genes de vías más 23 FT)
generada en los distintos formatos.
o biochemical_pathways2.tab, archivo de texto tabulado que contiene
las vías metabólicas de Saccharomyces cerevisiae disponibles en
SGD, sin las líneas de encabezados originales.
o Datos_HDiaz.tab, archivo de texto tabulado con los datos de
Humberto Díaz, sin las líneas de encabezamiento.
o gene_association_sgd.tab, archivo de texto tabulado con los
identificadores internos e identificadores de ontologías de los genes
de SGD.
o registry.genenames.tab: archivo de texto tabulado con los nombres
comunes, sistemáticos e identificador interno de los genes de SGD.
53
o Go_terms_and_ids.tab, archivo de texto tabulado que contiene las
ontologías para SGD y sus identificadores.
o Preparacion_Datos.m: A partir de los datos de SGD y Humberto
Díaz, crea un archivo con el que se trabaja posteriormente.
o ListaFactores.txt: Archivo de texto con todos los factores de
YEASTRACT.
o SeleccionGenesVias.m: Script para seleccionar los genes de vías
metabólicas con expresión diferencial superior a 1.5
o SeleccionGenesTest.m: Script para seleccionar genes con expresión
diferencial según test de hipótesis.
o SeleccionOntologias.m: Script para seleccionar ontologías
relevantes.
o SeleccionFactores.m: Script para seleccionar los factores de
transcripción relevantes.
o fCargar_FT.m: Script que procesa las páginas de YEASTRACT para
convertir la tabla de la página web a datos tipo MATLAB.
o Generar_Red.m: Script que implementa el algoritmo iterativo de
búsqueda de factores.
o El resto de los archivos son los que generan los scritp señalados
como auxiliares.
54
Carpeta “Simulacion”: Contiene los archivos necesarios para la simulación
de la regulación de HXK2.
o GLU.m : función de MATLAB para replicar la curva de glucosa en
función del tiempo.
o Modelo_Completo.m: Script para simular las señales del modelo.
o nivel_mRNA.m: Script para comparar la expresión simulada con la
reportada en DeRisi et al.
o yeastdata.mat: Archivo con los datos de DeRisi et al.
o phiR3.mat : Archivo con los datos de los niveles de las señales.
Para generar la red, en formato .dot, el orden de ejecución, dentro de la carpeta
Seleccion_Genes es el siguiente: Preparación_Datos, SeleccionGenesVias,
SeleccionOntologias, SeleccionGenesTest, SeleccionFactores y GenerarRed. Con este
ultimo paso, queda conformada la red en formato .dot, que es procesado por
ConversionRedTotal para dejarlo en formato de texto de afiliación. Este último archivo
puede ser procesado por la utilidad txt2pjk, como se explica en la metodología.
55
B. Gráficos de regulación para los genes de Vías Metabólicas
En el presente anexo se presenta la regulación de cada uno de los genes de vías
metabólicas seleccionados que están regulados (33) en el siguiente orden: ACO1, ADH1,
ADH4, ADH5, ALD6, CDC19, CIT1, CIT2, ENO1, ENO2, FBA1, FUM1, GPM1, HXK1,
HXK2, IDH2, KGD2, LSC2, MDH2, PDC1, PDC6, PFK1, PGI1, PGK1, PYC1, SDH1,
SDH3, SDH4, TDH1, TDH2, TDH3, TPI1 y UGP1
Los nodos que corresponden a factores de transcripción tienen forma de círculos y
los nodos que corresponden a elementos de la vías metabólicas tienen forma cuadrada.