86
UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS DEPARTAMENTO DE INGENIERÍA QUÍMICA Y BIOTECNOLOGÍA Modelo integrado de redes de regulación génica y flujos metabólicos en levaduras MEMORIA PARA OPTAR AL TÍTULO DE INGENIERO CIVIL EN BIOTECNOLOGÍA MARKO ANTONIO BUDINICH ABARCA PROFESOR GUÍA: DR. JUAN ASENJO PROFESOR CO-GUÍA: DR. IVAN RAPAPORT PROFESOR INTEGRANTE: DRA. BARBARA ANDREWS SANTIAGO DE CHILE AGOSTO 2007

Modelo integrado de redes de regulación génica y flujos ... · otro y la expresión génica, que a partir de estímulos externos modula la cantidad de mRNA que se genera. (Kremling

Embed Size (px)

Citation preview

UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS DEPARTAMENTO DE INGENIERÍA QUÍMICA Y BIOTECNOLOGÍA

Modelo integrado de redes de regulación génica y flujos metabólicos en levaduras

MEMORIA PARA OPTAR AL TÍTULO DE INGENIERO CIVIL EN BIOTECNOLOGÍA

MARKO ANTONIO BUDINICH ABARCA

PROFESOR GUÍA: DR. JUAN ASENJO

PROFESOR CO-GUÍA: DR. IVAN RAPAPORT

PROFESOR INTEGRANTE:

DRA. BARBARA ANDREWS

SANTIAGO DE CHILE AGOSTO 2007

RESUMEN DE LA MEMORIA PARA OPTAR AL TITULO DE INGENIERO CIVIL EN BIOTECNOLOGIA POR: MARKO BUDINICH A. FECHA: 20/08/2007 PROF. GUIA: Dr. JUAN ASENJO

El presente trabajo tiene como objetivo principal la modelación de la regulación

génica para genes que se expresen diferencialmente durante el salto diaúxico. Se asume que

los cambios de expresión de los genes de vías metabólicas son consecuencia de las

diferencias de concentración de los factores de transcripción y que esta varía de acuerdo a

las condiciones exteriores.

Para elegir los genes de vías metabólicas que se expresan diferencialmente se

utilizan los datos de microarrays de la tesis doctoral de Humberto Díaz para la cepa P(-)

creciendo en glucosa y etanol. Se elige como criterio de cambio una diferencia de expresión

de 1.5 veces en los genes que participan de las vías metabólicas: Metabolismo de 1-fosfato

glucosa, fermentación de glucosa, glicólisis, ciclo del TCA y respiración aeróbica, según la

información disponible en la base de datos Saccharomyces Genome Database, siendo

elegidos 36 genes, de los cuales 33 son regulados.

Para generar la red de regulación se utilizaron las asociaciones que reporta la base

de datos YEASTRACT para seleccionar factores de transcripción asociados a los genes de

vías metabólicas; además, se impuso que los factores presentaran un cambio de expresión

según un test de hipótesis para medias distintas y varianzas desconocidas en las distintas

condiciones de crecimiento y que poseyeran una ontología relevante. Mediante un

procedimiento iterativo se seleccionan 26 reguladores, de los cuales 23 regulan a genes de

vías metabólicas.

Se selecciona a HXK2 para modelar cuantitativamente su expresión utilizando

como activador y represor a Gcr2p y Rgt1p, simulando un cambio externo en la

concentración de glucosa. Si bien está en concordancia con datos publicados a nivel

cualitativo, las aproximaciones utilizadas distorsionan de manera perceptible el resultado

final.

2

1 INTRODUCCIÓN ...................................................................................................................... 3

1.1 FUNDAMENTOS ......................................................................................................................... 3 1.2 NOTA SOBRE LA NOMENCLATURA........................................................................................... 5 1.3 MOTIVACIÓN Y JUSTIFICACIÓN .............................................................................................. 6 1.4 OBJETIVOS ................................................................................................................................ 6 1.5 ALCANCES................................................................................................................................. 7 1.6 APORTE AL CAMPO O DISCIPLINA ........................................................................................... 7

2 METODOLOGÍA....................................................................................................................... 8

2.1 ELECCIÓN DE LOS GENES CON CAMBIOS EN NIVELES DE EXPRESIÓN................................... 8 2.2 GENERACIÓN DE LA RED DE REGULACIÓN ........................................................................... 10 2.2.1 VISUALIZACIÓN UTILIZANDO GRAPHVIZ.................................................................................. 11 2.2.2 ANÁLISIS DE LA RED UTILIZANDO PAJEK ................................................................................. 12 2.3 MODELACIÓN DE LA REGULACIÓN........................................................................................ 13

3 RESULTADOS Y DISCUSIONES ......................................................................................... 16

3.1 SELECCIÓN DE GENES............................................................................................................. 16 3.1.1 GENES DE VÍAS METABÓLICAS................................................................................................. 17 3.1.2 GENES FACTORES DE TRANSCRIPCIÓN ................................................................................... 21 3.1.3 ANÁLISIS DE LOS GENES SELECCIONADOS ............................................................................... 25 3.2 VISUALIZACIÓN DE LA RED.................................................................................................... 27 3.3 ANÁLISIS DE LA RED UTILIZANDO PAJEK ............................................................................. 28 3.3.1 RESULTADO DE LA APLICACIÓN DEL MÉTODO DE LOS K-NEIGHBORS A HXK2 ......................... 30 3.4 REVISIÓN DE LA LITERATURA ASOCIADA A LA REGULACIÓN DE HXK2 ............................ 31 3.5 MODELACIÓN DE LA EXPRESIÓN DE HXK2.......................................................................... 32 3.5.1 ECUACIONES EMPLEADAS....................................................................................................... 32 3.5.1.1 Nivel 1: RNA polimerasa II ............................................................................................... 35 3.5.1.2 Nivel 2: GCR2 ................................................................................................................... 37 3.5.1.3 Nivel 3: RGT1 ................................................................................................................... 38 3.5.2 RESOLUCIÓN DEL SISTEMA ..................................................................................................... 39 3.6 APLICACIÓN A PERFIL DE MRNA Y FLUJO METABÓLICO.................................................... 41

4 CONCLUSIONES .................................................................................................................... 43

4.1 RECOMENDACIONES............................................................................................................... 44

5 BIBLIOGRAFÍA ...................................................................................................................... 46

6 ANEXOS.................................................................................................................................... 51

A. CD ADJUNTO............................................................................................................................ 51 B. GRÁFICOS DE REGULACIÓN PARA LOS GENES DE VÍAS METABÓLICAS............................... 55

3

1 Introducción

El propósito del presente trabajo es integrar de manera cuantitativa información

sobre la regulación de los genes de las vías metabólicas en la levadura Saccharomyces

cerevisiae que aparece descrita en la literatura con objeto de calcular la expresión génica

durante el salto diáuxico. Para ello, es necesario en primer lugar construir una red de

regulación para genes de vías metabólicas que tenga significado biológico y luego utilizar

alguna metodología que permita modelar de el comportamiento de los reguladores sobre los

genes de interés.

1.1 Fundamentos

Una característica fundamental de los sistemas biológicos es la existencia de partes

que cumplen ciertas funciones y que interactúan entre sí. Esto es válido tanto a escala de

organismos (poblaciones, comunidades, ecosistemas, etc.) como a niveles celulares (redes

metabólicas, redes de regulación, compartimentos celulares, interacciones proteína-

proteína, etc.). La existencia de estas “unidades funcionales” separa a la biología del resto

de las disciplinas de las ciencias naturales y las acerca más a áreas de la informática y la

ingeniería. Ejemplos de unidad funcional son las enzimas, que transforman un sustrato en

otro y la expresión génica, que a partir de estímulos externos modula la cantidad de mRNA

que se genera. (Kremling et. al, 2000)

Las relaciones entre unidades funcionales pueden ser entendidas en términos de

redes. Siguiendo los ejemplos planteados, la transformación de un sustrato en un producto

puede requerir varias reacciones mediadas por diferentes enzimas, generando una red

metabólica. Los distintos elementos que regulan la expresión de un gen generan una red de

regulación. (Xia et. al, 2004)

4

La manera más directa de regulación génica consiste en que una proteína interactúe

con una región del DNA conocida como promotor, que antecede a la parte de un gen que

codifica efectivamente para una secuencia de aminoácidos, aumentando o disminuyendo

(fenómenos denominados activación o represión, respectivamente) la cantidad de mRNA

que es sintetizado por la proteína RNA polimerasa II.

Uno de los procesos en Saccharomyces cerevisiae que muestra una reestructuración

a nivel de transcritos es el salto o crecimiento diaúxico1. Es el proceso mediante el cual un

microorganismo cambia de una fuente de alimento a otra. En este caso, cepas estudiadas

por Humberto Díaz tienen una etapa de crecimiento en glucosa que deja como producto

etanol, que es consumido en la segunda parte de la fermentación. Este cambio de fuente de

alimento hace necesario un reajuste a nivel de rutas metabólicas lo que implica sintetizar

ciertas enzimas para activar nuevas rutas metabólicas, con el consiguiente cambio de los

perfiles de expresión.

Los cambios de expresión globales de un organismo pueden ser identificados

mediante la utilización de técnicas masivas como los microarrays. Esta técnica tiene como

resultado una gran cantidad de información, que puede ser analizada mediante métodos

estadísticos como el agrupamiento2 de perfiles similares. Para el presente trabajo se dispone

de los datos de la tesis doctoral de Humberto Díaz, realizados en cepas P+ y P- en las fases

de crecimiento en glucosa, crecimiento en etanol y fase estacionaria.

Adicionalmente existen bases de datos como Saccharomyces Genome Database

(SGD) y Yeast Search for Transcriptional Regulators And Consensus Tracking

(YEASTRACT) que mantienen numerosa información sobre el genoma y asociaciones

regulatorias de Saccharomyces cerevisiae, respectivamente. Ambas bases de datos son

mantenidas de manera manual, lo que garantiza la calidad de la información que entregan.

1 La expresión proviene del francés “diauxie” que significa crecimiento doble. 2 Clustering

5

Un tipo de descripción que se asocia a un gen es la denominada “ontología”. En un

sentido amplio, una ontología es una especificación de un vocabulario relacional; en otras

palabras, corresponde a un conjunto de términos definidos, acotados y relacionados

jerárquicamente para ser usados en un campo o disciplina. En este caso, lo términos de la

ontología son del tipo biológico. Por ejemplo, al estudiar la expresión de un determinado

gen, se puede utilizar como criterio de búsqueda las palabras “síntesis de proteínas”,

“expresión” o “transcripción”, por lo que puede ser difícil establecer cuáles resultados son

equivalentes entre sí.

El proyecto Gene Ontology (GO) es un esfuerzo conjunto para proveer de una

ontología común a diferentes bases de datos relacionadas con genes y productos génicos.

Siguiendo con ejemplo anterior, se podría utilizar la ontología “expresión” y este término

sería derivado de otro más general como “biosíntesis”. La base de datos SGD participa de

GO, por lo que contiene las asociaciones de las ontologías para cada gen.

El problema de las redes no es exclusivo de la biología, sino que abarca un gran

número de áreas de las ciencias e ingeniería. Para atacar estos problemas, se han generado

una serie de herramientas computacionales tanto de diagramación como de análisis. En el

presente trabajo se utilizarán dos softwares, Graphviz y Pajek, ambos programas de fuente

abierta y disponibles en sus sitios web.

1.2 Nota sobre la nomenclatura

La nomenclatura utilizada sigue las pautas recomendadas por SGD: Letras

mayúsculas para hablar de un gen (YFG1)3, primera letra mayúscula y el sufijo “p” para

hablar de proteína (Yfg1p), cursivas minúsculas para hablar de cepas mutantes que no

expresan el gen (yfg1) y mayúsculas cursivas (YFG1) para cepas que expresan el gen de

manera recombinante.

3 YFG es un acrónimo de Your Favorite Gene. Se utiliza como ejemplo frecuente en la literatura relacionada.

6

1.3 Motivación y Justificación

Las redes de interacción constituyen el primer paso para la modelación de la

dinámica celular, lo que constituye un desafío permanente para la biología de sistemas; la

generación de modelos mecanísticos que tengan poder predictivo son de una tremenda

importancia para la ciencia e ingeniería, pues permiten optimizar procesos, realizar

experimentos in silico, otorgar fundamentos para un diseño experimental, etc.

Además, Saccharomyces cerevisiae es uno de los organismos modelo más

ampliamente estudiados, lo que hace suponer a priori que existirá la información suficiente

para desarrollar un modelo cuantitativo; además, existe un set de datos (DeRisi et al., 1997)

que miden la expresión global de los genes de este organismo en el tiempo durante un

crecimiento diaúxico, lo que es fundamental para validar el modelo.

1.4 Objetivos

General

Integrar información proveniente de la regulación génica de forma cuantitativa a

flujos metabólicos en genes de la vía central del carbono en levadura.

Específicos

Desarrollar una metodología que permita seleccionar genes de vías metabólicas

y de factores de transcripción relevantes.

Generar una red de regulación para los genes de vías metabólicas.

Utilizar una metodología publicada que permita cuantificar las interacciones

entre los factores de transcripción y los genes de las vías metabólicas.

7

1.5 Alcances La presente memoria se centrará en los genes del metabolismo central del carbono,

no se analizarán otras rutas metabólicas. Además, sólo se estudiará el comportamiento a partir de los datos de la cepa P- (no recombinante)

Además, no se contempla realizar experiencias de laboratorio para recabar los datos

que sean necesarios, pues éstos se obtendrán de la literatura correspondiente. La metodología de modelación que se emplee se ajustará a los resultados que se

obtengan de la elaboración de la red; no se pretende ampliarla ni adaptarla para abarcar más casos.

1.6 Aporte al campo o disciplina El presente trabajo intenta cuantificar los efectos de la variación de la concentración

de factores de transcripción en la expresión génica en levadura dependiendo de la variación externa de glucosa, algo que no había sido ensayado con anterioridad.

Además, utiliza de manera intensiva base de datos y software asociado el análisis de

redes para identificar nodos importantes, añadiendo otro tipo de criterios para la elección de elementos interesantes para la modelación y no solo basándose en literatura descrita.

8

2 Metodología

En esta sección se describe los pasos seguidos para resolver la problemática planteada.

2.1 Elección de los genes con cambios en niveles de expresión

El primer criterio para seleccionar los genes de vías metabólicas interesantes de

estudiar es que estos se encuentren relacionados con las vías del metabolismo central del

carbono. Para ello, se obtiene la base de datos de vías metabólicas de SGD, se implementa

una rutina en MATLAB y se seleccionan aquellos genes que participan de alguna de las

siguientes vías4: Metabolismo de 1 fosfato glucosa, fermentación de glucosa, glicólisis,

ciclo del TCA y respiración aeróbica. Se almacenan esta selección en un archivo para su

posterior uso.

Paralelamente, para seleccionar aquellos genes que presentan cambios significativos

en su expresión se utiliza información proveniente de los experimentos realizados por

Humberto Díaz. En base a pruebas previas, se eligen dos criterios: Genes que presenten un

cambio en su nivel de expresión en un factor de 1.5 o más (que se dominará simplemente

1.5 Fold) y un test de hipótesis para igualdad de medias con varianza desconocida (se

denominará test). Ambos criterios responden a elegir elementos que sean interesantes de

modelar, pues lo que se persigue es explicar el reajuste interno de la célula en función de

una señal exterior. Se usa nuevamente una rutina de MATLAB para seleccionar los genes

desde los datos y se generan dos archivos de texto diferentes para cada criterio. En cada

archivo se almacena el promedio de intensidad para cada condición (crecimiento en glucosa

y crecimiento en etanol) y la tasa de cambio (nivel en glucosa / nivel en etanol).

4 Las tablas se encuentran en inglés, por lo que en las rutinas implementadas los nombres de las vías son: glucose 1-phosphate metabolism, glucose fermentation , glycolysis, TCA cycle y aerobic respiration.

9

Es razonable suponer que los mayores efectos de la regulación se vean reflejados en

los genes objetivos (en este caso, los genes de las vías) y que los cambios en el nivel de los

reguladores sean mucho menor. Por lo tanto, para seleccionar los genes de las vías

metabólicas elegidas que se expresan diferencialmente se elige como conjunto de búsqueda

los que presentan 1.5 Fold y para los factores de transcripción el conjunto de los

seleccionados por test de hipótesis.

Adicionalmente, es deseable seleccionar factores de transcripción que sean

relevantes para el fenómeno que se estudia. Para ello se seleccionarán factores que

presenten ontologías relevantes; se considerarán aquellas que presenten alguna de las

siguientes palabras claves en su descripción: glucosa, glicólisis, etanol, cAMP, TCA y

crecimiento.

Así, el conjunto de los genes a relacionar se divide en dos conjuntos con las

siguientes características:

1. Genes de Vías Metabólicas: Genes que presentan un nivel de cambio

superior a 1.5 y que participan de las vías metabólicas del Metabolismo de 1

fosfato glucosa, fermentación de glucosa, glicólisis, ciclo del TCA y

respiración aeróbica.

2. Factores de Transcripción: Genes que son reconocidos como factores de

transcripción en YEASTRACT, que presentan un nivel de cambio detectable

mediante un test de hipótesis y que presenten una ontología que contenga al

menos una de las siguientes palabras claves: glucosa, glicólisis, etanol,

cAMP, TCA y crecimiento.

10

2.2 Generación de la red de regulación La base de datos YEASTRACT permite buscar factores de transcripción para un

conjunto de genes mediante un formulario en pantalla via web. Sin embargo, no es posible

descargar la base de datos directamente. Por lo tanto, se utiliza MATLAB para solicitar los

datos a la página.

Con esto se diseña un procedimiento iterativo para ir obteniendo los factores de

transcripción que regulan a los factores de transcripción5:

1) Se parte de un núcleo formado por los genes de vías metabólicas que

presenten cambios de 1.5 Fold.

2) A este núcleo se le buscan los factores de transcripción sobre la totalidad de

la base de datos.

3) Se filtran los factores obtenidos sobre el conjunto de factores seleccionados.

4) Los factores obtenidos en el conjunto anterior se añaden al núcleo de

búsqueda.

5) Se vuelve al punto 2. Cuando la lista de genes no aumenta entre una etapa y

otra, se termina la iteración.

6) Como paso final, se realiza una búsqueda de los factores de transcripción del

conjunto final obtenido sobre los genes presentes en el conjunto final.

5 Al momento de realizar una búsqueda de factores de transcripción, YEASTRACT permite tres opciones: Búsqueda potencial, búsqueda documentada o ambas. En el presente trabajo las búsquedas se hace sobre información documentada.

11

Como respuesta a la consulta en YEASTRACT, se obtiene una tabla como la

mostrada en la figura 1. Si bien esta tabla contiene mucha información, la identificación de

la red no es fácil de ver, por lo que se hace necesario usar algún tipo de estrategia de

visualización.

Figura 1.- Tabla resultado de la búsqueda de factores en YEASTRACT. La primera columna corresponde a los factores que regulan los genes buscados; la segunda, a el porcentaje de genes que es regulado por el factor. La tercera columna contiene la lista de genes regulados por el factor. La figura es referencial

2.2.1 Visualización utilizando Graphviz

Con objeto de visualizar la tabla entregada por YEASTRACT, se crea una rutina en

MATLAB que genera un archivo de texto plano que contiene las instrucciones para dibujar

la red de regulación en Graphviz, en formato .dot a partir del código fuente de la página

web. Por ejemplo, tomando como referencia la novena fila de la figura 1, Hms1p (factor de

transcripción) está relacionado con HMS1, PDC1 y PDC6. Al procesar esta línea se

obtendría el siguiente resultado6: … HMS1 -> HMS1 ; HMS1 -> PDC1 ; HMS1 -> PDC6 ; … Este código es interpretado por el motor de dibujo dot, que jerarquiza los nodos. En

el ejemplo anterior, HMS1 sería asignado al primer nivel, mientras que PDC1 y PDC6 serían asignados al segundo y último nivel.

6 Más detalles sobre la sintaxis de Graphviz se encuentran en la documentación de su sitio web.

12

Si bien la estrategia de dibujar las relaciones ayuda a entender el marco general de

regulaciones, el resultado no permite centrarse en un solo gen objetivo, por lo que se requiere un mayor nivel de análisis.

2.2.2 Análisis de la red utilizando Pajek Quitando los símbolos particulares de la sintaxis de Graphviz (“ -> ”, “;” y el

encabezamiento del archivo) se tiene un archivo de texto de afiliación. Este nuevo archivo

puede ser interpretado por la utilidad txt2pajek (Juergen Pfeffer, Octubre 2004, disponible

en el sitio web del programa) para transformarlo a un archivo .net que pueda ser

procesado en Pajek:

… HMS1 HMS1 HMS1 PDC1 HMS1 PDC6 …

txt2pajek

*Vertices N … Xi “HMS1” Xj “PDC1” Xk “PDC6” … *Arcs … Xi Xi Xi Xj Xi Xk …

El primer encabezado del archivo de Pajek (*Vertices N) corresponde a la

declaración de los nodos. N representa el número total de vértices, mientras que Xi

representa el número de nodo asignado y el texto entre comilla el nombre. El segundo

encabezado (*Arcs) corresponden a las relaciones entre los nodos.

Una vez transformado el archivo de la red total, se carga en Pajek y para cada gen

de las vías metabólicas seleccionado, se aplica el método de los k-neighbors para

determinar la distancia de los nodos entrantes al nodo objetivo. El programa entrega un

reporte de la distancia de todos los nodos al nodo objetivo y asigna un valor particular

(9999998) si algún nodo no es alcanzable:

13

*Vertices N … Xi “HMS1” Xj “PDC1” Xk “PDC6” … *Arcs … Xi Xi Xi Xj Xi Xk …

Pajek, método de los k-neighbors, aplicado a PDC6

1. … … L. 1 – HMS1 L+1. 9999998 – PDC1 L+2. 0 – PDC6 …

L representa una numeración arbitraria para marcar las líneas de salida. Se aplica

este método para todos los genes de vías metabólicas y para cada uno se guarda el reporte

correspondiente.

Utilizando esta información, se modifica el archivo original de Graphviz para dejar

sólo los factores que se encuentren ligados al gen objetivo (distancia distinta a 9999998):

1. … … 2L. 1 – HMS1 L+1. 9999998 – PDC1 L+2. 0 – PDC6 …

Rutina de MATLAB para eliminar nodos no conectados

… HMS1 -> HMS1; HMS1 -> PDC6; …

Con este procedimiento, se obtienen los reguladores que intervienen directa o

indirectamente sobre el gen objetivo lo que permite analizar cada una de las relaciones.

2.3 Modelación de la regulación

Para modelar la red de regulación se utilizará el método propuesto por Kremling y

Gilles (2001)

El problema de la regulación puede ser expresado en términos del proceso de señales.

Ante una serie de entradas (p.ej, concentración de un metabolito, reguladores de expresión,

promotores, genes codificantes, etc.) es posible definir un objeto denominado

“coordinador”, llamado así pues coordina la distribución de los complejos de transcripción

(Kremling et al., 2001).

14

Figura 2.- Coordinador de la expresión génica. La figura muestra las entradas relevantes para un sistema de 3 proteínas (P, Act y Rep), 2 sitios de unión (D1 y D2) y los factores de transcripción necesarios (TFsII). P0, Act0, Rep0, D10, D20 y TFsII0 representan las concentraciones totales de Polimerasa, Activador de la transcripción, Represor de la transcripción, Sitio de unión 1 y 2 de las proteínas y factores de polimerasa II, respectivamente. Las salidas ψ1 y ψ2 son la fracción de RNA polimerasa II unida a los promotores.

Como respuesta a los estímulos, el coordinador genera una señal que modula la

expresión génica, como se ilustra en la figura 2. Sin embargo, el sistema que representa el

coordinador de la figura 2 es de 19 ecuaciones por 19 incógnitas, lo que es engorroso de

revisar y modificar en caso de querer incorporar más elementos para extender el modelo.

Adicionalmente, la influencia de los reguladores suele ser más específica que la de RNA

polimerasa II, por lo que se espera que un cambio en su concentración no afecte la

distribución de factores más generales en los sitios de unión.

Por lo tanto, desde un punto de vista biológico, es natural definir una jerarquía de

interacción, donde la señal se transmite desde el nivel superior pero no viceversa. Esto es lo

que se muestra en la figura 3. La señal se transmite desde el primer coordinador, es

modificada por el segundo coordinador que genera segunda señal que vuelve a ser

modificada por el tercer coordinador. Es esta última señal la que finalmente modula la

transcripción. Kremling y Gilles (2001) definen para tres niveles la manera en como

interactúan las proteínas, considerando los casos en que la presencia de una ayuda a que

otra se acople, que compitan por el sitio de unión las proteínas que se necesitan para iniciar

la transcripción, etc.

CoordinadorD10

D20

Rep0 P0 Act0

TFsII0

2ψ1ψ

15

Figura 3.- Modelo reducido propuesto. En este caso, se considera que la proteína Act tiene un rol más general que Rep para el gen D1. Los sitios de unión D2, D3 y D4 representan el resto de los sitios de unión para las proteínas del nivel correspondiente. El subíndice r indica que la señal es del modelo reducido. ψP2 es una señal auxiliar para el tercer nivel.

La señal entre niveles es considerada mediante la aparición de un sitio “virtual”. Por

ejemplo, en el segundo coordinador, se “activa” D1 en función de la señal ψr1 a D*, y es D*

y el complejo “D*·Act” los elementos que transcriben efectivamente, lo que puede

expresarse de la siguiente forma:

Donde

En Kremling y Gilles (2001) se pueden encontrar las definiciones de los distintos K

y las señales para los tres niveles de interacciones.

3rψ

2Pψ2rψ

2rψ1rψ

CoordinadorD10

D20

P0

TFsII0

CoordinadorD10

D30

Act0

CoordinadorD10

D40

Rept0

16

3 Resultados y Discusiones

3.1 Selección de genes

Según los dos criterios presentados, lo genes que presentan significancia para ser

analizados resultan ser los siguientes:

36 genes participan en las vías metabólicas y presentan cambios sobre 1.5

Fold:

ACO1, ADH1, ADH3, ADH4, ADH5, ALD6, CDC19, CIT1, CIT2, ENO1,

ENO2, FBA1, FUM1, GPM1, HXK1, HXK2, IDH2, KGD1, KGD2, LSC1,

LSC2, MDH2, PDC1, PDC6, PFK1, PGI1, PGK1, PYC1, SDH1, SDH3, SDH4,

TDH1, TDH2, TDH3, TPI1 y UGP1

26 genes pertenecen a genes catalogados como factores de transcripción en

la base de datos en YEASTRACT, presentan diferencias de medias según el test

de hipótesis y tienen una ontología relevante:

ADR1, ASH1, DOT6, FKH1, FKH2, FLO8, GCR1, GCR2, HMS1, MGA1,

MIG1, MIG2, MSN1, MSN2, MSN4, MSS11, NRG1, NRG2, PDC2, PHD1,

RGT1, SIP4, SOK2, STE12, TEC1 y TYE7.

A continuación, se describen cada uno de los 62 genes, separados por grupos de

pertenencia, en orden alfabético:

17

3.1.1 Genes de vías metabólicas ACO1: Aconitasa, requerida para el ciclo de los ácidos tricarboxílicos (TCA) y también es

requerido independientemente para el mantenimiento del genoma mitocondrial;

componente del nucloide mitocondrial; mutación lleva a auxotrofía de glutamato.

ADH1: Alcohol deshidrogenasa, isoenzima fermentativa activa como homo o

heterotetrámeros; requerida para la reducción de acetaldehído a etanol, el último paso en la

vía glicolítica.

ADH3: Alcohol deshidrogenasa isoenzima III; involucrado en el transporte de NADH

mitocondrial hacia el citosol bajo condiciones anaeróbicas y de producción de etanol.

ADH4: Alcohol deshidrogenasa isoenzima IV, enzima dimérica que ha demostrado ser

zinc-dependiente a pesar de la similaridad de secuencia a alcohol deshidrogenasas activadas

por hierro; transcripción es inducida en respuesta a deficiencia de zinc.

ADH5: Alcohol deshidrogenasa isoenzima V; involucrada en producción de etanol.

ALD6: Aldehído deshidrogenasa, activada por Mg2+ y utiliza NADP+ como coenzima

preferida; requerida para la conversión de acetaldehído a acetato; expresada

constitutivamente; se localiza en la membrana exterior de la mitocondria bajo estrés

oxidativo.

CDC19: Piruvato quinasa, funciona como un homotetramero en glicólisis para convertir

fosfoenolpiruvato a piruvato, la entrada para respiración aeróbica (cilco TCA) o anaeróbica

(fermentación de glucosa).

CIT1: Citrato sintetasa, cataliza la condensación de acetil coenzimo A y oxalacetato para

formar citrato; la enzima limitante del TCA; proteína codificada de la mitocondria.

También conocida como: CS1.

18

CIT2: Citrato sintetasa, cataliza la condensación de acetil coenzimo A y oxalacetato para

formar citrato; isoenzima peroxisomal involucrada en el ciclo del glioxilato; expresión está

controlada por los factores Rtg1p y Rtg2p.

ENO1: Enolasa I, una fosfopiruvato hidratasa que cataliza la conversión de 2-fosfoglicerato

a fosfoenolpiruvato durante glicólisis y la reacción reversa durante gluconeogénesis; la

expresión es reprimida en respuesta a la glucosa.

ENO2: Enolasa II, una fosfopiruvato hidratasa que cataliza la conversión de 2-

fosfoglicerato a fosfoenolpiruvato durante glicólisis y la reacción reversa durante

gluconeogénesis; expresión es reprimida en respuesta a la glucosa.

FBA1: Fructosa 1,6-bisfosfato aldolasa, requerida para glicólisis y gluconeogénesis;

cataliza conversión de fructosa 1,6 bisfosfato a gliceraldehído-3-P y dihidroxiacetona-P; se

ubica hacia la superficie externa de la mitocondria ante el estrés oxidativo.

FUM1: Fumarasa, convierte ácido fumárico a L-ácido málico en el ciclo del TCA;

localización citosólica y mitocondrial determinada por la secuencia blanco N-terminal

mitocondrial y proteína conformación.

GPM1: Fosfoglicerato mutasa tetramérica, media la conversión de 3-fosfoglicerato a 2-

fosfoglicerato durante la glicólisis y la reacción reversa durante gluconeogénesis.

HXK1: Isoenzima Hexokinasa 1, una proteína citosólica que cataliza fosforilación de

glucosa durante el metabolismo de glucosa; expresión es más altas durante el crecimiento

en fuentes de carbono diferentes a glucosa; represión inducida por glucosa involucra la

hexokinasa Hxk2p.

19

HXK2: Isoenzima Hexokinasa 2 que cataliza fosforilación de glucosa en el citosol;

hexokinasa predominante durante el crecimiento en glucosa; funciona en el núcleo para

reprimir expresión de HXK1 y GLK1 y para inducir expresión de su propio gen.

IDH2: Subunidad de la isocitrato deshidrogenasa mitocondrial dependiente de NAD(+),

que cataliza la oxidación de isocitrato a alfa-ketoglutarato en el ciclo del TCA.

KGD1: Componente del complejo mitocondrial alfa-ketoglutarato deshidrogenasa, que

cataliza un paso clave en el ciclo del TCA, la descarboxilación oxidativa de alfa-

ketoglutarato a succinil-CoA.

KGD2: Dihidrolipoil transsuccinilasa, componente del complejo mitocondrial alfa-

ketoglutarato deshidrogenasa, que cataliza un paso clave en el ciclo del TCA, la

descarboxilación oxidativa de alfa-ketoglutarato a succinil-CoA.

LSC1: Subunidad alfa de succinil-CoA ligasa, que es una enzima mitocondrial del ciclo del

TCA que cataliza la conversión dependiente de nucleótidos de succinil-CoA a succinato.

LSC2: Subunidad beta de succinil-CoA ligasa, que es una enzima mitocondrial del ciclo del

TCA que cataliza la conversión dependiente de nucleótidos de succinil-CoA a succinato.

MDH2: Malato deshidrogenasa citoplasmática, una de tres isoenzimas que cataliza la

interconversión de malato y oxaloacetato; involucrada en gluconeogénesis durante

crecimiento en etanol o acetato como fuente de carbono; interactúa con Pck1p y Fbp1p.

PDC1: Mayor de tres isoenzimas piruvato descarboxilasas, enzima clave en fermentación

alcohólica, descarboxila piruvato a acetaldehído; sujeto a glucosa, etanol, y auto regulación;

involucrada en catabolismo amino acido.

20

PDC6: Isoforma menor de piruvato descarboxilasa, enzima clave en fermentación

alcohólica, descarboxila piruvato a acetaldehído; sujeto a glucosa, etanol, y auto regulación;

involucrada en catabolismo amino acido.

PFK1: Subunidad alpha de fosfofructokinasa heterooctamérica involucrada en glicólisis,

indispensable para crecimiento anaeróbico, activada por fructosa-2,6-bisfosfate y AMP,

mutación inhibe inducción por glucosa de genes relacionados con el ciclo celular.

PGI1: Enzima glicolítica fosfoglucosa isomerasa, cataliza la interconversión de glucosa-6-

fosfate y fructosa-6-fosfato; requerida para la progresión del ciclo celular y completar los

eventos gluconeogénicos de la esporulación.

PGK1: 3-fosfoglicerato kinasa, cataliza transferencia de grupos fosfato de alta energía

desde el acil fosfato de 1,3-bisfosfoglicerato a ADP para producir ATP; enzima clave en

glicólisis y gluconeogénesis.

PYC1: Isoforma de piruvato carboxilasa, enzima citoplasmática que convierte piruvato a

oxalacetato; altamente similar a la isoforma Pyc2p pero diferencialmente regulada;

mutaciones en el homólogo humano están asociadas con acidosis láctica.

SDH1: Flavoproteína, subunidad de succinato deshidrogenasa (Sdh1p, Sdh2p, Sdh3p,

Sdh4p), que acopla la oxidación de succinato a la transferencia de electrones a ubiquinona.

SDH3: Citocromo b, subunidad de succinato deshidrogenasa (Sdh1p, Sdh2p, Sdh3p,

Sdh4p), que acopla la oxidación de succinato a la transferencia de electrones a ubiquinona.

SDH4: Subunidad de anclaje de membrana de succinato deshidrogenasa (Sdh1p, Sdh2p,

Sdh3p, Sdh4p), que acopla la oxidación de succinato a la transferencia de electrones a

ubiquinona.

21

TDH1: Gliceraldehído-3-fosfato dehidrogenasa, isoenzima 1, involucrada en glicólisis y

gluconeogénesis; tetrámero que cataliza la reacción de gliceraldehído-3-fosfato a 1,3 bis-

fosfoglicerato; detectado en el citoplasma y pared celular

TDH2: Gliceraldehído-3-fosfato dehidrogenasa, isoenzima 1, involucrada en glicólisis y

gluconeogénesis; tetrámero que cataliza la reacción de gliceraldehído-3-fosfato a 1,3 bis-

fosfoglicerato; detectado en el citoplasma y pared celular

TDH3: Gliceraldehído-3-fosfato dehidrogenasa, isoenzima 1, involucrada en glicólisis y

gluconeogénesis; tetrámero que cataliza la reacción de gliceraldehído-3-fosfato a 1,3 bis-

fosfoglicerato; detectado en el citoplasma y pared celular.

TPI1: Triosa fosfato isomerasa, enzima glicolítica abundante; vida media del mRNA es

regulada por disponibilidad de hierro; transcripción es controlada por activadores Reb1p,

Gcr1p, y Rap1p a través de sitios de unión en la región 5' no codificante.

UGP1: UDP-glucosa pirofosforilasa (UGPasa), cataliza la formación reversible de UDP-

Glc a partir de glucosa 1-fosfato y UTP, involucrado en una amplia variedad de vías

metabólicas, expresión modulada por Pho85p a través de Pho4p.

3.1.2 Genes Factores de Transcripción

ADR1: Factor de transcripción con dedos de zinc responsivo a fuente de carbono, requerida

para transcripción del gen reprimido por glucosa ADH2, de los genes para proteínas del

peroxisoma y de genes requeridos para la utilización de etanol, glicerol y ácidos grasos.

ASH1: Inhibidor tipo dedo de zinc de transcripción de HO; mRNA se localiza y se traduce

en la punta distal de las células en anafase, resultando en la acumulación de Ash1p en el

núcleo de la célula hija e inhibición de expresión de HO; sustrato potencial de Cdc28p.

22

DOT6: Proteína de función desconocida, involucrado en silenciamiento de genes

teloméricos y filamentación.

FHK1: Factor de transcripción de la familia Forkhead con un rol menor en la expresión de

los genes de fase G2/M; regula negativamente la elongación transcripcional; rol positivo en

silenciar cromatina HML y HMR; regula la preferencia del donador durante el switching.

FHK2: Factor de transcripción de la familia Forkhead con un rol menor en la expresión de

los genes de fase G2/M; regula negativamente la elongación transcripcional; rol positivo en

silenciar cromatina HML y HMR; regula la preferencia del donador durante el switching.

Substrato de la kinasa Cdc28p/Clb5p.

FLO8: Factor de transcripción requerida para floculación, crecimiento diploide

filamentoso, y crecimiento haploide invasivo; cepa S288C referencial del genoma y la

mayoría de las cepas de laboratorio tienen una mutación en este gen.

GCR1: Activador transcripcional de genes involucrados en la glicólisis; interactúa y

funciona con el factor de transcripción Gcr2p.

GCR2: Activador transcripcional de genes involucrados en la glicólisis; interactúa y

funciona con la proteína de unión al DNA Gcr1p.

HMS1: Proteína basic-Helix-Loop-Helix (bHLH) con similitud a la familia de factores de

transcripción myc; sobreexpresión confiere crecimiento hiperfilamentoso y suprime el

defecto de la filamentación pseudohifal de un diploide homocigoto mutante carente de

MEP1 y MEP2

MGA1: Proteína similar a factor de transcripción de shock calórico; supresor multicopia de

defectos de crecimiento pseudohifal de mutantes de amonio permeasa.

23

MIG2: Proteína que contiene “dedos de zinc”, involucrado en la represión, junto con

Mig1p, de expresión de SUC2 (invertasa) por altos niveles de glucosa; se une a sitios de

unión de Mig1p en SUC2 promotor.

MIG1: Factor de transcripción involucrado en la repression por glucosa; la secuencia

específica de la proteína de unión al DNA contiene dos motivos de dedos de zinc

Cys2His2; regulado por quinasa SNF1 y fosfatasa GLC7.

MSN1: Activador transcripcional involucrado en la regulación de la expression de invertasa

y glucoamilasa, crecimiento invasivo y diferenciación pseudohifal, incorporación de hierro,

acumulación de cromo y respuesta a estrés osmótico; se localiza en el núcleo.

MSN2: Activador transcripcional relacionado con Msn4p; se activa en condiciones de

estrés, que resulta en translocación desde el citoplasma al núcleo; se une al DNA en

elementos de respuesta de genes responsivos7, induciendo la expresión génica.

MSN4: Activador transcripcional relacionado con Msn2p; se activa en condiciones de

estrés, que resulta en translocación desde el citoplasma al núcleo; se une al DNA en

elementos de respuesta de genes responsivos, induciendo la expresión génica.

MSS11: Factor de transcripción involucrado en la regulación de crecimiento invasivo y

degradación de almidón; controla la activación de MUC1 y STA2 en respuesta a señales

nutricionales.

NRG1: Represor transcripcional que recluta el complejo Cyc8p-Tup1p a promotores; media

la represión por glucosa y regula negativamente una variedad de procesos incluyendo

crecimiento filamentoso y respuesta a pH alcalino.

NRG2: Represor transcripcional que media la represión por glucosa y regula negativamente

crecimiento filamentoso; es similar a Nrg1p.

7 Responsive en inglés.

24

PDC2: Factor de transcripción requerido para la síntesis de la enzima glicolítica piruvato

descarboxilasa, requerida para alto nivel de expresión de genes THI y PDC.

PHD1: Activador transcripcional que estimula crecimiento pseudohifal; regula expresión de

FLO11, una adhesina requerida para formación pseudohifal; similar a StuA, regulador de

desarrollo de A. nidulans; sustrato potencial de Cdc28p.

RGT1: Factor de transcripción de respuesta a glucosa que regula expresión de varios genes

transportadores de glucosa (HXT) en respuesta a glucosa; se une a promotores y actúa

como un a activador y represor transcripcional.

SIP4: Activador transcripcional C6 zinc cluster que se une a el elemento responsivo a la

fuente de carbono (CSRE) de genes gluconeogénicos; involucrado en la regulación positiva

de gluconeogénesis; regulado por Snf1p; se localiza en el núcleo.

SOK2: Proteína nuclear que juega un rol regulatorio en la vía de transducción dependiente

de la proteína quinasa (PKA) dependiente de AMP cíclico (cAMP); regula negativamente

diferenciación pseudohifal; homólogo a varios factores de transcripción.

STE12: Factor de transcripción que es activado por una señalización en cascada MAP

quinasa, activa genes involucrados en acoplamiento8 o en las vías de creciemiento

pseudohifal/invasivo; coopera con el factor de transcripción Tec1p para regular genes

específicos para crecimiento invasivo.

TEC1: Factor de transcripción requerido para expresión completa de Ty1, activación génica

mediada por Ty1, y crecimiento haploide invasivo y diploide pseudohifal; miembro de la

familia de dominios de unión TEA/ATTS.

8 Mating en la descripción original

25

TYE7: Proteína rica en serina que contiene un motivo de unión a DNA basic-helix-loop-

helix (bHLH); une E-boxes de genes glicolíticos y contribuye a su activación; puede

funcionar como un activador transcripcional en expresión génica mediada por Ty1.

3.1.3 Análisis de los genes seleccionados

Una clasificación de las ontologías de los procesos biológicos a nivel 4, realizado en

YEASTRACT, se entrega en la tabla 1:

Tabla 1.- Clasificación de genes de vías metabólicas según ontologías de procesos biológicos a nivel 4

Término GO Porcentaje ORF/Genes Proceso metabólico de carbohidratos

80.6 % ACO1, CDC19, CIT1, CIT2, ENO1, ENO2, FBA1, FUM1, GPM1, HXK1, HXK2, IDH2, KGD1, KGD2, LSC1, LSC2, MDH2, PFK1, PGI1, PGK1, PYC1, SDH1, SDH3, SDH4, TDH1, TDH2, TDH3, TPI1, UGP1

Proceso catabólico celular 69.4 % ACO1, CDC19, CIT1, ENO1, ENO2, FBA1, FUM1, GPM1, HXK1, HXK2, IDH2, KGD1, KGD2, LSC1, LSC2, PFK1, PGI1, PGK1, SDH1, SDH3, SDH4, TDH1, TDH2, TDH3, TPI1

Proceso metabólico de ácidos orgánicos

58.3 % ACO1, ALD6, CDC19, CIT1, CIT2, ENO1, ENO2, FBA1, FUM1, GPM1, IDH2, KGD1, KGD2, MDH2, PDC1, PGI1, PGK1, PYC1, TDH1, TDH2, TDH3

Proceso metabólico de alcohol

58.3 % ADH1, ADH5, CDC19, ENO1, ENO2, FBA1, GPM1, HXK1, HXK2, MDH2, PDC1, PDC6, PFK1, PGI1, PGK1, PYC1, TDH1, TDH2, TDH3, TPI1, UGP1

Proceso metabólico de cofactores

47.2 % ACO1, ADH1, ADH3, ADH4, ADH5, CIT1, FUM1, IDH2, KGD1, KGD2, LSC1, LSC2, PGI1, PYC1, SDH1, SDH3, SDH4

Derivación energética por oxidación de compuestos orgánicos

44.4 % ACO1, ADH1, ADH3, ADH4, ADH5, CIT1, FUM1, IDH2, KGD1, KGD2, LSC1, LSC2, PDC1, SDH1, SDH3, SDH4

Procesos celulares biosintéticos

38.9 % ADH1, ADH5, ALD6, ENO1, ENO2, FBA1, GPM1, MDH2, PGI1, PGK1, PYC1, TDH1, TDH2, TDH3

Proceso de macro moléculas 38.9 % CDC19, ENO1, ENO2, FBA1, GPM1, HXK1, HXK2, PFK1, PGI1, PGK1, TDH1, TDH2, TDH3, TPI1

Proceso de biosíntesis de macromoléculas

33.3 % ENO1, ENO2, FBA1, GPM1, MDH2, PGI1, PGK1, PYC1, TDH1, TDH2, TDH3, UGP1

Proceso metabólico de nucleobases, nucleósidos, nucleótidos y ácidos nucleicos

22.2 % ADH1, ADH3, ADH4, ADH5, HXK2, PGI1, PYC1, UGP1

Proceso metabólico de vitaminas

16.7 % ADH1, ADH3, ADH4, ADH5, PGI1, PYC1

Procesos metabólicos de aminoácidos y derivativos

11.1 % ACO1, CIT1, CIT2, IDH2

Proceso metabólico de aminas

11.1 % ACO1, CIT1, CIT2, IDH2

26

Tabla 1.- Clasificación de genes de vías metabólicas según ontologías de procesos biológicos a nivel 4, continuación.

Proceso de biosíntesis de compuestos nitrogenados

11.1 % ACO1, CIT1, CIT2, IDH2

Fosforilación oxidativa 8.3 % SDH1, SDH3, SDH4 Transporte de electrones 8.3 % SDH1, SDH3, SDH4 Organización de organelos y biogénesis 8.3 % ACO1, ENO1, ENO2 Proceso metabólico de biopolímeros 5.6 % HXK2, UGP1 Proceso metabólico de cetonas

5.6 % KGD1, KGD2

Transporte de carbohidratos 5.6 % HXK1, HXK2 Organización y biogénesis de membranas 5.6 % ENO1, ENO2 Regulación de componentes celulares y biogénesis

5.6 % ENO1, ENO2

Biogénesis y organización de estructura externa encapsulada

2.8 % UGP1

Proceso metabólico de proteínas 2.8 % UGP1 Proceso metabólico de macromoléculas celulares

2.8 % UGP1

Regulación de procesos metabólicos celulares

2.8 % HXK2

Envejecimiento celular 2.8 % HXK2 Regulación del tamaño celular 2.8 % HXK2 Respuesta a nutriente 2.8 % HXK2 Respuesta a drogas 2.8 % ACO1 Proceso metabólico de aldehído 2.8 % CIT2

Este resultado pone en evidencia que los genes de vías metabólicas seleccionados

corresponden efectivamente a genes relevantes para el problema a abordar. Un alto

porcentaje está ligado al metabolismo de carbohidratos, metabolismo del alcohol y procesos

catabólicos generales.

La tabla 2 repite el mismo procedimiento para los genes seleccionados como

factores de transcripción, pero esta vez clasificando por función molecular a nivel 2 en

YEASTRACT:

Tabla 2.- Clasificación de los Factores de Transcripción por ontología de función moleculares a nivel 2

Término GO Porcentaje ORF/Genes Actividad reguladora

de Transcripción 96.2 % ADR1, ASH1, FKH1, FKH2, FLO8, GCR1, GCR2, HMS1,

MGA1, MIG1, MIG2, MSN1, MSN2, MSN4, MSS11, NRG1, NRG2, PDC2, PHD1, RGT1, SIP4, SOK2, STE12, TEC1, TYE7

Unión 61.5 % ADR1, FKH1, FKH2, GCR1, HMS1, MGA1, MIG1, MIG2, MSN2, MSN4, NRG1, PHD1, RGT1, SOK2, STE12, TYE7

Actividad Catalítica 3.8 % ASH1

27

El único factor que no aparece clasificado con actividad reguladora es DOT6, cuya

función es desconocida. No registran función de unión ASH1, DOT6, FLO8, GCR2,

MSN1, MSS11, NRG2, PDC2, SIP4 y TEC1.

Según la descripción entregada en 3.1.2, Gcr2p actúa conjuntamente con Gcr1p

(que si presenta función de unión). Esto ha sido descrito por varios trabajos como los de

Sasaki et al., 2005 y Uemura & Fraenkel, 1999. Según este último, mutantes gcr2 son

capaces de crecer bien en glucosa, aunque es notorio el efecto de subexpresión de genes de

glicolíticos; en cambio, mutantes gcr1 no crecen en glucosa. Por lo tanto, para efectos del

presente modelo, se considera que Gcr1p y Gcr2p funcionan como un complejo en donde

Gcr1p actúa uniéndose efectivamente al DNA y que Gcr2p es el factor necesario para

activar la transcripción. En cuanto a FLO8 y TEC6, son dos factores que están más

relacionados con el crecimiento pseudohifal, por lo que no se estudia su comportamiento

más profundamente.

Por lo tanto, los factores de transcripción obtenidos pueden clasificarse en tres

grupos principales: Los que son respuesta al estrés, como MSN1 y MSN2, los de

crecimiento pseudohifal, como FLO8, SOK2 y STE12 y los relacionados más directamente

con la respuesta a glucosa, como GCR1, GCR2, MIG1 y RGT1.

3.2 Visualización de la red

La utilización de Graphviz entrega un diagrama de la red de regulación obtenida que

conecta los factores de transcripción entre sí y los genes de vías metabólicas. El resultado

se puede ver en el archivo “Seleccion_Genes\Red\redtotal.pdf”, en el CD anexo.

El formato gráfico para ver la red es bastante útil para hacer algunas observaciones.

En primer lugar se aprecia que KGD1, ADH3 y LSC1 no presentan reguladores, por lo que

se eliminan de la red; así también, los reguladores ASH1 y MSS11, no regulan ningún gen

de vías metabólicas seleccionado, por lo que también se eliminan de la red.

28

Además, es posible ver que existen nodos o grupos de nodos que no tienen arcos

entrantes, como FLO8, GCR2, RGT1 y FKH1/FKH2 (considerado como grupo). Esto está

relacionado con el hecho de que son elementos que están al final de cascadas de

señalización no mediadas por proteínas o bien no se han deducido aún otras interacciones:

Por ejemplo, Flo8p está al final de una cascada con respuesta a cAMP, requerida para el

crecimiento en hifas (Borneman et al. 2006); Rgt1p está bajo el control de señalización de

Snf3/Rgt2 (Palomino A., Herrero P. & Moreno F., 2005, Santangelo G, 2006); Gcr2p está

relacionado con Gcr1p y Rap1p (Zeng X, Deminoff SJ & Santangelo G, 1997) aunque el

mecanismo no es claro; FKH1 y FKH2 han sido identificados como factores sólo

recientemente (Hollenhorst et al., 2001). En cambio, otros genes que regulan genes

glicolíticos, si bien presentan interacción directa, también sirven como intermediarios, por

ejemplo MIG1, MIG2 y NRG1.

También es posible apreciar la importancia relativa de algunos factores que actúan

como “concentradores de señales”, es decir, muchas señales de entrada y pocas de salidas.

Sok2 y Tec1 son ejemplos de este tipo de comportamiento (Borneman et al., 2006).

Si bien la utilización de gráficos ayuda a dar una idea general de los factores que

participan del proceso regulatorio en el salto diaúxico, la cantidad de nodos hace que el

esquema sea poco claro. Para mejorar el análisis se utiliza, como se mencionó en la

metodología, el método de los k-neighbors para separar los nodos objetivos (en este caso,

genes de las vías metabólicas) en el programa Pajek. El resultado para los 33 genes de vías

metabólicas se encuentra completo en el anexo I.

3.3 Análisis de la red utilizando Pajek

La utilización de un software para el análisis de redes abre posibilidades de un

estudio topológico de la red obtenida. Si bien esto escapa a los alcances de esta memoria, se

entregan algunos datos relevantes (Xia et. al, 2004):

29

Distribución de Distancias: La distancia promedio entre pares alcanzables es

de 2.57, el número de pares inalcanzables es de 2350 (de un total de 3080

pares posibles, N·(N-1) ) y la distancia más larga es entre RGT1 y GPM1,

con 7 nodos intermedios.

Grados de entrada y salida: La tabla 3 detalla los grados de arcos entrantes y

salientes para cada nodo de la red. Destaca la alta regulación de HXK1 y los

nodos que tienen características de concentradores de señales (que es

indicado por la relación de número de arcos entrantes y salientes de un nodo

particular) de TYE7, SOK2, MGA1, PDH1.

Tabla 3.- Grados de entrada y salida para la red completa obtenida.

Nodo Grado Entrada

Grado Salida

Nodo Grado Entrada

Grado Salida

Nodo Grado Entrada

Grado Salida

ACO1 3 0 GPM1 3 0 PGI1 3 0 ADH1 3 0 HMS1 7 4 PGK1 3 0 ADH4 4 0 HXK1 11 0 PHD1 6 13 ADH5 2 0 HXK2 3 0 PYC1 5 0 ADR1 1 5 IDH2 4 0 RGT1 0 4 ALD6 3 0 KGD2 1 0 SDH1 1 0 CDC19 6 0 LSC2 3 0 SDH3 2 0 CIT1 3 0 MDH2 5 0 SDH4 2 0 CIT2 5 0 MGA1 8 9 SIP4 4 2 DOT6 1 2 MIG1 2 8 SOK2 4 23 ENO1 4 0 MIG2 2 2 STE12 7 11 ENO2 5 0 MSN2 3 14 TDH1 4 0 FBA1 4 0 MSN4 5 7 TDH2 5 0 FKH1 1 3 NRG1 3 5 TDH3 7 0 FKH2 2 4 NRG2 4 2 TEC1 5 8 FLO8 0 10 PDC1 6 0 TPI1 4 0 FUM1 3 0 PDC2 0 1 TYE7 8 10 GCR1 2 27 PDC6 2 0 UGP1 4 0 GCR2 0 26 PFK1 2 0

Este análisis permite identificar a los factores claves en la regulación, con más de 10

arcos salientes: GCR2, GCR1, MSN2, SOK2, PHD1, FLO8, STE12 y TYE7; además

indica qué genes de vías metabólicas son modelables según el esquema propuesto, pues el

número de interacciones debe estar entre 2 y 3, lo que deja como candidatos a ACO1,

ADH1, ADH5, ALD6, CIT1, FUM1, GPM1, HXK2, LSC2, PDC6, PFK1, PGI1, PGK1,

SDH3 y SDH4.

30

Por lo anterior y su ubicación al inicio de la vía de la glicólisis, se decide seguir

trabajando con más detalle la regulación de HXK2

3.3.1 Resultado de la aplicación del método de los k-neighbors a HXK2

La figura 5 muestra el resultado de eliminar los factores que no intervienen en la

regulación de HXK2; los resultados para todos los genes de vías metabólicas se encuentran

en el anexo II

Figura 4.- Regulación de HXK2. Al eliminar el resto de los FT y genes de vías metabólicas se puede entender mejor la regulación de un gen en particular. En el caso de la figura, sólo tres factores intervienen directamente sobre HXK2; además, en la región central de la figura da cuenta de la red relacionada con el crecimiento pseudohifal.

31

3.4 Revisión de la literatura asociada a la regulación de HXK2

Si bien la utilización de la estrategia expuesta en la metodología da como resultado

una red de regulación para cada uno de los genes en estudio, no proporciona información

sobre las características de las asociaciones. Una comprensión de estas debe pasar

necesariamente por una revisión de la literatura asociada.

Una buena parte de las regulaciones expuestas tienen como base trabajos que

utilizan técnicas con gran cantidad de datos de salida como son microarrays y técnicas de

inmuno precipitación de cromatina (ChIP chips, por sus siglas en inglés). Estas técnicas son

útiles para blancos de factores de transcripción bajo distintas condiciones (Lee et al., 2002,

Horak et al 2002., Borneman et al., 2006, Workman et al., 2006, Harbison et al., 2004),

pero no definen qué tipo de relación existe.

Por otro lado, GCR2, RGT1 y SOK2 han sido bien caracterizados individualmente;

estos factores intervienen directamente en la regulación de HXK2, como se puede ver en la

figura 5.

Gcr2p, como ya se ha mencionado, actúa en conjunto a Gcr1p (Sasaki & Uemura,

2005). Ha sido identificado como un activador en presencia de glucosa (Uemura &

Fraenkel, 1999; Chambers et al., 1997). Al parecer, GCR1 es necesario para el

crecimiento en glucosa; mutantes gcr2 muestran un decaimiento en la expresión de genes

glicolíticos, pero pueden crecer bien en glucosa (Uemura & Fraenkel, 1999). Microarrays

en cepas gcr1 muestran una disminución de entre 13.8 y 7.9 veces para genes glicolíticos

(López & Baker, 2000).

Rgt1p es un represor para HXK2 que se activa en ausencia de glucosa (Palomino,

Herrero y Moreno, 2005). Su actividad es regulada por Tpk3p y Snf1p y depende de la

concentración de glucosa. Para la represión de HXK2 necesita que el factor Med8p esté

unido a HXK2, generando un loop en el DNA que impide la expresión (Palomino, Herrero

y Moreno, 2006).

32

Sok2p fue identificado como regulador de HXK2 por un estudio de ChIP (Chua et

al., 2006). Aunque no hay información sobre su actividad específica en HXK2, ha sido

catalogado como represor de la familia bHLH. Se ha propuesto que contrarresta la acción

de Msn2p/Msn4p en la activación de genes de la fase estacionaria en presencia de glucosa y

parece jugar un rol importante en la adaptación para la sobrevivencia a largo plazo de

colonias de Saccharomyces cerevisiae (Váchová et al., 2004).

3.5 Modelación de la expresión de HXK2

Lo que se busca es encontrar una expresión que module la tasa de transcripción de

mRNA a partir de la cantidad de promotores disponibles y la fracción de promotores

ocupados, es decir, r = k*ψ3*Promotores de Hxk2. ψ3 es la fracción de promotores

ocupados, que es lo que se calcula utilizando el método de Kremling y Gilles.

Con los antecedentes recopilados en la revisión bibliográfica, se decide despreciar la

influencia de Sok2p, tanto por no conocer su actividad como por presentar un nivel de

cambio menor a 1.5 veces (1.26 Glucosa/Etanol). Además, Sok2p aparece más ligado a

procesos generales de crecimiento y no a una respuesta específica a glucosa. Por lo tanto, se

considerará solamente a Gcr2p y Rtg1p.

El esquema presentado en la figura 3 es el que se utilizará para modelar la expresión

de HXK2. En el rol de activador se utilizará GCR2 y como represor a RGT1. Una búsqueda

en YEASTRACT indica que hay 132 genes que son regulados por GCR2 (235 por GCR1)

y 64 controlados por RTG1. Por lo tanto, se asume que GCR2 está en un nivel de control

más general que RGT1, lo que es concordante con la información de la tabla 3.

3.5.1 Ecuaciones empleadas

En el siguiente apartado se describen las ecuaciones, parámetros y consideraciones

para cada uno de los niveles (RNA pol. II, GCR2 y RGT1).

33

Uno de los problemas del método de Kremling y Gilles es que se necesita conocer

las concentraciones iniciales de las proteínas involucradas, así como sus constantes de

disociación. Estas últimas fueron estimadas a partir de los datos de la literatura, pero no hay

información disponible sobre las concentraciones totales de Rgt1p y Gcr2p.

Para estimar las concentraciones totales de Gcr2p y Rgt1p, se utilizan los datos de

microarray de Humberto Diaz del siguiente modo:

Se calcula la intensidad total del chip de microarray sumando las

intensidades de cada spot. A esta intensidad se le denotará con la unidad

[Val MA]

Se supone que toda la intensidad corresponde a 15000 moléculas de mRNa

(Kal et al.,1999).

Suponiendo que un ribosoma tiene una velocidad de desplazamiento de 6

nucleótidos/segundo, que la vida media de un mRNA es de 1800 segundos y

que la distancia entre dos ribosomas es de 80 nucleótidos, se tiene que por

cada mRNA se sintetizan 135 proteínas. (Alberts, 2002).

Con lo anterior, se establece una proporción entre la intensidad leída para

cada gen y la cantidad de proteína (36.24 [Val MA]/[Nº Proteína]).

Una célula de levadura haploide tiene un peso seco promedio de 1.5·10-11 [g]

(Sherman, 1998) y el número de Avogadro se considera como 6.023·1017

[moléculas/μmol].

Con esto, se elabora la tabla 4 para estimar las concentraciones de Gcr2p, Gcr1p,

Rgt1p y Hxk2p.

34

Se asume demás que la unión de los factores a los sitios de unión es rápida en

comparación a la transcripción, por lo que las especies están en condiciones de equilibrio.

También se debe notar que la concentración de Gcr1p es mayor que la de Gcr2p;

por lo tanto, se puede considerar Gcr2p está siempre activa.

Otro supuesto a utilizar es que Gcr2p y Rgt1p son funciones de glucosa. A partir de

los datos de Humberto Díaz, ya que sólo se dispone de 2 puntos, se supone que la

concentración de estas proteínas es una función lineal de glucosa.

Tabla 4.- Cálculo de concentraciones iniciales de proteínas en base a datos de microarray y literatura

Valor Total Microarray 55880.98 [Val MA] Moléculas mRNA por célula 15000.00 Conversión [Nº mRNA/Val MA] 0.27 Conversión [Nº Proteína/mRNA] 135.00 Conversión [Nº Proteína/Val MA] 36.24 Glucosa Etanol [Val MA] GCR2 6.02 3.79 Moléculas Gcr2p 218.15 137.34 [Val MA] SOK2 5.75 4.54 Moléculas Sok2p 208.37 164.52 [Val MA] RTG1 4.65 7.15 Moléculas Rtg1p 168.51 259.10 [Val MA] HXK2 9.65 5.45 Moléculas Hxk2p 349.62 197.50 [Val MA] GCR1 7.36 6.49 Moléculas Gcr1p 266.71 235.18 Peso 1.50·10-11 [g DW] NºAvog 6.02·1017 [molec/μmol]

DW=peso seco

Condición Glucosa Etanol Unidades

Concentración Gcr2p 2.41·10-05 1.52·10-05 [μmol/g DW]

Concentración Sok2p 2.31·10-05 1.82·10-05 [μmol/g DW]

Concentración Rtg1p 1.87·10-05 2.87·10-05 [μmol/g DW]

Concentración Hxt2p 3.87·10-05 2.19·10-05 [μmol/g DW]

35

3.5.1.1 Nivel 1: RNA polimerasa II

Para este nivel se usan 3 ecuaciones de equilibrio y 4 de conservación, originando

un sistema de 7 ecuaciones y 7 incógnitas. Se utiliza la misma nomenclatura que en las

figuras 2 y 3.

Las ecuaciones de equilibrio corresponden a:

KbP* + TFsII P

P + D1

P + D2

Kp1

KP2

Y1

Y2

Las ecuaciones de conservación corresponden a:

D10 = D1 + Y1

D20 = D2 + Y2

P0 = P* + P + n1·Y1 + n2·Y2

TFsII0 = TFsII + P + Y1 + Y2

D1 corresponde a la concentración de promotores del gen de interés que está

disponible para unirse, D2 a la concentración (disponible para unirse) de genes que no

corresponden al gen de interés que unen RNA pol II, Y1 corresponde a la concentración de

promotores del gen de interés que se encuentran unidos a RNA polimerasa II, Y2

corresponde al resto de los promotores de genes de levadura que se encuentran unidos a

RNA polimerasa II. P* corresponde a la RNA polimerasa II que no se ha unido a los TFsII

(factores necesarios para iniciar la transcripción de cualquier gen en levadura9), P a la

polimerasa activa (unida a TFsII); n1 y n2 corresponden al número medio de moléculas de

9 Existen 6 factores de transcripción para iniciar la transcripción de RNA polimerasa II: TFIIB, TFIID, TFIIE, TFIIF, TFIIH y Mediador (Med8p)

36

polimerasa activa por promotor. Los subíndices 0 indican la concentración total de las

especies.

La estimación de n1 y n2 de Kremling y Gilles (2001) es de 3 y 10 respectivamente

para E. coli, suponiendo que existen promotores fuertes y débiles. Para este trabajo, se

considera que todos los promotores son iguales con n1 = n2 = 10. (Struhl K, 2007)

Para modelar P0 y TFsII0 se utiliza el mismo esquema que en Kremling y Gilles,

asimilando TFsII al factor σ de E. coli. Los valores correspondientes son de 30000

moléculas para P0 y 6000 moléculas para TFsII0, que corresponde al factor limitante en

levadura, TFIIH. (Borggrefe et al., 2001)

Las constantes de disociación, Kp1 y Kp2 también se toman de Kremling y Gilles,

considerando Kp1 = Kp2 = 2.44·10-5 [μmol/g DW]. Para Kb se utiliza un valor de 0.32·10-6

[μmol/g DW], que es la constante de disociación entre los factores TFIIE y TFIIH

(Bushnell et al., 1996).

D10 se estima en una unidad por célula, equivalentemente, 1.11·10-7 [μmol/g DW];

D20 considera el promotor resto de los genes, estimados en 6000, con una concentración de

6.64·10-4 [μmol/g DW].

La salida de este nivel es la fracción de promotores D1 ocupados, ψ1=Y1/D10

37

3.5.1.2 Nivel 2: GCR2

Las ecuaciones de equilibrio son:

K(ψ1)D1 D1*

G + D1

G + D1*

Kg

α•Kg

GD1

GD1*

Kg

G + D3 GD3

Las ecuaciones de conservación:

D10 = D1 + D1* + GD1 + GD1*

G0 = G + GD1 + GD1* + GD3

D30 = D3 + GD3

Donde G representa la concentración de Gcr2p y D3 los promotores que a los que se

une Gcr2p. D1* representa “sitios virtuales” que representan los sitios D1 que están unidos a

polimerasa que se calculan en el primer nivel. Además, K(ψ1) = (1- ψ1)/ ψ1. (Kremling y

Gilles, 2000).

Kg tiene un valor de 2.9·10-4 μM (Huie & Baker, 1996). α representa el nivel de

activación que tiene Gcr2p sobre la polimerasa; según la revisión bibliográfica, una

mutación en Gcr1p provoca una disminución entre 13.8 y 7.9 fold. Considerando que

Gcr1p y Gcr2p actúan en conjunto (a pesar de no haber sido demostrado para HXK2), se

estima α = 0.1 10.

10 Se recuerda que las constantes son de disociación, por lo tanto, α < 1 indica mayor unión y α > 1, menor unión.

38

Para tomar en cuenta el efecto de glucosa, se considera que G0 es una función lineal

de esta. De esta forma, utilizando los valores de la tabla 3,

G0 = 8.94·10-7 ([glucosa]) + 1.52·10-5;

Donde la concentración de glucosa está en [g/L].

Las señales de salida son ψ2=(GD1* + D1*)/D10 y ψP=GD1/D10

3.5.1.3 Nivel 3: RGT1

Las reacciones de equilibro para este nivel son:

K+(ψ2)

D1 D1+

Kr

R + D1

R + D1++

Kr

RD1

RD1++

KrR + D4 RD4

K++(ψp2)D1 D1

++

R representa a Rtg1p; el superíndice + indica cuáles son los sitios que están

activados en el nivel superior (RNA pol II y Gcr2p + RNA pol II) y el superíndice ++ los

que están solamente ocupados con Gcr2p. D4 representa el resto de los promotores a los que

se une Rgt1p.

39

Las ecuaciones de conservación:

D10 = D1 + D1+ + D1

++ + RD1 + RD1++

R0 = R + RD1 + RD1++ + RD4

D40 = D4 + RD4

Puesto que Rgt1p cambia la conformación de la cromatina, se considera que R

compite con RNA pol II y con Gcr2p, impidiendo la unión. Como no se tienen datos de Kr,

se considera igual a Kg. Análogamente a Gcr2p, se considera que la concentración de Rgt1p

es una función lineal de la concentración de glucosa:

R0 = -1.00·10-6 ([glucosa]) + 2.87·10-5;

Las definiciones de las constantes de equilibrio son las siguientes:

K+ = (1 – ψ2- ψp2)/ ψ2

K++ = (1 – ψ2- ψp2)/ ψp2

En este nivel es donde se obtiene la señal que modula la transcripción, ψ3=D1+/D10.

3.5.2 Resolución del sistema

El sistema planteado se resuelve utilizando el resolvedor de ecuaciones de

MATLAB fsolve para sistemas no lineales de la forma F(x)=0.

El primer nivel se resuelve una sola vez, pues se considera que no es afectado por

las condiciones externas de glucosa. Para el segundo y tercer nivel, se resuelve cambiando

la concentración de glucosa en función del tiempo y resolviendo para cada nueva

concentración de Gcr2p y Rgt1p. La curva de glucosa utilizada se basa en la obtenida por

Humberto Díaz: Desde el tiempo inicial (0 horas) hasta el inicio del crecimiento

exponencial en glucosa (25 horas) se mantiene constante en 10 [g/L]; luego, entre las 25

40

horas y las 42.5 horas tiene un decaimiento exponencial hasta 0 [g/L], permaneciendo ese

valor para cualquier tiempo mayor a 42.5, como se ilustra en la figura 5.

Figura 5.- Curva de glucosa utilizada. Se considera que hasta antes del inicio del crecimiento exponencial el nivel es constante en 10 [g/L] y que se acaba la glucosa a las 42.5 [h]

Un inconveniente de los resolvedores de problemas no lineales es que necesitan un

punto de partida para las iteraciones pues utilizan rutinas de optimización. Una prueba con

valores típicos (vector inicial cero o vector inicial con 1 en todas las posiciones) entrega

resultados incoherentes, por ejemplo, valores de concentración negativos para las

variables, aunque efectivamente se llega cerca de un cero de la función. Utilizando un

vector que contiene como supuesto inicial valores de un orden de magnitud menor que los

de las concentraciones totales, se obtienen valores positivos coherentes que cumplen

F(x)=0, con una precisión de 10-9. Las tres señales se pueden observar en la figura 6.

41

Figura 6.- Señales de salida de los tres coordinadores. La señal ψ1 de RNA polimerasa II no cambia pues no es afectada por glucosa; ψ2 sigue la misma forma de la curva de glucosa al igual que ψ3. Es interesante notar que ψ3 no es sólo una disminución en algún factor constante de ψ2.

3.6 Aplicación a perfil de mRNA y flujo metabólico

Considerando que la transcripción es constante con un tasa rtrans = 0.00074

mRNA/hora (García-Martínez, Aranda y Pérez-Ortín, 2004) independiente de la

concentración de promotores y que la transcripción es modulada por ψ3 de modo que

mRNA= rtrans* ψ3, se obtiene el perfil mostrado en la sección superior de la figura 7.

42

Figura 7.- Perfiles comparados de mRNA. Se compara el perfil de expresión calculado con el obtenido por DeRisi et. al, 1997, marcando los hitos relevantes.

Para un análisis cualitativo del resultado y a manera de validación, se compara con

el perfil de DeRisi et al. (1997), que estudia la evolución de la expresión génica durante el

salto diaúxico (figura 8 inferior). Se observa que el nivel de mRNA de DeRisi sigue

bajando después de consumirse totalmente la glucosa, lo que no ocurre en el perfil

calculado. Esto sucede porque se ocupa una ecuación algebraica y no una diferencial para

calcular el perfil de expresión; en términos biológicos, el perfil calculado considera un

cambio instantáneo en la concentración, sin considerar que el mRNA permanece un tiempo

sin ser degradado.

Es interesante notar que no se llega a una represión total de HXK2, lo que parecería

indicar que la célula no inactiva por completo su vía glicolítica aún en ausencia de glucosa,

quizás manteniendo la posibilidad de seguir utilizando glucosa como fuente de energía una

vez que aparezca.

Utilizando la concentración calculada de mRNA, sería posible predecir la

concentración de proteína e0, que podría utilizarse para el cálculo de las cinéticas de

reacción in vivo. Sin embargo, por las aproximaciones utilizadas, el resultado no sería

válido para un análisis más cuantitativo.

43

4 Conclusiones

Se dedujo una red de interacción a partir de los datos de Humberto Díaz, basada en

cambios de niveles de expresión; para un gen en particular, HXK2, se pudo aplicar la

metodología de Kremling & Gilles (2001) eligiendo una proteína como activador general

(Gcrp1) y un represor más específico (Rgt1p).

Se seleccionaron 33 genes de vías metabólicas y 23 factores de transcripción en

base a cambios transcripcionales. Los genes seleccionados a partir de cambios en sus

niveles de expresión, tanto de vías metabólicas como factores de transcripción, mostraron

ser relevantes según sus ontologías y la revisión bibliográfica correspondiente. La

visualización utilizando el programa Graphviz da como resultado un gráfico que es

engorroso de analizar vía inspección.

La utilización de Pajek para el análisis de la red permitió separar las regulaciones de

cada uno de los genes de interés, lo que facilita su estudio. Además, se identifican factores

importantes en función de las regulaciones que ejercen, así como genes factibles de ser

modelados mediante la metodología de Kremling & Gilles.

En este sentido, la metodología propuesta para generar la red y analizarla se puede

entender como un sistema que permite organizar la información disponible en las bases de

datos utilizadas, pues los nodos están relacionados mediante una publicación. Sin embargo,

esto está limitado por la cantidad de información colocada en YEASTRACT, por lo que se

depende de la capacidad de revisión de literatura de los curadores de la base de datos para ir

actualizando el modelo. Por ejemplo, Hxk2p es un regulador de otros genes, como HXK1

(Palomino, Herrero y Moreno, 2005), pero esta relación no aparece en YEASTRACT.

Las relaciones entregadas por YEASTRACT no indican función activadora y

represora por lo que es necesaria una revisión bibliográfica para entender el funcionamiento

de la red. Mediante el estudio de los trabajos que dan origen a la relación en las bases de

datos, se pudo determinar que Gcr2p y Rgt1p son importantes para la regulación de HXK2,

despreciando la influencia de Sok2p.

44

El método de Kremiling y Gilles permite calcular la fracción ocupada de

promotores por complejos que dan inicio a la transcripción. En el caso de HXK2,

considerando que Gcr2p activa la transcripción y que la unión de Rgt1p impide la

transcripción, se logra una respuesta que, desde el punto de vista cualitativo, tiene sentido.

La unión de Gcr2p eleva el nivel de sitos a los cuales se une RNA polimerasa II, a la vez

que Rgt1p lo disminuye. En la condición final estimada, el nivel de expresión (dado el

aumento de Rgt1p y la disminución de Gcr2p en función de glucosa) de HXK2 es cercano

al esperado sin los efectos de activadores y represores. Con los valores adecuados para las

constantes se podría cuantificar la concentración de proteína presente en la célula,

permitiendo estimar las cinéticas in vivo.

Sin embargo, la metodología presenta algunos inconvenientes. En primer lugar, se

asume que las diferencias de expresión de los genes de vías metabólicas son producto de

los cambios transcripcionales (y por ende de las concentraciones de proteínas) de los

factores de transcripción. Sin embargo, esto no es necesariamente cierto, pues un factor

puede ser expresado constitutivamente y estar regulada su actividad, por ejemplo, mediante

fosforilaciones u otras modificaciones estructurales.

El segundo gran problema es la cantidad de información necesaria para la

construcción del modelo, tanto en la elección de los factores como para cuantificar la

expresión. Algunos de estos datos (como constantes de unión y concentraciones de distintas

proteínas) no se encuentran disponibles o bien lo están para especies distintas, por lo que es

necesario estimar algunos valores.

4.1 Recomendaciones

Se recomienda una revisión de las constantes y parámetros utilizados. Por ejemplo,

un parámetro muy sensible es el número medio de Polimerasas por promotor (n1 y n2),

pues un cambio en su valor conduce a un comportamiento completamente distinto, sobre

todo en el nivel II (GCR2). Para ello sería muy útil un análisis de sensibilidad.

45

Una posible aplicación práctica de este trabajo podría ser el estudio de la producción

de enzimas recombinantes. Si se tiene el número medio de plasmidios con genes de interés

cuyos promotores se unen a polimerasa, podría estimarse el nivel de producción

considerando tanto si el promotor es constitutivo pero con afinidad distinta al resto o si está

bajo el control de reguladores.

46

5 Bibliografía

Alberts B, Johnson A, Lewis J, Raff M, Roberts K, Walter P. (2002). “Molecular Biology

of the cell”, Garland Science, New York, 1463 pp.

Borggrefe T, Davis R, Bareket-Samish A, Kornberg RD. (2001). “Quantitation of the RNA

polymerase II transcription machinery in yeast”, Journal of Biological Chemistry

276(50):47150-3.

Borneman A, Leigh-Bell J, Yu H, Bertone P, Gerstein M, Snyder M (2006). “Target hub

proteins serve as master regulators of development in yeast”, Genes & Development 20:

453-448.

Bushnell DA, Bamdad C, Kornberg RD. (1996). “A minimal set of RNA polymerase II

transcription protein interactions”, Journal of Biological Chemistry 271(33): 20170-4.

Chambers A, Packham EA, Graham IR (1997). “Control of glycolytic gene expression in

the budding yeast (Saccharomyces cerevisiae)”, Current Genetics 29(1):1-9.

Chua G, Morris QD, Sopko R, Robinson MD, Ryan O, Chan ET, Frey BJ, Andrews BJ,

Boone C, Hughes TR (2006). “Identifying transcription factor functions and targets by

phenotypic activation”, PNAS 103:12045-12050.

DeRisi J, Iyer V, Brown P (1997). “Exploring the Metabolic and Genetic Control of Gene

Expression on A Genomic Scale”, Science 278:680-686.

Diaz H (2006) “Análisis comparativo de una cepa nativa y otra recombinante de

Saccharomyces cerevisiae mediante el uso de datos de expresión génica (Biochips de

DNA) e Ingeniería metabólica” Memoria de Doctorado en Ciencias de la Ingeniería

mención Química área Biotecnología, Universidad de Chile

47

García-Martínez J, Aranda A, Pérez-Ortín JE (2004). “Genomic Run-On Evaluates

Transcription Rates for All Yeast Genes and Identifies Gene Regulatory Mechanisms”,

Molecular Cell 15:303-313.

Harbison CT, Gordon DB, Lee TI, Rinaldi NJ, Macisaac KD, Danford TW, Hannett NM,

Tagne JB, Reynolds DB, Yoo J, Jennings EG, Zeitlinger J, Pokholok DK, Kellis M, Rolfe

PA, Takusagawa KT, Lander ES, Gifford KD, Fraenkel E, Young RA (2004).

“Transcriptional regulatory code of a eukaryotic genome” Nature 431:99-104.

Hollenhorst PC, Pietz G, Fox CA (2001) “Mechanisms controlling differential promoter-

ocupancy by the yeast forkhead proteins Fhk1p and Fkh2p: implications for regulating the

cell cycle and differentiation” Genes & Development 15:2445-2456.

Horak CE, Luscombe NM, Qian J, Bertone P, Piccirrillo S, Gerstein M, Snyder M (2002).

“Complex transcriptional circuitry at the G1/S transition in Saccharomyces cerevisiae”

Genes & Development 16: 3017-3033.

Huie MA, Baker HV (1996). “DNA-binding properties of the yeast transcriptional

activator, Gcr1p” Yeast 12(4): 307-317.

Kal AJ, Zonneveld AJ, Benes V, Berg M, Koerkamp MG, Albermann K, Strack N, Ruijter

JM, Richter A, Dujon B, Ansorge W, Tabak HF (1999). “Dynamics of Gene Expression

Revealed by Comparision of Serial Analysis of Gene Expression Transcript Profile from

Yeast Grown on Two Different Carbon Sources” Molecular Biology of the Cell 10: 1859-

1872.

Kremling A, Jahreis K, Lengeler JW, Gilles ED (2000). “The Organization of Metabolic

Reaction Networks: A Signal-Oriented Approach to Cellular Models” Metabolic

Engineering 2: 190-200.

48

Kremling A, Gilles ED (2001). “The Organization of Metabolic Reaction Networks II.

Signaling Processing in Hierarchical Structured Functional Units” Metabolic Engineering

3: 138-150 (2001)

Kremling A, Bettenbrock K, Laube B, Jahreis K, Lengeler JW, Gilles ED (2001). “The

Organization of Metabolic Reaction Networks III. Application for Diauxic Growth on

Glucose and Lactose” Metabolic Engineering 3: 362-379.

Lee TI, Rinaldi NJ, Robert F, Odom DT, Bar-Joseph Z, Gerber GK, Hannett NM, Harbison

CT, Thomson CM, Simon I, Zeitlinger J, Jennings EG, Murray HL, Gordon DB, Ren B,

Wyric JJ, Tagne J, Volkert TL, Fraenkel E, Gifford D, Young RA (2002). “Transcriptional

Regulatory Networks in Saccharomyces cerevisiae” Science 298: 799-804.

López MC, Baker HV (2000). “Understanding the Growth Phenotype of the yeast gcr1

Mutant in Terms of Global Genomic Expression Patterns” Journal of Bacteriology 182(17):

4970-4978.

Palomino A, Herrero P, Moreno F (2005). “Rgt1, a glucose sensing transcription factor, is

required for transcriptional represion of the HXK2 gene in Saccharomyces cerevisiae”

Biochem. J. 388: 697-703.

Palomino A, Herrero P, Moreno F (2006). “Tpk3 and Snf1 protein kinases regulate Rgt1

association with Saccharomyces cerevisiae HXK2 promoter” Nucleic Acids Research

34(5): 1427-1438.

Santangelo GM (2006) “Glucose signaling in Saccharomyces cerevisiae” Microbiology and

Molecular Biology Reviews 70(1):253-282.

Sasaki H, Kishimoto T, Mizuno T, Shinzato T, Uemura H (2005) “Expression of GCR1,

the transcriptional activator of glycolytic enzyme genes in the yeast Saccharomyces

cerevisiae, is positively autoregulated by Gcr1p.” Yeast 22(4):305-319.

49

Sasaki H, Uemura H (2005) “Influence of low glycolytic activities in gcr1 and gcr2 mutants

on the expression of other metabolic pathway genes in Saccharomyces cerevisiae” Yeast

22(2):111-127.

Sherman F. (1998). “An Introduction to the Genetics and Molecular Biology of Yeast

Saccharomyces cerevisiae”. Publicado en:

http://dbb.urmc.rochester.edu/labs/sherman_f/yeast/index.html.

Struhl K (2007) “Transcriptional noise and the fidelity of initation by RNA polymerases

II”, Nature Structural & Molecular Biology 14(2):103-5.

Uemura H, Franekel DG (1999). “Glucose Metabolism in gcr Mutants of Saccharomyces

cerevisiae” Journal of Bacteriology 181(15):4719-4723.

Váchová L, Devaux F, Kučerová H, Řičicová M, Jacq C, Palková Z (2004) “Sok2p

transcription factor is involved in adaptive program relevant for long term suvirval of

Saccharomyces cerevisiae colonies” The Journal of Biological Chemistry 279(36): 37973-

37981.

Workman CT, Mak HC, McCuine S, Tagne J, Agarwal M, Ozier O, Begley TJ, Samsom

LD, Ideker T (2006) “A System Approach to Mapping DNA Damage Response Pathways”

Science 312:1054-1059

Xia Y, Yu H, Jansen R, Seringhaus M, Baxter S, Greenbaum D, Zhao H, Gerstein M

(2004) “Analyzing Cellular Biochemistry in Terms of Molecular Networks” Annual

Review Biochem. 73:1051-1087.

Zeng X, Deminoff SJ, Santangelo GM (1997) “Specialized Rap1p/Gcr1p transcriptional

activation through Gcr1p DNA contacts requires Gcr2p, as does hyperphosphorylation of

Gcr1p” Genetics 147(2): 493-505.

50

www.yeastgenome.org: Sitio web de Saccharomyces Genome Database. Revisado en Mayo

2007.

www.yeastract.com: Sitio web de YEASTRACT. Revisado en Mayo 2007.

www.graphviz.com: Sitio web de Graphviz. Revisado en Mayo 2007.

http://vlado.fmf.uni-lj.si/pub/networks/pajek/: Sitio web de Pajek. Revisado en Mayo 2007.

http://www.geneontology.org/: Sitio web del proyecto Gene Ontology.

51

6 Anexos

A. CD Adjunto

Este anexo consiste en un CD con la siguiente estructura, junto con el proceso para

utilizar los scripts de MATLAB para generar la red:

Carpeta “Selección_Genes”: Contiene todos los archivos utilizados para la

selección de los genes a estudiar y elaborar la red de regulación

o Carpeta “Búsqueda_Factores”: Contiene los archivos

correspondientes a las páginas web que descarga MATLAB al

ejecutar el script para la generación de la red

o Carpeta “Red” :

3 archivos por cada uno de los 33 genes de vías metabólicas.

Los archivos “.dot” corresponden a el archivo de texto que

sirve para graficar la red asociada al gen usando Graphviz;

los “.rep” corresponden a los reportes del método de los k-

neighbors de Pajek que se utilizan para elaborar los archivos

“.dot”. Los archivos “.ps” son archivos postcript para la

visualización de la red.

GradIn.rep y GradOut.rep, que corresponden al reporte de

Pajek de los grados de entrada y salida para cada nodo,

respectivamente.

Archivos redtotal.net y AnálisisRed.paj que corresponden a la

red implementada para Pajek y la sesión de trabajo

respectiva.

52

Archivo GDV.mat, corresponde al arreglo de celdas para

MATLAB que contiene los nombres de los 36 genes de vías

metabólicas.

ConversionRedTotal.m, que es el scritp para convertir el

archivo redtotal.dot a un archivo de texto plano

dot2txt.m, script que dado el número de líneas de

encabezamiento, convierte un archivo .dot a una archivo de

texto de afiliación

GenerarGraficosGen.m es el scritp para generar las redes de

regulación específica para los genes seleccionados.

Los archivos redtotal.dot, redtotal.txt, redtotal.ps que

corresponden a las red total (33 genes de vías más 23 FT)

generada en los distintos formatos.

o biochemical_pathways2.tab, archivo de texto tabulado que contiene

las vías metabólicas de Saccharomyces cerevisiae disponibles en

SGD, sin las líneas de encabezados originales.

o Datos_HDiaz.tab, archivo de texto tabulado con los datos de

Humberto Díaz, sin las líneas de encabezamiento.

o gene_association_sgd.tab, archivo de texto tabulado con los

identificadores internos e identificadores de ontologías de los genes

de SGD.

o registry.genenames.tab: archivo de texto tabulado con los nombres

comunes, sistemáticos e identificador interno de los genes de SGD.

53

o Go_terms_and_ids.tab, archivo de texto tabulado que contiene las

ontologías para SGD y sus identificadores.

o Preparacion_Datos.m: A partir de los datos de SGD y Humberto

Díaz, crea un archivo con el que se trabaja posteriormente.

o ListaFactores.txt: Archivo de texto con todos los factores de

YEASTRACT.

o SeleccionGenesVias.m: Script para seleccionar los genes de vías

metabólicas con expresión diferencial superior a 1.5

o SeleccionGenesTest.m: Script para seleccionar genes con expresión

diferencial según test de hipótesis.

o SeleccionOntologias.m: Script para seleccionar ontologías

relevantes.

o SeleccionFactores.m: Script para seleccionar los factores de

transcripción relevantes.

o fCargar_FT.m: Script que procesa las páginas de YEASTRACT para

convertir la tabla de la página web a datos tipo MATLAB.

o Generar_Red.m: Script que implementa el algoritmo iterativo de

búsqueda de factores.

o El resto de los archivos son los que generan los scritp señalados

como auxiliares.

54

Carpeta “Simulacion”: Contiene los archivos necesarios para la simulación

de la regulación de HXK2.

o GLU.m : función de MATLAB para replicar la curva de glucosa en

función del tiempo.

o Modelo_Completo.m: Script para simular las señales del modelo.

o nivel_mRNA.m: Script para comparar la expresión simulada con la

reportada en DeRisi et al.

o yeastdata.mat: Archivo con los datos de DeRisi et al.

o phiR3.mat : Archivo con los datos de los niveles de las señales.

Para generar la red, en formato .dot, el orden de ejecución, dentro de la carpeta

Seleccion_Genes es el siguiente: Preparación_Datos, SeleccionGenesVias,

SeleccionOntologias, SeleccionGenesTest, SeleccionFactores y GenerarRed. Con este

ultimo paso, queda conformada la red en formato .dot, que es procesado por

ConversionRedTotal para dejarlo en formato de texto de afiliación. Este último archivo

puede ser procesado por la utilidad txt2pjk, como se explica en la metodología.

55

B. Gráficos de regulación para los genes de Vías Metabólicas

En el presente anexo se presenta la regulación de cada uno de los genes de vías

metabólicas seleccionados que están regulados (33) en el siguiente orden: ACO1, ADH1,

ADH4, ADH5, ALD6, CDC19, CIT1, CIT2, ENO1, ENO2, FBA1, FUM1, GPM1, HXK1,

HXK2, IDH2, KGD2, LSC2, MDH2, PDC1, PDC6, PFK1, PGI1, PGK1, PYC1, SDH1,

SDH3, SDH4, TDH1, TDH2, TDH3, TPI1 y UGP1

Los nodos que corresponden a factores de transcripción tienen forma de círculos y

los nodos que corresponden a elementos de la vías metabólicas tienen forma cuadrada.

56

Figura 8.- Regulación de ACO1.

57

Figura 9.- Regulación de ADH1.

58

Figura 10.- Regulación de ADH4.

59

Figura 11.- Regulación de ADH5.

60

Figura 12.- Regulación de ALD6.

61

Figura 13.- Regulación de CDC19.

62

Figura 14.- Regulación de CIT1.

63

Figura 15.- Regulación de CIT2.

64

Figura 16.- Regulación de ENO1.

65

Figura 17.- Regulación de ENO2.

66

Figura 18.- Regulación de FBA1.

67

Figura 19.- Regulación de FUM1.

68

Figura 20.- Regulación de GPM1.

69

Figura 21.- Regulación de HXK1.

70

Figura 22.- Regulación de HXK2.

71

Figura 23.- Regulación de IDH2.

72

Figura 24.- Regulación de KGD2.

Figura 25.- Regulación de LSC2.

73

Figura 26.- Regulación de MDH2.

74

Figura 27.- Regulación de PDC1.

75

Figura 28.- Regulación de PDC6.

Figura 29.- Regulación de PFK1.

76

Figura 30.- Regulación de PGI1.

77

Figura 31.- Regulación de PGK1.

78

Figura 32.- Regulación de PYC1.

79

Figura 33.- Regulación de SDH1.

Figura 34.- Regulación de SDH3.

Figura 35.- Regulación de SDH4.

80

Figura 36.- Regulación de TDH1.

81

Figura 37.- Regulación de TDH2.

82

Figura 38.- Regulación de TDH3.

83

Figura 39.- Regulación de TPI1.

84

Figura 40.- Regulación de TPI1.

85

Figura 41.- Regulación de UGP1.