Agrupamiento de relaciones no lineales entre expresiones de genes

Preview:

DESCRIPTION

Agrupamiento de relaciones no lineales entre expresiones de genes. Por Roberto Barchino Garrido 21/09/2009 Institut de Biotecnologia i de Biomedicina. Índice. Introducción Programas desarrollados y análisis de los resultados Conclusiones. Introducción: Objetivos. - PowerPoint PPT Presentation

Citation preview

1

Agrupamiento de relaciones no lineales entre expresiones de

genes

Por Roberto Barchino Garrido

21/09/2009Institut de Biotecnologia i de Biomedicina

2

Índice

Introducción Programas desarrollados y análisis

de los resultados Conclusiones

3

Introducción: Objetivos

Clasificar las relaciones transitivas. Estudiar la relación entre procesos. Buscar los métodos y algoritmos

que faciliten los puntos anteriores. Analizar los resultados y obtener

conclusiones.

Introducción

Fase 1

Fase 2

Fase 3

Trabajo Futuro

Conclusiones

4

Introducción: Microarrays

Cada celda representa a un gen.

La intensidad de color representa el nivel de expresión.

Introducción

Fase 1

Fase 2

Fase 3

Trabajo Futuro

Conclusiones

5

Introducción: Microarrays Niveles de expresión del gen SCHPDH

bajo diferentes condiciones muestralesIntroducción

Fase 1

Fase 2

Fase 3

Trabajo Futuro

Conclusiones

6

Introducción: Microarrays

Introducción

Fase 1

Fase 2

Fase 3

Trabajo Futuro

Conclusiones

7

Fase 1 y 2 Clasificar las relaciones transitivas

entre grupos de genes cuyas expresiones mantengan todos ellos una relación no lineal.

Estudiar los procesos y que relación a nivel de expresión tienen entre sí.

Buscar los métodos y algoritmos que faciliten los puntos anteriores.

Analizar los resultados y obtener conclusiones.

Introducción

Fase 1

Fase 2

Fase 3

Trabajo Futuro

Conclusiones

8

Fase 1

¿Qué es una relación transitiva? Una relación todos con todos

A -> B B -> C C -> A

Representación: grafos

A C

B

Introducción

Fase 1

Fase 2

Fase 3

Trabajo Futuro

Conclusiones

9

Fase 1 Representación actual de las relaciones.

Introducción

Fase 1

Fase 2

Fase 3

Trabajo Futuro

Conclusiones

10

Fase 1

Necesidad de un algoritmo para encontrar relaciones transitorias entre las expresiones no lineales de genes.

Búsqueda de subgrafos completos dentro de grafos: Cliques

Introducción

Fase 1

Fase 2

Fase 3

Trabajo Futuro

Conclusiones

11

Fase 1

¿Qué es un clique? Es un subgrafo completo dentro

de un grafo.

AC

B

EH

G

F

I

D

Introducción

Fase 1

Fase 2

Fase 3

Trabajo Futuro

Conclusiones

12

Fase 1

Problema: Algoritmo NP-Completo

Solución: MACE (MAximal Clique Enumerater)

Introducción

Fase 1

Fase 2

Fase 3

Trabajo Futuro

Conclusiones

AC

B

EH

G

F

I

D

13

Fase 1 Leemos los datos de las relaciones no lineales entre las expresiones de genes de nuestra microarray.

Creamos una matriz en la que se representa el grafo de relaciones

Ejecutamos MACE Recuperamos la información de las relaciones.

Estudiamos los datos obtenidos.

Introducción

Fase 1

Fase 2

Fase 3

Trabajo Futuro

Conclusiones

14

Fase 1

Número Nodos Número total Cliques Porcentaje

3 1758 72%

4 632 26%

5 54 2%

Introducción

Fase 1

Fase 2

Fase 3

Trabajo Futuro

Conclusiones

15

Fase 2 Clasificar las relaciones según su tipo. Encontrar grafos isomorfos

Problema NP-(completo).

Introducción

Fase 1

Fase 2

Fase 3

Trabajo Futuro

Conclusiones

16

Fase 2 Realmente no nos importa tanto la

morfología como el tipo de relaciones que hay.

Si tenemos en cuenta la morfología obtendremos muchas clases con pocos datos.

En cualquier caso conviene agruparlos para facilitar la investigación.

El investigador ya mirará en detalle el significado biológico de esa relación.

Introducción

Fase 1

Fase 2

Fase 3

Trabajo Futuro

Conclusiones

17

Fase 2

Solución: IsoTypes. A cada tipo de relación se le asigna un valor.

Se ordenan las relaciones de menor a mayor.

Se clasifica por matching.

Introducción

Fase 1

Fase 2

Fase 3

Trabajo Futuro

Conclusiones

18

Fase 2

Finalmente se obtienen 420 clases diferentes.

Cada clase está formada por los cliques que tienen el mismo IsoType.

No todas las clases son interesantes a nivel biológico.

Introducción

Fase 1

Fase 2

Fase 3

Trabajo Futuro

Conclusiones

19 Relación 1: Activadora. Relación 8: Mutuamente excluyente

Introducción

Fase 1

Fase 2

Fase 3

Trabajo Futuro

Conclusiones

20 Relación 8 y 17: Mutuamente excluyente. Relación 10: Inhibidora

Introducción

Fase 1

Fase 2

Fase 3

Trabajo Futuro

Conclusiones

21 Relación 0: Activadora. Relación 9 y 12: inhibidoras

Introducción

Fase 1

Fase 2

Fase 3

Trabajo Futuro

Conclusiones

22 Relación 5: Activadora. Relación 9: inhibidora. Relación 26: Activadora/Desactivadora

Introducción

Fase 1

Fase 2

Fase 3

Trabajo Futuro

Conclusiones

23

Fase 3 Clasificar las relaciones transitivas

entre grupos de genes cuyas expresiones mantengan todos ellos una relación no lineal.

Estudiar los procesos y que relación a nivel de expresión tienen entre sí.

Buscar los métodos y algoritmos que faciliten los puntos anteriores.

Analizar los resultados y obtener conclusiones.

Introducción

Fase 1

Fase 2

Fase 3

Trabajo Futuro

Conclusiones

24

Fase 3 ¿Qué es un proceso?

Varios genes que se coexpresan a la vez.

proceso

relaciones lineales

IntroducciónIntroducción

Fase 1

Fase 2

Fase 3

Trabajo Futuro

Conclusiones

25

Fase 3 ¿Qué buscamos?

La relación a nivel de proceso. Clique de

relaciones no lineales

Proceso

Introducción

Fase 1

Fase 2

Fase 3

Trabajo Futuro

Conclusiones

26

Fase 3 Para cada clique. Comprobar con todos los cliques que tengan el mismo IsoType que los genes mantienen una relación lineal.

Caso que sí: guardar.

Introducción

Fase 1

Fase 2

Fase 3

Trabajo Futuro

Conclusiones

27

Fase 3

Problema: En caso de que el clique tenga aristas repetidas es necesario permutar para comprobar la linealidad.

Permutar Complejidad factorial.

Introducción

Fase 1

Fase 2

Fase 3

Trabajo Futuro

Conclusiones

28

Introducción

Fase 1

Fase 2

Fase 3

Trabajo Futuro

Conclusiones

29

Trabajo Futuro

Crear una herramienta que automatice la elaboración de procesos con diversas maneras construcción a partir de los archivos generados en la fase 3. En forma de clique de cliques. En forma de grafo de cliques

lineales.

Introducción

Fase 1

Fase 2

Fase 3

Trabajo Futuro

Conclusiones

30

Conclusiones

Objetivos cumplidos.

Transitividad predecible. Procesos con relaciones no

complejas. Programa automatizado.

Introducción

Fase 1

Fase 2

Fase 3

Trabajo Futuro

Conclusiones

31

Agrupamiento de relaciones no lineales entre expresiones de

genes

Por Roberto Barchino Garrido

Institut de Biotecnologia i de Biomedicina