COGs
Cluster of Orthologous Groups
Genes Ortólogos
Comparten una gransimilitud en secuencias.
Pueden provenir de un ancestro común.
COGs
Grupos de secuencias relacionadas por comparaciones hechas a todo el proteoma.
En muchos casos los genes ortólogos pertenecen a familias compuestas de secuencias parálogas relacionadas una con otra por eventos de duplicación de genes.
Objetivos
Identificar todas las proteínas similares en los organismos, definidas como un grupo ortólogo relacionado por procesos de especiación y eventos de duplicación de genes.
Clasificar proteínas de genomas completamente secuenciados en base al concepto de ortología.
Aplicaciones
Predicción de funciones de proteínas individuales o de conjuntos de proteínas.
Análisis de patrones filogenéticos. Búsquedas mas sofisticadas. Es posible
identificar sistemáticamente las familias conservadas que faltan en un genoma dado.
COGNITOR
Permite asignar nuevas proteínas a los COGs
Algoritmo
Comparación todos contra todos usando un gapped BLAST, después de filtrar regiones de baja complejidad y coiled-coils
Algoritmo
1. Realizar una comparación todos contra todos.
2. Detectar y desechar parálogos obvios (p.e. proteínas del mismo genoma que son muy familiares entre si, mas que a una exogena)
3. Detectar triángulos mutuamente consistentes (BeTs) tomando en cuenta a los grupos parálogos encontrados en el paso 2.
Algoritmo
4. Unir los triángulos con un lado común en un nuevo COG.
5. Realizar un análisis caso por caso en cada COG evitar proteínas multidominio, falsos positivos
6. Examinar COG grandes que incluyan múltiples miembros de todos o varios de los genomas árboles filogenéticos, análisis de clusters y inspección visual
Algoritmo
El 95 – 97% de los COG asignados por el COGnitor, no requieren curación posterior
Muyl útil para bacterias y archaea 70% proteínas ortólogas
Ejemplo
Objetivo: Encontrar genes ortólogos para la isosima H8 de ligninase
proveniente de Phanerochaete chrysosporium
Resultado: Gen ortólogo Catalasa A de Saccharomyces cereviseae