Upload
loan
View
70
Download
0
Embed Size (px)
DESCRIPTION
Ecología Molecular – Clase 4. Flujo génico en poblaciones estructuradas. Población. Diversidad genética. Cromosoma. Individuo. DNA. Alelo a un locus. Población. Diversidad genética. Cromosoma. Individuo. DNA. inferencia. Alelo a un locus. Estructura. Especie. 50 km. - PowerPoint PPT Presentation
Citation preview
Flujo génico en poblaciones estructuradas
Ecología Molecular – Clase 4
DNA
CromosomaIndividuo
Alelo a un locus
Población
Diversidad genética
DNA
CromosomaIndividuo
Alelo a un locus
Población
Especie
Diversidad genéticaE
stru
ctu
ra
inferen
cia
50 km
La diferenciación genética
1.Mecanismo
2.Detección
Las fuerzas evolutivas
Selección natural
Deriva genética
Flujo genético
Pool génico
Mutaciones
Factores que cambian las frecuencias génicas en las poblaciones
N
pt = 0.5
pobl
ació
nt
N
pt+1 = 0.6
pobl
ació
nt+
1p = 0.5
Pool alélico
Binomial sampling (N, pt)
Deriva genética
N
ppppNpNp tt
tttt
)1()Var()1()Var( 11
Cambios en frecuencias alélicas
2N = 18 2N = 36
Diferenciación: cambios aleatorios independientes en distintas poblaciones
La diferenciación genética
1.Mecanismo
2.Detección
- Distribución de los alelos entre poblaciones
- Calculo de un índice de diferenciación
A a
p1 q1
A a
p2 q2?n1
A a
Pob1 n1p1 n1q1 n1
Pob2 n2p2 n2q2 n2
Σ Σ
n2
A a
0,3 0,7A a
0,6 0,4?20
30
A a
Pob1 6 14 20
Pob2 18 12 30
24 26
6 14 20
18 12 30
24 26
9,6 10,4 20
14,4 15,6 30
24 26
esp
espobs 22 )(
Critical values of chi-square for df= 3
[.050] 7.81[.025] 9.35[.010] 11.35[.005] 12.84[.001] 16.27 0732,0
21,32
P
20 0 20
4 26 30
24 26
19 1 20
5 25 30
24 26
0 20 20
24 6 30
24 26
Fisher´s Exact test
Calculo de la probabilidad de cada tabla asumiendo una distribución aleatoria de los alelos
P1 P2 P21
20 0 20
4 26 30
24 26
19 1 20
5 25 30
24 26
0 20 20
24 6 30
24 26
0475,0P
Tabla de contingencia r x k
r poblaciones k alelos
Generalización
)1(
V
ppF p
ST
A a
0,3 0,7
?20
30
A a
0,6 0,4
0225,0)(
V
2
i
ppi
i
p45,02
)6,03,0(
i
ii
i
pp
091,0STF
Medir la diferencia
p = 0.5, Vp = 0, FST = 0
p = 0.5 , Vp = 0.25, FST = 1
)1(
V
ppF p
ST
¿Y qué?
A a
0,3 0,7 2030
A a
0,6 0,4
091,0STF
Permutaciones de los alelos y construcción de la distribución de probabilidad de Fst
A a
p1 q1
A a
p2 q2
A a
p3 q3
n subpoblaciones
1. Conjunto
2. Por pares
Análisis de la Varianza Molecular (AMOVA)
Excoffier L., Smouse P.E. and Quattro J.M., 1992. Analysis of molecular variance inferred from metric distances among DNA haplotypes: Application to human mitochondrial DNA restriction data. Genetics 131: 479-491
0 1p1 p2 p3 p4 p5 p6
pR1 pR2pR1+R2
R1 R2
R1 + R2
A a
p2 q2
A a
p1 q1
A a
p3 q3
R1
A a
p5 q5
A a
p4 q4
A a
p6 q6
R2
0 1p1 p2 p3 p4 p5 p6
pR1+R2
R1 R2
R1 + R2
6
)(V
6
1
221
21
i
RRi
RR
pp
0 1p1 p2 p3 p4 p5 p6
pR1 pR2
R1 R2
R1 + R2
3
)(V
3
1
21
1
i
Ri
R
pp
3
)(V
6
4
22
2
i
Ri
R
pp
0 1
pR1 pR2pR1+R2
R1 R2
R1 + R2
2
)(V
2
1
221
2/1
i
RRRi
RR
pp
A a
p2 q2
A a
p1 q1
A a
p3 q3
A a
p5 q5
A a
p4 q4
A a
p6 q6
R1
R2
3
)(V
3
1
21
1
i
Ri
R
pp
3
)(V
6
4
22
2
i
Ri
R
pp
6
)(V
6
1
221
21
i
RRi
RR
pp
2
)(V
2
1
221
2/1
i
RRRi
RR
pp
21
2/1
V
V)2/1(
RR
RRST RRF
Proporción de la varianza total en las frecuencias alélicas, debida a la subdivisión en 2 regiones.
)1(
VVV
)1(
V)21( 212/121
ppppRRF RRRRRR
ST
Índice de estructuración de la población total en regiones y en sub-poblaciones dentro de regiones
p1,q1
p2,q2
p2,q2
AA Aa aa
p12 2p1q1 q1
2
AA Aa aa
p22 2p2q2 q2
2
AA Aa aa
p32 2p3q3 q3
2
Diploides
p1,q1
p3,q3
p2,q2
AA Aa aa
p12 2p1q1 q1
2
AA Aa aa
p22 2p2q2 q2
2
AA Aa aa
p32 2p3q3 q3
2
Genotipo A AA Aa aa
Pop1 0,2 0,04 0,32 0,64
Pop2 0,6 0,36 0,48 0,16
Pop3 1 1 0 0
Pop1 Pop2 Pop2
Tres poblaciones, cada una en equilibrio de HW
Genotipo A AA Aa aa
Pop1 0,2 0,04 0,32 0,64
Pop2 0,6 0,36 0,48 0,16
Pop3 1 1 0 0
Juntas 0,6 0,47 0,27 0,26
H0 = 0,27
Pop1 Pop2 Pop2
Freq A AA Aa aa
Pop1 0,2 0,04 0,32 0,64
Pop2 0,6 0,36 0,48 0,16
Pop3 1 1 0 0
Total 0,6 0,47 0,27 0,26
Esperado (HW)
0,6 0,36 0,48 0,16
Déficit en Heterocigotos
H0 = 0,27
He = 0,48
En cada población i, observamos (bajo HW)
pi² individuos AA, 2piqi Aa, qi² aa.
Sobre el conjunto:
n
i ii pn
pEp 1
1)(
)1(2 ppHe
n
iii
n
iiio pp
npp
nH
1
2
1
)(2
)1(21
2
1
2
1
2222
pppn
pn
Hn
ii
n
iio
Pero:
22
1
2)(1
)( ppppn
pVar i
n
ii
)var(2)1(22)var(22 2 ppppppHo
)1(2 ppHe
Sabemos que:
Entonces:
)var(2 pHH eo
)var(2 pHH eo Déficit en Heterocigotos
)var(2 pHH eo
))1(
)var(1)(1(2)var(2)1(2
pp
ppppppHo
)1(
)(
pp
pVarFst
e
oest H
HHF
Ho = 2pq (1 – FST)
Estructura genotípica observada (Hardy-Weinberg generalizado a una metapoblación con cada población panmictica):
(AA) = p² + pq FST
(Aa) = 2pq (1 – FST)
(aa) = q² + pq FST
Efecto Wahlund: observamos un déficit en heterocigotos cuando muestreamos una población estructurada (que creímos panmictica).
Fis se transforma en un Fst
Freq A AA Aa aa
Pop1 0,2 0,04 0,32 0,64
Pop2 0,6 0,36 0,48 0,16
Pop3 1 1 0 0
Total 0,6 0,47 0,27 0,26
Esperado (HW)
0,6 0,36 0,48 0,16
Déficit en Heterocigotos
2pq(1-Fst) = 0,48
Fst = 0.44
Efecto Wahlund: observamos un déficit en heterocigotos cuando muestreamos una población estructurada (que creímos panmictica).
Fis se transforma en un Fst
¿Cómo interpretar un Fis estadísticamente significativo?
• Sistema de reproducción• Efecto Wahlund• Selección• Alelos nulos
Las fuerzas evolutivas
Selección natural
Deriva genética
Flujo génico
Pool génico
Mutaciones
Factores que cambian las frecuencias génicas en las poblaciones
Tiem
po
Modelo de Wright – Fisher2 poblaciones
J : Probabilidad de que dos haplotipos sean idénticos por descendencia
B
Bw
J
JJFst
1
J ?
)1
)1(()1()1( 22
NJJm
twtw
)1
)1(()1)(1( 2
NJJmm
twtw
)1
)1(()1( 22
NJJm
twtw
1tJ
2 de la misma población
2 de la otra población
1 de cada población
Con J = F
¡Muy complicado!
Modelo infinito de Islas
Poblaciones Wright-Fisher
Poblaciones de mismo tamaño N
Misma tasa de migración entre islas
Deriva genética + mutaciones + migraciones
Generaciones
Tasa de migración mm
Tasa de mutación u
1- u
Equilibrio migración-deriva<=>
Equilibrio mutación-deriva
)1
)1(()1()1( 221 N
JJmJ ttt
Equilibrio: tt JJ 1 1)(2
1
mNJ
Deriva genética + mutaciones + migraciones
)]1
1(1
)[21)(21(1 NJ
NmJ tt
1)μ(2
)μ(2
mN
mNH
e
e
)1)(μ(2 Hm
HNe
1)(2
1
mNJFst w
B
Bw
J
JJFst
1
0BJEn el modelo infinito de Islas:
1)(2
1
mNFst
Si μ <<m
12
1
NmFst
Con Nem : Número de inmigrantes efectivos por generaciones
Modelos de dispersión
Modelo n-Islas
Modelo Continente-Isla
Modelo 2-Islas
Modelo Continente-Isla
N muy grandek muy grande
Cada inmigrante lleva un alelo nuevo
tt mPpPp )1)(( 0
pt = Frecuencia después de t generacionesp0 = Frecuencia inicialP = Frecuencia del alelo en el continentem = Tasa de migración por generación
pt
P
Aplicaciones
Ese tipo de modelo suele aplicarse cuando la migración se produce principalmente de un grupo hacia un otro.
Ejemplo: Flujo génico de la población blanca hacia la población negra en Estados-Unidos (los mulatos siendo considerado como perteneciente a la población negra).
El alelo Fya del locus Duffy es casi inexistente en África Oeste, lugar de originen de los Afro-americanos, pero esta bien representado en la población blanca.
Estudio de Adams et Ward (1973, Science 180:1137) en Georgia
PFya(blanca) = 0.422PFya(negra) = 0.045
t = 10 generaciones
Es decir un flujo génico promedio de 1 % en cada genéración.
tt mPpPp )1)(( 0
10)1)(422.00(422.0045.0 m011.0m
Beta vulgaris ssp maritimaBeta vulgaris
Arnaud et al. 2003 Proc. R. Soc. Lond. B 270:1565–1571
Flujo génico desde la variedad cultivada (y transgénica) hacia la variedad silvestre
Modelo Infinito de Islas
- Cada poblacion (isla) cumple el modelo de Wright-Fisher- Cada poblacion tiene la misma probabilidad de recibir un inmigrante- Cada inmigrante tiene la misma probabilidad de llegar desde cualquier poblacion
1)μ(2
1ST
mN
F
Modelo Q-Islas Modelo 2-Islas
Q = numero de poblacionesCon mutacion:…
Aislamiento por distancia
Modelo Stepping-stone(migración paso a paso)
Stepping-stone circular
Stepping-stone a 2 dimensiones Modelo continuo
Incremento de la diferenciación genética con la distancia entre poblaciones
Distancia geograficaó
Log (Distancia)
FS
T /
(1-F
ST)
Stepping-stone model(isolation by distance)
Island model
Test de Mantel
Pendiente es inversamente proporcional a la distancia promedia de dispersionRousset 1997 Genetics 145:1219-1228
Distancia geográfica
Dis
tanc
ia g
enét
ica
Distancia geográfica
Dis
tanc
ia g
enét
ica
Distancia geográfica
Dis
tanc
ia g
enét
ica
¿Cuando estimar un flujo genético?
Fst
FstmNe 2
1
FST
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0 200 400 600 800 1000
N=100
Generaciones
Nm
0
10
20
30
40
50
60
0 20 40 60 80 100
Flujo génico fantasma…
Después de la separación, Fst aumenta con el tiempo
AA Aa aa
p2 2pq q2
1 Locus, 2 alelos A(p) y a(q = 1-p)
p,q
p,q
p,q
AA Aa aa
p2 2pq q2
AA Aa aa
p2 2pq q2
AA Aa aa
p2 2pq q2
p,q
p,q
p,q
AA Aa aa
p2 2pq q2
AA Aa aa
p2 2pq q2
AA Aa aa
p2 2pq q2 T = 0
Fst = 0 Nm =
¿Conclusiones?
Fst
FstmNe 2
1
¿Cómo rastrear los eventos de migración sobre pocas generaciones?
Análisis de asignamiento individual
1.Aproximación basada en diferencias de frecuencia
2. Aproximación basada en agrupamiento
?
Genotipo: 125/129, 255/259, …
Aproximación basada en diferencias de frecuencia
Aproximación basada en agrupamiento
Tiempo esperado para fijación
N
N/2 N/2
0
00 )1log()1(2
p
ppNt
?m
Estructura genética y tamaño efectivo
N
N/2 N/2m
?
Tiempo esperado para fijación
0
00 )1log()1(2
p
ppNt
Deriva con m = 0
Deriva con m = 0.01
Deriva con m = 0.1
Fst
NN T
e
1
Perú Centro-Norte
Perú Sur Chile Norte
Chile Centro-Sur
El ejemplo de la anchovetaEngraulis ringens
n = 48
n = 47
n = 31
S = 31 K = 43126 individuos (secuencias)
0,00
0,10
0,20
0,30
0,40
H1 H3 H5 H11 H7 H10 H31 H12 H14 H16 H18 H20 H22 H25 H27 H29 H32 H34 H36 H39 H41 H43
Talcahuano Iquique Perú
43 haplotipos (o alelos)
Comparación de las frecuencias haplotípicas
Estructura genética de la anchoveta
0,0020
0,0021
0,0022
0,0023
0,0024
0,0025
0,0026
0,0027
0,0028
1 1,5 2 2,5 3 3,5
Distancia geográfica (miles de km)
Dis
tan
cia
ge
né
tic
a
(Ju
ke
s &
Ca
nto
r)
Aislamiento por distancia- Distribución continua- Diferenciación aumenta con la distancia
geográfica
Modelo de flujo génico
Presente estudio
400 km
200 km
Datos captura - recaptura
Informe FIP 1998
Metapoblaciones
Metapoblaciones
Distintos tamaños poblacionales=> intensidad de la deriva variable
Distintas tasas de migración=> acción homogeneisante variable
Extincciones=> pérdida de diversidad globalmente
Recolonisaciones=> efectos fundadores
Metapoblaciones
Como estudiar la estructura genética de una metapoblación?
Necesidad de integrar la información destacada por el análisis de la estructura genética (diferenciación global y diferenciación por par de poblaciones) con informaciones acerca de la dinámica de esta metapoblación
Para esto se ha desarrollado nuevos análisis
Instantáneo
Pro
med
io h
istó
rico
Responden diferentes preguntas
Instantáneo:
- basados en análisis de asignación individual
Estadística bayesiana (ej. BAYESASS)
Ind Loc1 Loc2 Loc21 1223 3436 64682 1416 3636 62723 1216 3234 60604 1212 3436 6870
Ind Loc1 Loc2 Loc21 1212 3234 68682 1418 3236 68743 1216 3234 60604 1216 3636 6670
A
B
Calcula parametros independientes para A y B (Fi, M, etc) a partir de MCMC
A
B
Positivo: permite estimar migración asimétricaNegativo: no es muy eficiente cuando A y B son muy cercanas
Histórico:
- Basados en coalescencia (utiliza una tasa de mutación)
- Los supuestos son menos estrictas
Infiere parámetros poblacionales utilizando máximo de verosimilitud basado en la teoría de coalescencia
Probabilidad de una genealogía GDatos las variables P
Incluye:Tamaño poblacional
Crecimiento poblacionalTasa de migración
Tasa de recombinación
Verosimilitud de los datos D Según la genealogía G
Rabidosa rabida