Predicción de la respuesta a la selección y consanguinidad con selección genómica

Preview:

DESCRIPTION

Predicción de la respuesta a la selección y consanguinidad con selección genómica. Beatriz Villanueva. Jornada Selección Genómica, Zaragoza 2009. Tesis de Hans Daetwyler. Predicción de tasa de respuesta PLoS ONE (2008): Daetwyler, Villanueva, Woolliams - PowerPoint PPT Presentation

Citation preview

Predicción de la respuesta a la selección y

consanguinidad con selección genómica

Beatriz Villanueva

Jornada Selección Genómica, Zaragoza 2009

Tesis de Hans Daetwyler

1. Predicción de tasa de respuestaPLoS ONE (2008): Daetwyler, Villanueva, Woolliams

Genetics (en revisión): Daetwyler, Pong-Wong, Villanueva , Woolliams

2. Predicción de tasa de consanguinidadJABG (2007): Daetwyler, Villanueva, Bijma, Woolliams

no

suponerla cte puede ↓ si precisión es suficientemente

alta

Predicción de la precisión

correlación entre valores mejorantes verdaderos y estimados

1. Predicción de respuesta

G = i rAA A / L

Predicción de precisión con evaluación genómica

•Mayoría de los estudios hasta ahora– Simulación

•Ventajas de predicción determinística– Rápida– Proporciona mejor entendimiento de

como interaccionan factores implicados– Muy útil en el diseño a priori de

estrategias de selección/mejora

Modelo

• nG loci potenciales afectando al carácter

• genes candidatos o marcadores muchos pueden tener efecto 0

• bialélicos, aditivos, independientes

• nP fenotipos• Muestra 1 Estimar efecto de cada alelo

• Regresión de fenotipos sobre número de alelos de referencia - un locus cada vez

• Muestra 2 Predecir valores mejorantes

Escenarios

• Carácter continuo

• Carácter dicotómico2 fenotipos (ej. sano, enfermo)estudio poblacional

• Carácter dicotómicoestudio caso-control

Individuos seleccionados en función de que tengan (casos) o no tengan (control) una determinada enfermedad

Fórmula para un carácter continuo

12

2

ˆ

h

hr AA

= precisión

= número fenotipos/número loci

h2 = heredabilidad

AAr ˆ

87.01)3.0(10

)3.0(10ˆ

AAr

= 10000/1000 = 10

= 0.3

Carácter dicotómico

• Variable subyacente

• Precisión valores mejorantes en escala subyacente

umbral

Affected (1)Unaffected (0)

Fórmula para un carácter dicotómico

• Expresando h2 en escala subyacente:

12

2

ˆ

o

oAA h

hr

= número fenotipos/número loci

= hered. escala subyacente

q = prevalencia

iq = media en escala subyacente

de individuos afectados

2lh

)1(22

22

ˆqqih

qihr

ql

ql

AA

• La misma si expresamos h2 en escala observada:

AffectedUnaffected

Fórmula para un carácter dicotómicoEstudio caso-control

q = prevalencia

w = prevalencia dentro de la muestra

iq = media en escala subyacente de individuos afectados

x = punto de truncamiento

Individuos seleccionados en función de que tengan (casos) o no tengan (control) una determinada enfermedad

AffectedUnaffected

ch

hr

o

oAA

2

2

ˆ

112 )1()](1)[1( wwxiihqqc l

)1()1( qq iwwii

Simulaciones

• Individuos no relacionados

• Loci additivos, independientes

• Frecuencias alélicas

–Uniforme, Beta (forma U)

• Efectos alélicos

–Exponencial, Normal

• nG = 1000

• nP varía (diferentes nP/nG )

Simulaciones

• Muestra 1: fenotipos y genotipos

–Estimar efecto de substitución alélica con regresión

• Muestra 2: genotipos

–Estimar valor aditivo

• Algunos escenarios: un % de efectos fijado a 0 (Va constante)

loci

jiji xg ˆ

= 0.50 = 5.00 P %error P %error Continuo 0.1 0.22 3.6 0.58 0.4 0.5 0.45 0.5 0.85 0.1 0.9 0.56 0.2 0.91 0.1 Dicotómico 0.1 0.13 6.6 0.38 1.6 población 0.5 0.28 0.6 0.68 0.2 Dicotómico 0.1 0.21 2.4 0.56 1.9 caso-control 0.5 0.41 3.0 0.82 2.9

Comparación predicción-simulación = nP/1000, q = 0.1, w = 0.5

= 0.50 = 5.00 P %error P %error Continuo 0.1 0.22 3.6 0.58 0.4 0.5 0.45 0.5 0.85 0.1 0.9 0.56 0.2 0.91 0.1 Dicotómico 0.1 0.13 6.6 0.38 1.6 población 0.5 0.28 0.6 0.68 0.2 Dicotómico 0.1 0.21 2.4 0.56 1.9 caso-control 0.5 0.41 3.0 0.82 2.9

Comparación predicción-simulación = nP/1000, q = 0.1, w = 0.5

Error: C < Dp < Dc

Error ↓ con np

Efecto de diferentes distribuciones para Frecuencias alélicas/Efectos alélicos

sobre la precisión

Carácter continuo, h2 = 0.5

Simulated

Predicted Uni/Nrm Uni/Exp Beta/Nrm Beta/Exp 0.5 0.45 0.45 0.45 0.44 0.44 1.0 0.58 0.58 0.58 0.58 0.58 5.0 0.85 0.85 0.85 0.85 0.85 10.0 0.91 0.91 0.91 0.91 0.91

Efecto de fijar un % de loci efecto = 0

Carácter continuo = 0.02 = 400/20000

Simulated

h2 Predicted 0% of nG 0 95% of nG 0

0.1 0.045 0.043 0.057 0.5 0.100 0.097 0.101 0.9 0.133 0.135 0.129

Carácter dicotómicoEstudio poblacional

Prevalencia AAr ˆ simulada

0.05 0.89 0.810 0.10 0.58 0.814 0.20 0.41 0.814 0.30 0.35 0.813 0.40 0.32 0.813 0.50 0.31 0.813

= 10, = 0.2

predicha0.816

AAr ˆ

Precisión de GEBV Carácter continuo

= 10

= 0.02

= 0.5

= 1= 2= 5

= 20

Resistencia enfermedades

Producción

Mas fenotipos

Heritability

= 10

= 0.02

= 0.5

= 1= 2= 5

= 20

Precisión de GEBVCarácter dicotómico

Menor precisión máxima que con caracteres continuos sobre todo con baja

q = 0.5

= 1

= 0.64 2oh

2lh

Fórmula predictiva

• Aumenta con heredabilidad• Aumenta con número de fenotipos• Disminuye con número de loci

12

2

ˆ

h

hr AA

GP

P

nhn

hn

2

2

Ejemplo 1• h2 = 0.25

• nP = número de individuos con fenotipos (y genotipos) = 2000

• nG = número de QTL = 500

Precisión = 0.1

Ejemplo 2• h2 = 0.25

• nP = número de individuos con fenotipos (y genotipos) = 2000

• nG = número de QTL + 49500 marcadores = 50000

Precisión = 0.9

Predicciones funcionan bien para loci independientes

PEROcuando nG es alto esta suposición no es válida

Interpretar nG como segmentos cromosómicos independientes

Predicción con otros métodos de evaluación genómica

(GBLUP y BayesB)

•BLUP genómico (GBLUP)

varianza igual para todos los loci

•BayesB utiliza informacion a priori

varianzas difieren entre loci

algunos loci tienen efecto 0

Diferencia fundamental entre métodos: Suposición acerca de las varianzas de los

efectos de los marcadores

GBLUP versus BayesB

• Simulaciones

BayesB mejor que GBLUP

Número pequeño de QTL (≤ 50)

• Datos reales

BayesB ≈ GBLUP

GBLUP versus BayesB

• NQTL bajo

ventaja de BayesB

• NQTL alto

precisión de BayesB ≈ precisión de GBLUP

Predicción de precisión con GBLUP

GP

P

nhn

hn

2

2

número de loci (independientes)

AAr ˆ

sustituir Me por nG en la fórmula

Me = número de segmentos cromosómicos independientes

eP

PAA Mhn

hnr

2

2

ˆ

independiente de NQTL

Me = 2NeL/log(4NeL) (Goddard, 2008)

Predicción de precisión con GBLUP

• NQTL bajo (< Me )

ventaja de BayesB

eP

PAA Mhn

hnr

2

2

ˆ

• NQTL alto (> Me)

precisión de BayesB precisión de GBLUP

QTLP

PAA Nhn

hnr

2

2

ˆ

Predicción de precisión con BayesB

),min(2

2

ˆ

eQTLP

PAA MNhn

hnr

Predicción de precisión con BayesB

Ne Me 0.03 Me 0.05 Me 0.15 Me 0.3 Me 0.5 Me 0.75 Me 1 Me

200 445 12 24 73 146 243 365 486

1000 1890 51 101 303 606 1010 1515 2020

2000 3774 95 189 567 1134 1890 2835 3780

Simulaciones

• 10 cromosomas (1 M)• Poblaciones en equilibrio mutación-deriva• Número loci segregando: ~ 5000• Diferentes valores para Ne, nP , h2

2NeL/log(4NeL) = 20Ne/log(40Ne)

NQTL expresado como proporción de Me

0.00

0.20

0.40

0.60

0.80

1.00

0 300 600 900 1200 1500 1800 2100

ResultadosA

cc

ura

cy

Number of QTL

h2=0.1

h2=0.3

h2=0.5

BLUP

0.00

0.20

0.40

0.60

0.80

1.00

0 300 600 900 1200 1500 1800 2100

ResultadosA

cc

ura

cy

Number of QTL

h2=0.1

h2=0.3

h2=0.5

BayesBBLUP

Predicción Simulación

a)

b)

0

0.2

0.4

0.6

0.8

1N

e200,

NP

200

Ne200,

NP

1000

Ne2000,

NP

2000

Ne200,

NP

200

Ne200,

NP

1000

Ne2000,

NP

2000

Ne200,

NP

200

Ne200,

NP

1000

Ne2000,

NP

2000

Ne200,

NP

200

Ne200,

NP

1000

Ne2000,

NP

2000

Accu

racy

0.03 Me BayesB 0.5 Me BayesB 1 Me BayesB GBLUP

0

0.2

0.4

0.6

0.8

1

NP

1000,

h0.1

NP

1000,

h0.3

NP

1000,

h0.5

NP

500,

h0.3

NP

2000,

h0.3

NP

1000,

h0.1

NP

1000,

h0.3

NP

1000,

h0.5

NP

500,

h0.3

NP

2000,

h0.3

NP

1000,

h0.1

NP

1000,

h0.3

NP

1000,

h0.5

NP

500,

h0.3

NP

2000,

h0.3

NP

1000,

h0.1

NP

1000,

h0.3

NP

1000,

h0.5

NP

500,

h0.3

NP

2000,

h0.3

Ac

cu

rac

y

0.03 Me BayesB 0.5 Me BayesB 1 Me BayesB GBLUP

a)

b)

0

0.2

0.4

0.6

0.8

1N

e200,

NP

200

Ne200,

NP

1000

Ne2000,

NP

2000

Ne200,

NP

200

Ne200,

NP

1000

Ne2000,

NP

2000

Ne200,

NP

200

Ne200,

NP

1000

Ne2000,

NP

2000

Ne200,

NP

200

Ne200,

NP

1000

Ne2000,

NP

2000

Accu

racy

0

0.2

0.4

0.6

0.8

1N

e200,

NP

200

Ne200,

NP

1000

Ne2000,

NP

2000

Ne200,

NP

200

Ne200,

NP

1000

Ne2000,

NP

2000

Ne200,

NP

200

Ne200,

NP

1000

Ne2000,

NP

2000

Ne200,

NP

200

Ne200,

NP

1000

Ne2000,

NP

2000

Accu

racy

0.03 Me BayesB 0.5 Me BayesB 1 Me BayesB GBLUP0.03 Me BayesB 0.5 Me BayesB 1 Me BayesB GBLUP

0

0.2

0.4

0.6

0.8

1

NP

1000,

h0.1

NP

1000,

h0.3

NP

1000,

h0.5

NP

500,

h0.3

NP

2000,

h0.3

NP

1000,

h0.1

NP

1000,

h0.3

NP

1000,

h0.5

NP

500,

h0.3

NP

2000,

h0.3

NP

1000,

h0.1

NP

1000,

h0.3

NP

1000,

h0.5

NP

500,

h0.3

NP

2000,

h0.3

NP

1000,

h0.1

NP

1000,

h0.3

NP

1000,

h0.5

NP

500,

h0.3

NP

2000,

h0.3

Ac

cu

rac

y

0

0.2

0.4

0.6

0.8

1

NP

1000,

h0.1

NP

1000,

h0.3

NP

1000,

h0.5

NP

500,

h0.3

NP

2000,

h0.3

NP

1000,

h0.1

NP

1000,

h0.3

NP

1000,

h0.5

NP

500,

h0.3

NP

2000,

h0.3

NP

1000,

h0.1

NP

1000,

h0.3

NP

1000,

h0.5

NP

500,

h0.3

NP

2000,

h0.3

NP

1000,

h0.1

NP

1000,

h0.3

NP

1000,

h0.5

NP

500,

h0.3

NP

2000,

h0.3

Ac

cu

rac

y

0.03 Me BayesB 0.5 Me BayesB 1 Me BayesB GBLUP

h2 = 0.3

a)

b)

0

0.2

0.4

0.6

0.8

1

Ne200,

NP

200

Ne200,

NP

1000

Ne2000,

NP

2000

Ne200,

NP

200

Ne200,

NP

1000

Ne2000,

NP

2000

Ne200,

NP

200

Ne200,

NP

1000

Ne2000,

NP

2000

Ne200,

NP

200

Ne200,

NP

1000

Ne2000,

NP

2000

Accu

racy

0.03 Me BayesB 0.5 Me BayesB 1 Me BayesB GBLUP

0

0.2

0.4

0.6

0.8

1

NP

1000,

h0.1

NP

1000,

h0.3

NP

1000,

h0.5

NP

500,

h0.3

NP

2000,

h0.3

NP

1000,

h0.1

NP

1000,

h0.3

NP

1000,

h0.5

NP

500,

h0.3

NP

2000,

h0.3

NP

1000,

h0.1

NP

1000,

h0.3

NP

1000,

h0.5

NP

500,

h0.3

NP

2000,

h0.3

NP

1000,

h0.1

NP

1000,

h0.3

NP

1000,

h0.5

NP

500,

h0.3

NP

2000,

h0.3

Ac

cu

rac

y

0.03 Me BayesB 0.5 Me BayesB 1 Me BayesB GBLUP

a)

b)

0

0.2

0.4

0.6

0.8

1

Ne200,

NP

200

Ne200,

NP

1000

Ne2000,

NP

2000

Ne200,

NP

200

Ne200,

NP

1000

Ne2000,

NP

2000

Ne200,

NP

200

Ne200,

NP

1000

Ne2000,

NP

2000

Ne200,

NP

200

Ne200,

NP

1000

Ne2000,

NP

2000

Accu

racy

0

0.2

0.4

0.6

0.8

1

Ne200,

NP

200

Ne200,

NP

1000

Ne2000,

NP

2000

Ne200,

NP

200

Ne200,

NP

1000

Ne2000,

NP

2000

Ne200,

NP

200

Ne200,

NP

1000

Ne2000,

NP

2000

Ne200,

NP

200

Ne200,

NP

1000

Ne2000,

NP

2000

Accu

racy

0.03 Me BayesB 0.5 Me BayesB 1 Me BayesB GBLUP0.03 Me BayesB 0.5 Me BayesB 1 Me BayesB GBLUP

0

0.2

0.4

0.6

0.8

1

NP

1000,

h0.1

NP

1000,

h0.3

NP

1000,

h0.5

NP

500,

h0.3

NP

2000,

h0.3

NP

1000,

h0.1

NP

1000,

h0.3

NP

1000,

h0.5

NP

500,

h0.3

NP

2000,

h0.3

NP

1000,

h0.1

NP

1000,

h0.3

NP

1000,

h0.5

NP

500,

h0.3

NP

2000,

h0.3

NP

1000,

h0.1

NP

1000,

h0.3

NP

1000,

h0.5

NP

500,

h0.3

NP

2000,

h0.3

Ac

cu

rac

y

0

0.2

0.4

0.6

0.8

1

NP

1000,

h0.1

NP

1000,

h0.3

NP

1000,

h0.5

NP

500,

h0.3

NP

2000,

h0.3

NP

1000,

h0.1

NP

1000,

h0.3

NP

1000,

h0.5

NP

500,

h0.3

NP

2000,

h0.3

NP

1000,

h0.1

NP

1000,

h0.3

NP

1000,

h0.5

NP

500,

h0.3

NP

2000,

h0.3

NP

1000,

h0.1

NP

1000,

h0.3

NP

1000,

h0.5

NP

500,

h0.3

NP

2000,

h0.3

Ac

cu

rac

y

0.03 Me BayesB 0.5 Me BayesB 1 Me BayesB GBLUP

Predicción Simulación

Ne = 1000

Predicción de Me

),min(2

2

ˆ

eQTLP

PAA MNhn

hnr

eP

PAA Mhn

hnr

2

2

ˆ

GBLUP BayesB

AAr ˆ : precisión de estimas con GBLUP o con BayesB

cuando NQTL ≥ Me

2 /)1(ˆAAAAPe rrhnM

Predicción de Me

h2 = 0.3, NQTL = Me

eM

Ne nP GBLUP BayesB Me Goddard

200 200 294 579 445

200 1000 487 584 445

1000 500 803 1187 1890

1000 1000 890 1243 1890

1000 2000 1014 1280 1890

Predicción de NQTL

),min(2

2

ˆ

eQTLP

PAA MNhn

hnr

BayesB

AAr ˆ : precisión de estimas con BayesB

cuando NQTL < Me

2 /)1(ˆAAAAPQTL rrhnN

Predicción de NQTL

QTLN sigue tendencia de NQTL

0

300

600

900

1200

1500

1800

2100

0.55 0.65 0.75 0.85 0.95

Accuracy BayesB

Nu

mb

er

of

QT

L

Simulated NQTL

Predicted NQTL

Resumen predicción/respuesta

•Predicción precisa

•Válida para diferentes distribuciones

•Fórmula sencilla

•Útil en diseño a priori de programas

•Extendida para predecir precisión con GBLUP y BayesB

•Útil para estimar Me y NQTL

2. Predicción de tasa de consanguinidad

JABG (2007): Daetwyler, Villanueva , Bijma, Woolliams

Tasa de consanguinidad

Métodos propuestos para aumentar G

Aumento en F

Ej. Selección tradicional basada en BLUP•Mayor G a corto plazo, menor a largo plazo•Efectos a corto plazo freq. alta de alelos deletéreos

¿Ocurre lo mismo con selección genómica?

0

1

2

3

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

Masal

BLUP

Genómica

Daetwyler et al. (JABG, 2007)

Tasa de consanguinidad con•Selección masal (basada sólo en P de candidatos)•BLUP•Selección genómica

Heredabilidad

Tas

a co

nsan

guin

idad

(%

)

Tasa de consanguinidad con•Selección masal (basada sólo en P de candidatos)

G = i A = i hA

h2 alta ↑ Correlación entre hermanos ↑ co-selección de hermanos ↑ F

h2 alta ↑ efecto Bulmer ↓ varianza genética entre familias ↓ co-selección de hermanos ↓ F

BALANCE

F más alto a h2

intermedias

0

1

2

3

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

Masal

Heredabilidad

Tas

a co

nsan

guin

ida

d (%

)

Tasa de consanguinidad con•BLUP

G = i A

↑ ↑ efecto Bulmer pero depende menos de h2

F ↓ con h2

co-selección de hermanos siempre ↓ con h2

0

1

2

3

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

Masal

BLUP

Heredabilidad

Tas

a co

nsan

guin

ida

d (%

)

depende de h2 + info. parientes

h2 baja ↑ correlación entre hermanos ↑ co-selección de hermanos ↑ F

• ↑ precisión en y

información de antepasados y parientes colaterales

• ↑ precisión en

información del individuo y su descendencia

Ai = ½ As+½ Ad+mi

sA dA

im

En la práctica:

BLUP ↑ a través de ↑ en y

Selección genómica ↑ a través de ↑ en

sA dA

im

Ejemplo

• Individuo sin registro, sólo con información de padres

DSi AAA ˆ)5.0(ˆ)5.0(ˆ

• EBVs de padres tienen precisión = 1 ( )AA ˆ

71.0)5.0()5.0(21222

ˆ

AAAAA

=> Diferencia 0.85 – 0.71 = 0.14 viene de un aumento en la precisión de la estima del

término mendeliano

• Meuwissen et al. = 0.85

Tasa de consanguinidad con•Selección genómica

Marcadores proporcionan información sobre mi

↓ impacto de información genealógica

F menor ↓ co-selección de hermanos ↓ F

Ai= ½ As+½ Ad+mi

Énfasis sobre selección entre familias disminuye Énfasis sobre selección dentro de familias aumenta

0

1

2

3

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

Masal

BLUP

Genómica

Heredabilidad

Tas

a co

nsan

guin

ida

d (%

)

Tasa de consanguinidad con•Selección genómica

F menor

Además

0

1

2

3

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

Masal

BLUP

Genómica

Heredabilidad

Tas

a co

nsan

guin

ida

d (%

)

↑ ↑ efecto Bulmer ↓ varianza genética entre familias ↓ co-selección de hermanos ↓ F

• Aumento en precisión de la estima del término mendeliano

• Siempre dará mayor G para una F

• Ventaja no solo a corto plazo sino también a largo plazo

¿Va el aumento de ganancia genética acompañado de un aumento de la

consanguinidad?

NO

Consanguinidad calculada con datos genotípicos

¿¿ ??

Consanguinidad calculada con genealogías

Valor esperado suponiendo loci neutrales

Selección Genómica

No libre de consanguinidad

Selección optimizada optimizar contribuciones para maximizar

G restringiendo F

Todavía válida

Recommended