6
Examen Final de Bioestadística 1º Medicina 5 de junio de 2012 Universidad Católica de Valencia 1 1. Respecto a los tipos de estudios en ciencias de la salud, señala la respuesta verdadera: a. En función del tipo de análisis (descripción de lo observado o análisis de causas y asociaciones), los estudios se clasifican en transversales y longitudinales. b. En los estudios observacionales, el investigador es parte activa del estudio decidiendo la intervención que recibe cada paciente del estudio en cada tiempo y momento. c. En los estudios transversales, todas las observaciones se realizan en el mismo momento del tiempo y permiten conocer la frecuencia de una enfermedad. d. Los estudios de casoscontroles, son estudios experimentales, analíticos, longitudinales y pueden ser retrospectivos o prospectivos. e. Todas las anteriores son ciertas. 2. Sólo una de las siguientes, no es una medida de frecuencia de enfermedad: a. Incidencia acumulada. b. Riesgo atribuible. c. Tasa de incidencia. d. Prevalencia. e. Todas las anteriores son medidas de frecuencia de enfermedad. 3. En relación a los errores de los estudios sanitarios, señala la respuesta falsa: a. El error aleatorio es un fenómeno que ocurre al azar. b. El sesgo o error sistemático afecta a la validez interna del estudio. c. Aumentando el tamaño de la muestra, se disminuye el error aleatorio en la fase de diseño. d. El error aleatorio afecta a la validez interna del estudio. e. Todas las anteriores son falsas. 4. Para evitar posibles sesgos debemos, entre otras cosas: a. Obtener de forma aleatoria la muestra de individuos del estudio. b. Utilizar muestras pequeñas y seleccionadas cuidadosamente. c. Usar sólo los casos de la población diana con unas determinadas características. d. Buscar a personas que estén interesadas en realizar el estudio. e. Todas las anteriores son ciertas. 5. Si a los 16 datos de un conjunto de datos se les suman 5 unidades: a. La varianza no cambia. b. La varianza aumenta en 5 unidades. c. La varianza queda multiplicada por 25. d. La varianza aumenta en 25 unidades. e. La varianza puede aumentar o disminuir, según sean positivos o negativos los datos. La varianza es una medida de dispersión alrededor de la media. Si a todos los datos les suman una misma cantidad la media se incrementa en esa misma cantidad y la dispersión de los datos alrededor de la media no cambia, por lo que la respuesta correcta es la a. b es incorrecta, ya que lo que se incrementa en 5 unidades es la media. c sería cierta si multiplicamos todos los datos por 5. 6. Leemos que una talla (130 cm) es el percentil 70 en niños de 8 años. Interpretación. a. Hay una probabilidad del 70% de que un niño de 8 años mida 130 cm, en promedio. b. El 70% de los niños de 8 años miden por lo menos 130 cm. c. El 70% de los niños de 8 años miden 130 cm o más. d. El 70% de los niños de 8 años miden 130 cm o menos. e. Hay una probabilidad del 30% de que un niño de 8 años mida 130 cm, en promedio. La respuesta d es correcta, ya que es la definición de percentil 70. byc expresan lo mismo, que es la definición del percentil 30. a y e son disparates.

ExBEM 05-06-12Resuelto

  • Upload
    cacatu

  • View
    225

  • Download
    1

Embed Size (px)

DESCRIPTION

matematicas

Citation preview

Page 1: ExBEM 05-06-12Resuelto

Examen  Final  de  Bioestadística   1º  Medicina   5  de  junio  de  2012  

Universidad  Católica  de  Valencia     1

1.   Respecto  a  los  tipos  de  estudios  en  ciencias  de  la  salud,  señala  la  respuesta  verdadera:  

a.   En   función   del   tipo   de   análisis   (descripción   de   lo   observado   o   análisis   de   causas   y   asociaciones),   los  estudios  se  clasifican  en  transversales  y  longitudinales.  

b.   En   los  estudios  observacionales,  el   investigador  es  parte  activa  del  estudio  decidiendo  la   intervención  que  recibe  cada  paciente  del  estudio  en  cada  tiempo  y  momento.  

c.   En   los   estudios   transversales,   todas   las   observaciones   se   realizan   en   el   mismo  momento   del  tiempo  y  permiten  conocer  la  frecuencia  de  una  enfermedad.  

d.   Los   estudios   de   casos-­‐controles,   son   estudios   experimentales,   analíticos,   longitudinales   y   pueden   ser  retrospectivos  o  prospectivos.  

e.   Todas  las  anteriores  son  ciertas.  

2.   Sólo  una  de  las  siguientes,  no  es  una  medida  de  frecuencia  de  enfermedad:  

a.   Incidencia  acumulada.  b.   Riesgo  atribuible.  c.   Tasa  de  incidencia.  d.   Prevalencia.  e.   Todas  las  anteriores  son  medidas  de  frecuencia  de  enfermedad.  

3.   En  relación  a  los  errores  de  los  estudios  sanitarios,  señala  la  respuesta  falsa:  

a.   El  error  aleatorio  es  un  fenómeno  que  ocurre  al  azar.  b.   El  sesgo  o  error  sistemático  afecta  a  la  validez  interna  del  estudio.  c.   Aumentando  el  tamaño  de  la  muestra,  se  disminuye  el  error  aleatorio  en  la  fase  de  diseño.  d.   El  error  aleatorio  afecta  a  la  validez  interna  del  estudio.  e.   Todas  las  anteriores  son  falsas.  

4.   Para  evitar  posibles  sesgos  debemos,  entre  otras  cosas:  

a.   Obtener  de  forma  aleatoria  la  muestra  de  individuos  del  estudio.  b.   Utilizar  muestras  pequeñas  y  seleccionadas  cuidadosamente.  c.   Usar  sólo  los  casos  de  la  población  diana  con  unas  determinadas  características.  d.   Buscar  a  personas  que  estén  interesadas  en  realizar  el  estudio.  e.   Todas  las  anteriores  son  ciertas.  

5.   Si  a  los  16  datos  de  un  conjunto  de  datos  se  les  suman  5  unidades:  

a.   La  varianza  no  cambia.  b.   La  varianza  aumenta  en  5  unidades.  c.   La  varianza  queda  multiplicada  por  25.  d.   La  varianza  aumenta  en  25  unidades.  e.   La  varianza  puede  aumentar  o  disminuir,  según  sean  positivos  o  negativos  los  datos.  

La  varianza  es  una  medida  de  dispersión  alrededor  de  la  media.  Si  a  todos  los  datos  les  suman  una  misma  cantidad  la  media  se  incrementa  en  esa  misma  cantidad  y  la  dispersión  de  los  datos  alrededor  de  la  media  no  cambia,  por  lo  que  la  respuesta  correcta  es  la  a.  

b  es  incorrecta,  ya  que  lo  que  se  incrementa  en  5  unidades  es  la  media.  

c  sería  cierta  si  multiplicamos  todos  los  datos  por  5.  

6.   Leemos  que  una  talla  (130  cm)  es  el  percentil  70  en  niños  de  8  años.  Interpretación.  

a.   Hay  una  probabilidad  del  70%  de  que  un  niño  de  8  años  mida  130  cm,  en  promedio.  b.   El  70%  de  los  niños  de  8  años  miden  por  lo  menos  130  cm.  c.   El  70%  de  los  niños  de  8  años  miden  130  cm  o  más.  d.   El  70%  de  los  niños  de  8  años  miden  130  cm  o  menos.  e.   Hay  una  probabilidad  del  30%  de  que  un  niño  de  8  años  mida  130  cm,  en  promedio.  

La  respuesta  d  es  correcta,  ya  que  es  la  definición  de  percentil  70.  

b  y  c  expresan  lo  mismo,  que  es  la  definición  del  percentil  30.  

a  y  e  son  disparates.  

   

Page 2: ExBEM 05-06-12Resuelto

Examen  Final  de  Bioestadística   1º  Medicina   5  de  junio  de  2012  

Universidad  Católica  de  Valencia     2

7.   En  un  histograma  se  verifica  lo  siguiente:  

a.   La  altura  de  cada  rectángulo  es  proporcional  a  la  frecuencia  de  su  intervalo.  b.   El  rectángulo  con  mayor  altura  se  corresponde  siempre  con  el  intervalo  con  mayor  número  de  datos.  c.   Siempre   que   dos   rectángulos   tienen   la   misma   altura   sus   intervalos   contienen   el   mismo   número   de  

datos.  d.   Las  afirmaciones  a,  b  y  c  son  las  tres  ciertas.  e.   Las  afirmaciones  anteriores  son  todas  falsas.  

La  propiedad  fundamental  de  los  histogramas  es  que  el  área  de  cada  rectángulo  es  proporcional  a   la  frecuencia  de  su  intervalo.  Sin  embargo,  en  a  se  indica  la  propiedad  fundamental  del  diagrama  de  barras.  

a,  b  y  c  serían  ciertas  si  cambiamos  “altura”  por  “área”,  por  lo  que  la  respuesta  correcta  es  la  e.  

8.   Para  un  conjunto  de  datos  con  marcada  asimetría  negativa:  

a.   Esperamos  encontrar  más  datos  por  encima  de  la  media  que  por  debajo.  b.   Esperamos  encontrar  la  misma  cantidad  de  datos  por  encima  de  la  media  que  por  debajo.  c.   Esperamos  encontrar  menos  datos  por  encima  de  la  media  que  por  debajo.  d.   La   asimetría   negativa   no   nos   proporciona   información   acerca   de   a   qué   lado   de   la  media   esperamos  

encontrar  mayor  cantidad  de  datos.  e.   Entre  la  media  y  la  mediana  estarán,  por  lo  menos,  el  50%  de  los  datos.  

Si  hay  una  marcada  asimetría  negativa  esperamos  encontrar  la  media  por  debajo  de  la  mediana,  con  lo  que  por  encima  de  la  media  estarán  todos  los  datos  que  están  por  encima  de  la  mediana  (el  50%),  más  los  que  están  entre  la  media  y  la  mediana,  por  lo  que  por  encima  de  la  media  tendremos  más  de  la  mitad  de  los  datos  y  por  debajo  menos  de  la  mitad,  por  lo  que  la  respuesta  correcta  es  la  a.  

b  sería  cierta  si  en  lugar  de  “media”  pusiera  “mediana”.  

9.   El  coeficiente  de  correlación  lineal:  

a.   Mide  el  porcentaje  de  variabilidad  de  la  variable  respuesta  explicada  por  el  modelo  de  regresión.  b.   No  puede  tomar  valores  negativos.  c.   Depende  de  las  unidades  en  que  están  expresadas  las  variables.  d.   Su  signo  es  el  opuesto  al  de  la  covarianza.  e.   Ninguna  de  las  anteriores  es  cierta.  

a  se  corresponde  con  el  coeficiente  de  determinación  lineal,  no  con  el  de  correlación.  b  es  falsa,  ya  que  el  coeficiente  de  correlación   lineal   toma   valores   en   el   intervalo   [-­‐1,   1].   c   es   falsa,   ya   que   el   coeficiente   de   correlación   lineal   es  adimensional.  d  es  falsa,  ya  que  el  signo  del  coeficiente  de  correlación  lineal  coincide  con  el  de  la  covarianza.  Por  todo  lo  anterior,  la  respuesta  correcta  es  la  e.  

10.   El  coeficiente  de  determinación  lineal:  

a.   Mide   el   porcentaje   de   variabilidad   de   la   variable   respuesta   explicada   por   el   modelo   de  regresión.  

b.   Siempre  es  mayor,  en  valor  absoluto,  que  el  coeficiente  de  correlación  lineal.  c.   Su  signo  indica  si  la  relación  entre  las  variables  es  directa  o  inversa.  d.   Tiene  el  mismo  signo  que  la  covarianza  y  la  pendiente.  e.   Todas  las  anteriores  son  ciertas.  

a  es  la  definición  del  coeficiente  de  correlación  lineal,  por  lo  que  es  la  respuesta  correcta.  

b  es  falsa,  ya  que,  al  estar  r  entre  -­‐1  y  1,  su  cuadrado  estará  siempre  por  debajo  del  valor  absoluto  de  r.  

c  y  d  son  falsas,  ya  que  el  coeficiente  de  determinación  lineal  siempre  es  positivo.  Ambas  serían  ciertas  si  habláramos  del  coeficiente  de  correlación  lineal.  

Enunciado  común  para  los  ejercicios  11  y  12:  para  los  pacientes  a  los  que  se  interviene  por  segunda  vez  de  cierta  dolencia  se  observa  una  relación  lineal  entre  el  tiempo  que  ha  transcurrido  desde  la  primera  intervención  (en  años)  y  la  duración  de  la  segunda  intervención  (en  minutos).  Dado  que  existe  la  citada  relación  lineal  entre  ambas  variables,   a  partir  de  una  muestra   formada  por  20  pacientes,   se  ha  construido  un  modelo  de   regresión  lineal   simple   para   predecir   la   duración   de   la   segunda   intervención,   a   partir   del   tiempo   transcurrido   desde   la  primera,  resultando:  ! ! = 75 − 5!  cuyo  coeficiente  de  determinación  lineal  resulta  igual  a  0,64.  

   

Page 3: ExBEM 05-06-12Resuelto

Examen  Final  de  Bioestadística   1º  Medicina   5  de  junio  de  2012  

Universidad  Católica  de  Valencia     3

11.   El  coeficiente  de  correlación  lineal  estimado  entre  ambas  variables  es:  

a.   Es  igual  a  0,75.  b.   Es  igual  a  0,80.  c.   Es  igual  a  0,36.  d.   No  tenemos  suficiente  información  para  conocer  el  coeficiente  de  correlación  entre  ambas  variables.  e.   Ninguna  de  las  anteriores  afirmaciones  es  cierta.  

Al   ser   !! = 0,64,   ! = !! = 0,64 = ±0,8.   Al   ser   la   relación   lineal   entre   ambas   variables   inversa   (la   pendiente   es  negativa),  nos  quedamos  con  ! = −0,8,  con  lo  que  la  respuesta  correcta  es  la  e.  

12.   Indica  cual  de  las  siguientes  frases  supone  una  correcta  interpretación  del  modelo:  

a.   Por  cada  minuto  que  se  reduce  la  duración  de  la  2ª  intervención,  el  tiempo  transcurrido  desde  la  1ª  se  reduce,  en  promedio,  5  años.  

b.   Cada  5  años   transcurridos  desde   la  1ª   intervención,   la  duración  de   la  2ª   se   reduce,   en  promedio,  un  minuto.  

c.   Cuanto  más  tiempo  transcurre  desde  la  1ª  intervención,  mayor  es  la  duración  esperada  de  la  2ª.  d.   Por  cada  año  transcurrido  desde  la  1ª  intervención,  la  duración  de  la  2ª  se  reduce,  en  promedio,  

5  minutos.  e.   La  duración  media  de  la  2ª  intervención  es  de  75  minutos.  

La  respuesta  correcta  es  la  d,  ya  que  al  ser  la  pendiente  igual  a  −5,  por  cada  unidad  que  aumenta  la  variable  explicativa  (el   tiempo   transcurrido   desde   la   1ª   intervención),   la   variable   respuesta   (la   duración   de   la   segunda   intervención)   se  reduce,  en  promedio,  5  minutos.  a  es  incorrecta,  ya  que  intercambia  ambas  variables.  c  sería  cierta  si  la  pendiente  fuera  positiva.  

Enunciado  común  para  los  ejercicios  13  y  14:  para  cierta  intervención  hay  dos  complicaciones  principales,  A  y  B,  de  manera  que  A  sucede  en  el  20%  de  los  casos  y  B  en  el  25%  de  las  ocasiones.  

13.   Si  A   y  B   son   incompatibles,   la  probabilidad  de  que   no   suceda   ninguna   de   las   complicaciones  es:  

a.   55%     !   !    !   0   20   20  !   25   55   80     25   75   100  

! ! ∩ ! = 55 100  

b.    60%  c.    45%  d.     5%  e.    35%  

 

14.   Si  A  y  B  son  independientes,  la  probabilidad  de  que   no   suceda   ninguna   de   las   complicaciones  es:  

a.    55%     !   !    !   5   15   20  !   20   60   80     25   75   100  

! ! ∩ ! = 60 100  

b.   60%  c.    45%  d.     5%  e.    35%  

 

Si  son  incompatibles  ! ! ∩ ! = 0  y,  si  son  incompatibles  ! ! ∩ ! = ! ! ! ! = 0,05.  Esto  se  refleja  en  las  dos  tablas  anteriores  en  la  casilla  en  la  que  se  cruzan  A  y  B.  

15.   En  un  test  diagnóstico,  la  probabilidad  de  que  un  individuo,  tomado  aleatoriamente  en  una  serie  de  sujetos  de  estudio,  reciba  un  resultado  positivo,  si  realmente  tiene  la  enfermedad,  se  denomina:  

a.   Sensibilidad.   Nos  piden  ! +|! ,  es  decir,  la  probabilidad  de  detectar  a  un  enfermos,  que  es  la  sensibilidad.  b.   Especificidad.  

c.   Valor  predictivo  positivo.  d.   Tasa  de  falsos  positivos.  e.   Prevalencia.  

16.   De   un   test   diagnóstico   sabemos   que   su   sensibilidad   es   del   90%   y   que,   para   una   población   con   una  prevalencia  del  20%,  su  valor  predictivo  positivo  es  del  60%.  ¿Cuánto  vale  la  especificidad  de  dicho  test?  

a.     85%     +   −    !   18   2   20  !       80     !     100  

 

!"" = ! !| + =18!= 0,6  

! =180,6

= 30  

  +   −    !   18   2   20  !   12   68   80     30   70   100  

!"# = ! −|! = 68 70 = 0,85  

b.     90%  c.     80%  d.     92,6%  e.     97,1%  

 

   

Page 4: ExBEM 05-06-12Resuelto

Examen  Final  de  Bioestadística   1º  Medicina   5  de  junio  de  2012  

Universidad  Católica  de  Valencia     4

Enunciado  común  para  los  ejercicios  17,  18  y  19:  en  cierta  población  se  estima  que  el  5%  de  los  individuos  intervenidos  de  artroplastia  de  cadera  sufre  una  trombosis  en  la  semana  posterior  a  la  operación.  

17.   Para   una   muestra   de   9  individuos,   la   probabilidad   de  que   más   de   uno   sufra   una  trombosis   en   la   semana  posterior  a   la   intervención  es,  aproximadamente:  

a.     7,12%  b.     5,36%  c.    12,10%  d.    10,62%  e.    13,88%  

!~!" ! = 9; ! = 0,05  

! ! > 1 = 1 − ! ! ≤ 1= 1 − 0,9288= 0,0712  

18.   Para   una   muestra   de   50  individuos,   la   probabilidad   de  que   tres   o   más   sufran   una  trombosis   en   la   semana  posterior  a   la   intervención  es,  aproximadamente:  

a.    41,83%  b.    52,16%  c.    42,19%  d.   45,62%  e.    30,40%  !~!" ! = 50; ! = 0,05  

!!~!" ! = 2,5  ! ! ≥ 3 ≈ ! !! ≥ 3 =  

= 1 − ! !! < 3 = 1 − ! !! ≤ 2= 1 − 0,5438= 0,4562  

19.   Para   una   muestra   de   165  individuos,   la   probabilidad   de  que   menos   de   diez   sufran  una   trombosis   en   la   semana  posterior  a   la   intervención  es,  aprox.:  

a.    58,01%  b.   67,36%  c.    75,12%  d.    61,62%  e.    42,86%  

!~!" ! = 165; ! = 0,05 !~! ! = 8,25;!! = 7,8375  ! ! < 10 ≈ ! !! ≤ 9,5 =  

! ! ≤9,5 − 8,25

7,8375= ! ! ≤ 0,45

= 0,6736  

En  los  tres  casos  X  es  el  número  de  intervenidos  que  sufren  una  trombosis  y  en  los  tres  casos  estamos  ante  una  variable  binomial  con  ! = 0,05.  En  el  primer  caso  podemos  emplear  la  tabla  binomial,  ya  que  ! = 9.  En  el  segundo  caso  ! = 50  y,  al   no   tener   tabla   adecuada,   hacemos   la   aproximación   binomial   (al   ser   !" = 2,5,   la   aproximación   normal   no   es   la  indicada).  En  el  tercer  caso  hacemos  la  aproximación  normal,  ya  que  !" = 8,25 > 5  y  ! 1 − ! = 156,75 > 5.  

20.   En  una  población  se  espera,  para  el  año  próximo,  cuatro  nuevos  casos  de  una  enfermedad  no  contagiosa.  La  probabilidad  de  que  se  produzcan  menos  de  cinco  nuevos  casos  el  año  que  viene  es,  aproximadamente:  

a.     79%   X  es  el  número  de  casos  que  se  producirán  el  año  que  viene,  que  será:  !~!" !; ! .  No  conocemos  n  ni  p,   pero   sabemos   que   !" = 4.   Además,   sabemos   que   n   es   grande   y   p   pequeño,   con   lo   que   X   es,  aproximadamente,   una   variable   !" ! = !" = 4 ,   con   lo   que   la   probabilidad   pedida   será,  aproximadamente:  ! ! < 5 = ! ! ≤ 4 = 0,6288.  

b.     67%  c.     48%  d.     54%  e.     63%  

Enunciado   común   para   los   ejercicios   21   y   22:   el   tiempo   necesario   para   completar   una   intervención   se  considera  una  variable  normal  con  media  55  minutos  y  desviación  típica  10  minutos.  

21.   La   proporción   de   tales   intervenciones   que  se  completan  en  más  de  una  hora  es:    

a.    12,33%   !~! ! = 55;! = 10  ! ! > 60 = ! ! >!"!!!!"

= ! ! > 0,5 = 1 −! ! ≤ 0,5 =  =1 − 0,6915 = 0,3085  

b.    42,15%  c.   30,85%  d.     9,06%  e.    88,01%  

 

22.   Podemos  estimar  que  el  20%  de  tales  intervenciones  se  completan  en  más  de  …  

a.    55,1  minutos   Piden  !!":  ! ! ≤ !!" = 0,8  tipificando:  ! ! ≤ !!"!!!

!"= 0,8  

Pero  ! ! ≤ 0,84 = 0,8,  de  dónde:  !!"!!!!"

= 0,84   →  !!" = 63,4.    

b.   84,0  minutos  c.    60,2  minutos  d.   63,4  minutos  e.    72,9  minutos  

 

23.   Al  estimar  la  media  del  tiempo  necesario  para  completar  cierta  intervención,  en  minutos,  se  ha  construido  el  intervalo  de  confianza  [26,2;  34,6],  con  una  significación  del  1%.  

a.   El  tiempo  medio  necesario  para  completar  la  intervención  es  significativamente  mayor  que  25  minutos.  

b.   Tenemos  una  confianza  del  99%  en  que  el  tiempo  necesario  para  completar  la  intervención  está  entre  26,2  y  34,6  minutos  

c.   El  p-­‐value  correspondiente  al  contraste:  “el  tiempo  medio  necesario  para  completar  la  intervención  es  34  minutos”  es  menor  que  0,01.  

d.   El  p-­‐value  correspondiente  al  contraste:  “el  tiempo  medio  necesario  para  completar  la  intervención  es  34  minutos”  es  mayor  que  0,05.    

e.   Las  afirmaciones  a,  b  y  c  son  ciertas.  

La  opción  a  es  cierta.  b  es  falsa,  ya  que  el  intervalo  de  confianza  no  es  para  el  tiempo,  sino  para  el  tiempo  medio.  c  es  falsa,  ya  que,  al  estar  34  dentro  el  intervalo,  el  p-­‐value  será  mayor  que  0,01  (aceptamos  H0).  d  también  es  falsa,  ya  que  ,  por  lo  dicho  antes,  sólo  sabemos  que  el  p-­‐value  es  mayor  que  0,01,  pero  no  sabemos  si  llega  a  ser  mayor  que  0,05.  

Page 5: ExBEM 05-06-12Resuelto

Examen  Final  de  Bioestadística   1º  Medicina   5  de  junio  de  2012  

Universidad  Católica  de  Valencia     5

24.   Para  comparar  el  tiempo  medio  necesario  para  completar  dos  tipos  de  intervención,  A  y  B,  en  minutos,  se  ha  construido   el   intervalo   de   confianza:   !"!% !! − !! = −1,3; 12,8 ,   empleando   una   muestra   de   50  intervenciones  tipo  A  y  40  tipo  B.  

a.   No   hay   diferencia   significativa   en   el   tiempo  medio   necesario   para   completar   ambos   tipos   de  intervención.  

b.   El   tiempo   medio   necesario   para   completar   la   intervención   A   es   significativamente   mayor   que   el  correspondiente  a  la  intervención  B.  

c.   El   tiempo   medio   necesario   para   completar   la   intervención   es   significativamente   menor   para   las  intervenciones  tipo  A  que  para  las  tipo  B.  

d.   Para  el  95%  de  los  pares  posibles  formados  por  una  intervención  tipo  A  y  una  tipo  B  el  tiempo  medio  de  intervención  es  mayor  para  la  intervención  A  que  para  la  B.  

e.   No  podemos  estudiar   la   significación  de   la  diferencia  de  medias  porque  ambas  muestras  no   tienen  el  mismo  tamaño.  

Al  estar  el  cero  dentro  del  intervalo,  aceptamos  la  igualdad  de  medias,  es  decir,  la  diferencia  entre  las  medias  muestrales  no  es  significativa,  con  lo  que  la  opción  correcta  es  la  a.  

25.   Se   asume  que   entre   los   afectados   por   cierta   dolencia   el   10%   son  niños,   el   30%   son   jóvenes,   el   50%   son  adultos  de  menos  de  60  años  y  el  10%  son  ancianos.  Para  una  muestra  tomada  en  nuestro  hospital  hemos  encontrado   17   niños,   41   jóvenes,   68   adultos   menores   de   60   años   y   24   ancianos.   Trabajamos   con   una  significación  del  5%.  con  estos  datos  podemos  decir:  

a.   Las  proporciones  en  nuestro  hospital  coinciden  con  las  asumidas.  b.   Aceptamos  la  independencia  entre  las  proporciones  y  los  hospitales.  c.   El  p-­‐value  del  contraste  es  menor  que  0,05.  d.   No  hemos  encontrado  una  evidencia  lo  suficientemente  fuerte  para  rechazar  las  proporciones  

asumidas,  por  lo  que  las  aceptamos.  e.   Todas  las  afirmaciones  son  ciertas.  

Es  un  contraste  de  proporciones:  

  Niños   Jóvenes   Adultos   Ancianos     Al   ser   !!;!,!"! = 7,8,   cómo   la   discrepancia  está   por   debajo   del   valor   crítico,  aceptamos  la  igualdad  de  proporciones.  El  que   aceptemos   la   igualdad   de  proporciones  no  significa  que  sean  iguales,  por   lo   que   a   es   falsa   (demasiado  categórica).  

O   17   41   68   24   Suman  150  

T   15   45   75   15    

d   17 − 15 !

15  

41 − 45 !

45  

68 − 75 !

75  

24 − 15 !

15   ! = 6,7  

b  no  tiene  sentido,  ya  que  no  es  un  test  de  independencia  y  c  es  falsa,  ya  que  al  aceptar  la  igualdad  de  proporciones  el  p-­‐value  será  mayor  que  la  significación,  que  es  0,05.  La  opción  d  es  la  correcta.  

26.   De  entre  los  siguientes  valores,  ¿Cuál  es  más  creíble  para  ser  el  p-­‐value  del  contraste  del  ejercicio  25?:  a.   0,083  

 

Como  ! = 6,7   está   entre  6,25  y  6,9,   el  p-­‐value  estará  entre  0,075  y  0,10.  b.     0,012  

c.     0,071  d.     0,119  e.   0,075  

27.   Queremos  estimar  la  proporción  de  individuos  con  alguna  deficiencia  visual  leve  en  cierta  población,  para  lo  cual  tomaremos  una  muestra.  Si  queremos  que  la  probabilidad  de  cometer  un  error  de  estimación  superior  a  5  puntos  porcentuales  sea  inferior  al  1%,  indica  cual  de  los  siguientes  valores  se  aproxima  más  al  tamaño  muestral   necesario,   asumiendo  que  no   tenemos  ninguna   información  previa   acerca  de   la   proporción  que  deseamos  estimar.  

a.     9604   ! =!! !

!

!! 1 − !  

! = 0,05;  ! = 0,01  !! ! = !!,!!" = 2,5758  

Desconocemos  p,   por   lo   que   nos   ponemos   en   el   peor   de   los   casos,   que   es  ! = 0,5,  en  cuyo  caso  ! 1 − !  sería  0,25.  Con  todo  esto:  

! =!! !

!

!! 1 − ! =

2,57580,05

!

0,25 ≈ 664  b.     385  c.     13  d.     665  e.     452  

 

   

Page 6: ExBEM 05-06-12Resuelto

Examen  Final  de  Bioestadística   1º  Medicina   5  de  junio  de  2012  

Universidad  Católica  de  Valencia     6

28.   En  una  muestra  formada  por  120  niños  con  TDAH  se  ha  comprobado  que  30  de  los  niños  tenían  trastornos  del  sueño.  A  partir  de  estos  datos,  con  una  significación  del  5%,  podemos  decir  que…  

a.   …  aceptamos  que  el  porcentaje  de  niños  con  trastornos  del  sueño  entre  los  que  padecen  TDAH  es  del  35%.  

b.   …  el  porcentaje  de  niños  con  trastornos  del  sueño  entre   los  que  padecen  TDAH  es  significativamente  menor  que  el  30%.  

c.   …  aceptamos  que  el  TDAH  es  independiente  de  los  trastornos  del  sueño.  d.   …   el   porcentaje   de   niños   con   trastornos   del   sueño   entre   los   que   padecen   TDAH   es  

significativamente  mayor  que  el  15%.  e.   …  aceptamos  que  el  porcentaje  de  niños  con  TDAH  entre  los  que  padecen  trastornos  del  sueño  es  del  

30%.  

La proporción estimada es ! = 30 120 = 0,25. Si construimos el intervalo de confianza para la proporción poblacional:

!"! ! = ! ± !! !! !!!

!= 0,25 ± 1,96 !,!"×!,!"

!"#= 0,25 ± 0,078 = 17,2%; 32,8%

Al estar 35% fuera del intervalo, no podemos aceptar que este sea el porcentaje poblacional de niños con trastornos del sueño entre los que tienen TDAH, por lo que a es falsa. b también es falsa, ya que 30% está dentro del intervalo. c no tiene sentido, ya que no es un test de independencia. d es la opción correcta, ya que 15% está fuera y a la izquierda del intervalo. e es falsa, ya que estamos estudiando el porcentaje de niños con trastornos del sueño entre los que tienen TDAH, no al contrario.  

29.   Queremos  comparar  la  concentración  media  de  estrona  en  plasma  libre,  entre  fumadores  y  no  fumadores,  para   lo   que   tomamos   una   muestra   formada   por   18   hombres   no   fumadores,   para   los   cuales   !!" = 45   y  !!" = 4  y  una  muestra  formada  por  22  hombres  fumadores,  para  los  cuales    !!" = 42  y  !!" = 3.  Si  asumimos  que   para   ambas   poblaciones   la   concentración   de   estrona   en   plasma   libre   es   una   variable   normal,   con   la  misma  varianza,   aunque  desconocida,   indica   cuál  de   las   siguientes   conclusiones   te  parece  adecuada  a   los  datos  proporcionados,  si  trabajamos  con  una  significación  del  5%:  

a.   Aceptamos  que  la  concentración  media  de  estrona  en  plasma  libre  es  la  misma,  entre  los  fumadores  y  los  no  fumadores.  

b.   La  concentración  de  estrona  en  plasma  libre  es  mayor  para  los  no  fumadores  que  para  los  fumadores.  c.   El  ser  fumador  reduce  significativamente  la  concentración  media  de  estrona  en  plasma  libre.  d.   El  p-­‐value  para  la  comparación  de  medias  es  mayor  que  0,05.  e.   Ninguna  de  las  afirmaciones  anteriores  es  cierta.  

!"! !!" − !!" = !!" − !!" ± !!!"!!!"!!;! !!!!!!"

+ !!!"

; !!" − !!" = 3; !!";!,!"# = 2,024; !!"+ !

!!= 0,3178

!!! =!!" − 1 !!"! + !!" − 1 !!"

!

!!" + !!" − 2=17×16 + 21×9

38= 12,1316   →  !! = 12,1316 = 3,48

!"! !!" − !!" = 3 ± 2,024×3,48×0,3178 = 3 ± 2,24 = 0,76; 5,24

Como el cero está fuera del intervalo, rechazamos la igualdad de medias, por lo que a es falsa. b es falsa por demasiado categórica. c es cierta, ya que el cero está a la izquierda. Al rechazar la igualdad de medias, el p-value será menor que 0,05.

30.   Estamos   interesados   en   saber   si   la   probabilidad  de   padecer   cierto   efecto   secundario   tras   un   tratamiento  está  relacionada  con  la  edad  del  paciente.  Para  una  muestra  de  100  niños  y  80  jóvenes  y  70  adultos  a  los  que  se  les  ha  sometido  a  dicho  tratamiento  verificamos  el  efecto  secundario  en  35  niños,  en  20  jóvenes  y  en  10  adultos.  Para  una  significación  del  5%:  

a.   Hemos  encontrado  una  relación  significativa  entre  la  presencia  del  efecto  secundario  y  la  edad  del  paciente.  

b.   Aceptamos  la  independencia  entre  la  aparición  del  efecto  secundario  y  la  edad  del  paciente.  c.   El  efecto  secundario  es  significativamente  más  frecuente  entre  los  adultos  que  entre  los  jóvenes.  d.   Las  respuestas  a  y  c  son  correctas.  e.   Ninguna  de  las  respuestas  anteriores  es  cierta.  

O  (T)   Si   No    Niños   35  (26)   65  (74)   100  Jóvenes   20  (20,8)   60  (59,2)   80  Adultos   10  (18,2)   60  (51,8)   70     65   185   250  

 

! = !"!!" !

!"+⋯+ !"!!",! !

!",!= 9,24,   como   !!;!,!"! = 5,99,   rechazamos   la  

independencia  y  decimos  que  hemos  encontrado  una  relación  significativa  entre  la  edad  del  paciente  y   la  presencia  del  efecto  secundario.  c  es  falsa,  porque   el   contraste   chi-­‐2   no   se   pronuncia   acerca   de   en   qué   consiste   la  relación  encontrada.