Examen Final de Bioestadística 1º Medicina 5 de junio de 2012
Universidad Católica de Valencia 1
1. Respecto a los tipos de estudios en ciencias de la salud, señala la respuesta verdadera:
a. En función del tipo de análisis (descripción de lo observado o análisis de causas y asociaciones), los estudios se clasifican en transversales y longitudinales.
b. En los estudios observacionales, el investigador es parte activa del estudio decidiendo la intervención que recibe cada paciente del estudio en cada tiempo y momento.
c. En los estudios transversales, todas las observaciones se realizan en el mismo momento del tiempo y permiten conocer la frecuencia de una enfermedad.
d. Los estudios de casos-‐controles, son estudios experimentales, analíticos, longitudinales y pueden ser retrospectivos o prospectivos.
e. Todas las anteriores son ciertas.
2. Sólo una de las siguientes, no es una medida de frecuencia de enfermedad:
a. Incidencia acumulada. b. Riesgo atribuible. c. Tasa de incidencia. d. Prevalencia. e. Todas las anteriores son medidas de frecuencia de enfermedad.
3. En relación a los errores de los estudios sanitarios, señala la respuesta falsa:
a. El error aleatorio es un fenómeno que ocurre al azar. b. El sesgo o error sistemático afecta a la validez interna del estudio. c. Aumentando el tamaño de la muestra, se disminuye el error aleatorio en la fase de diseño. d. El error aleatorio afecta a la validez interna del estudio. e. Todas las anteriores son falsas.
4. Para evitar posibles sesgos debemos, entre otras cosas:
a. Obtener de forma aleatoria la muestra de individuos del estudio. b. Utilizar muestras pequeñas y seleccionadas cuidadosamente. c. Usar sólo los casos de la población diana con unas determinadas características. d. Buscar a personas que estén interesadas en realizar el estudio. e. Todas las anteriores son ciertas.
5. Si a los 16 datos de un conjunto de datos se les suman 5 unidades:
a. La varianza no cambia. b. La varianza aumenta en 5 unidades. c. La varianza queda multiplicada por 25. d. La varianza aumenta en 25 unidades. e. La varianza puede aumentar o disminuir, según sean positivos o negativos los datos.
La varianza es una medida de dispersión alrededor de la media. Si a todos los datos les suman una misma cantidad la media se incrementa en esa misma cantidad y la dispersión de los datos alrededor de la media no cambia, por lo que la respuesta correcta es la a.
b es incorrecta, ya que lo que se incrementa en 5 unidades es la media.
c sería cierta si multiplicamos todos los datos por 5.
6. Leemos que una talla (130 cm) es el percentil 70 en niños de 8 años. Interpretación.
a. Hay una probabilidad del 70% de que un niño de 8 años mida 130 cm, en promedio. b. El 70% de los niños de 8 años miden por lo menos 130 cm. c. El 70% de los niños de 8 años miden 130 cm o más. d. El 70% de los niños de 8 años miden 130 cm o menos. e. Hay una probabilidad del 30% de que un niño de 8 años mida 130 cm, en promedio.
La respuesta d es correcta, ya que es la definición de percentil 70.
b y c expresan lo mismo, que es la definición del percentil 30.
a y e son disparates.
Examen Final de Bioestadística 1º Medicina 5 de junio de 2012
Universidad Católica de Valencia 2
7. En un histograma se verifica lo siguiente:
a. La altura de cada rectángulo es proporcional a la frecuencia de su intervalo. b. El rectángulo con mayor altura se corresponde siempre con el intervalo con mayor número de datos. c. Siempre que dos rectángulos tienen la misma altura sus intervalos contienen el mismo número de
datos. d. Las afirmaciones a, b y c son las tres ciertas. e. Las afirmaciones anteriores son todas falsas.
La propiedad fundamental de los histogramas es que el área de cada rectángulo es proporcional a la frecuencia de su intervalo. Sin embargo, en a se indica la propiedad fundamental del diagrama de barras.
a, b y c serían ciertas si cambiamos “altura” por “área”, por lo que la respuesta correcta es la e.
8. Para un conjunto de datos con marcada asimetría negativa:
a. Esperamos encontrar más datos por encima de la media que por debajo. b. Esperamos encontrar la misma cantidad de datos por encima de la media que por debajo. c. Esperamos encontrar menos datos por encima de la media que por debajo. d. La asimetría negativa no nos proporciona información acerca de a qué lado de la media esperamos
encontrar mayor cantidad de datos. e. Entre la media y la mediana estarán, por lo menos, el 50% de los datos.
Si hay una marcada asimetría negativa esperamos encontrar la media por debajo de la mediana, con lo que por encima de la media estarán todos los datos que están por encima de la mediana (el 50%), más los que están entre la media y la mediana, por lo que por encima de la media tendremos más de la mitad de los datos y por debajo menos de la mitad, por lo que la respuesta correcta es la a.
b sería cierta si en lugar de “media” pusiera “mediana”.
9. El coeficiente de correlación lineal:
a. Mide el porcentaje de variabilidad de la variable respuesta explicada por el modelo de regresión. b. No puede tomar valores negativos. c. Depende de las unidades en que están expresadas las variables. d. Su signo es el opuesto al de la covarianza. e. Ninguna de las anteriores es cierta.
a se corresponde con el coeficiente de determinación lineal, no con el de correlación. b es falsa, ya que el coeficiente de correlación lineal toma valores en el intervalo [-‐1, 1]. c es falsa, ya que el coeficiente de correlación lineal es adimensional. d es falsa, ya que el signo del coeficiente de correlación lineal coincide con el de la covarianza. Por todo lo anterior, la respuesta correcta es la e.
10. El coeficiente de determinación lineal:
a. Mide el porcentaje de variabilidad de la variable respuesta explicada por el modelo de regresión.
b. Siempre es mayor, en valor absoluto, que el coeficiente de correlación lineal. c. Su signo indica si la relación entre las variables es directa o inversa. d. Tiene el mismo signo que la covarianza y la pendiente. e. Todas las anteriores son ciertas.
a es la definición del coeficiente de correlación lineal, por lo que es la respuesta correcta.
b es falsa, ya que, al estar r entre -‐1 y 1, su cuadrado estará siempre por debajo del valor absoluto de r.
c y d son falsas, ya que el coeficiente de determinación lineal siempre es positivo. Ambas serían ciertas si habláramos del coeficiente de correlación lineal.
Enunciado común para los ejercicios 11 y 12: para los pacientes a los que se interviene por segunda vez de cierta dolencia se observa una relación lineal entre el tiempo que ha transcurrido desde la primera intervención (en años) y la duración de la segunda intervención (en minutos). Dado que existe la citada relación lineal entre ambas variables, a partir de una muestra formada por 20 pacientes, se ha construido un modelo de regresión lineal simple para predecir la duración de la segunda intervención, a partir del tiempo transcurrido desde la primera, resultando: ! ! = 75 − 5! cuyo coeficiente de determinación lineal resulta igual a 0,64.
Examen Final de Bioestadística 1º Medicina 5 de junio de 2012
Universidad Católica de Valencia 3
11. El coeficiente de correlación lineal estimado entre ambas variables es:
a. Es igual a 0,75. b. Es igual a 0,80. c. Es igual a 0,36. d. No tenemos suficiente información para conocer el coeficiente de correlación entre ambas variables. e. Ninguna de las anteriores afirmaciones es cierta.
Al ser !! = 0,64, ! = !! = 0,64 = ±0,8. Al ser la relación lineal entre ambas variables inversa (la pendiente es negativa), nos quedamos con ! = −0,8, con lo que la respuesta correcta es la e.
12. Indica cual de las siguientes frases supone una correcta interpretación del modelo:
a. Por cada minuto que se reduce la duración de la 2ª intervención, el tiempo transcurrido desde la 1ª se reduce, en promedio, 5 años.
b. Cada 5 años transcurridos desde la 1ª intervención, la duración de la 2ª se reduce, en promedio, un minuto.
c. Cuanto más tiempo transcurre desde la 1ª intervención, mayor es la duración esperada de la 2ª. d. Por cada año transcurrido desde la 1ª intervención, la duración de la 2ª se reduce, en promedio,
5 minutos. e. La duración media de la 2ª intervención es de 75 minutos.
La respuesta correcta es la d, ya que al ser la pendiente igual a −5, por cada unidad que aumenta la variable explicativa (el tiempo transcurrido desde la 1ª intervención), la variable respuesta (la duración de la segunda intervención) se reduce, en promedio, 5 minutos. a es incorrecta, ya que intercambia ambas variables. c sería cierta si la pendiente fuera positiva.
Enunciado común para los ejercicios 13 y 14: para cierta intervención hay dos complicaciones principales, A y B, de manera que A sucede en el 20% de los casos y B en el 25% de las ocasiones.
13. Si A y B son incompatibles, la probabilidad de que no suceda ninguna de las complicaciones es:
a. 55% ! ! ! 0 20 20 ! 25 55 80 25 75 100
! ! ∩ ! = 55 100
b. 60% c. 45% d. 5% e. 35%
14. Si A y B son independientes, la probabilidad de que no suceda ninguna de las complicaciones es:
a. 55% ! ! ! 5 15 20 ! 20 60 80 25 75 100
! ! ∩ ! = 60 100
b. 60% c. 45% d. 5% e. 35%
Si son incompatibles ! ! ∩ ! = 0 y, si son incompatibles ! ! ∩ ! = ! ! ! ! = 0,05. Esto se refleja en las dos tablas anteriores en la casilla en la que se cruzan A y B.
15. En un test diagnóstico, la probabilidad de que un individuo, tomado aleatoriamente en una serie de sujetos de estudio, reciba un resultado positivo, si realmente tiene la enfermedad, se denomina:
a. Sensibilidad. Nos piden ! +|! , es decir, la probabilidad de detectar a un enfermos, que es la sensibilidad. b. Especificidad.
c. Valor predictivo positivo. d. Tasa de falsos positivos. e. Prevalencia.
16. De un test diagnóstico sabemos que su sensibilidad es del 90% y que, para una población con una prevalencia del 20%, su valor predictivo positivo es del 60%. ¿Cuánto vale la especificidad de dicho test?
a. 85% + − ! 18 2 20 ! 80 ! 100
!"" = ! !| + =18!= 0,6
! =180,6
= 30
+ − ! 18 2 20 ! 12 68 80 30 70 100
!"# = ! −|! = 68 70 = 0,85
b. 90% c. 80% d. 92,6% e. 97,1%
Examen Final de Bioestadística 1º Medicina 5 de junio de 2012
Universidad Católica de Valencia 4
Enunciado común para los ejercicios 17, 18 y 19: en cierta población se estima que el 5% de los individuos intervenidos de artroplastia de cadera sufre una trombosis en la semana posterior a la operación.
17. Para una muestra de 9 individuos, la probabilidad de que más de uno sufra una trombosis en la semana posterior a la intervención es, aproximadamente:
a. 7,12% b. 5,36% c. 12,10% d. 10,62% e. 13,88%
!~!" ! = 9; ! = 0,05
! ! > 1 = 1 − ! ! ≤ 1= 1 − 0,9288= 0,0712
18. Para una muestra de 50 individuos, la probabilidad de que tres o más sufran una trombosis en la semana posterior a la intervención es, aproximadamente:
a. 41,83% b. 52,16% c. 42,19% d. 45,62% e. 30,40% !~!" ! = 50; ! = 0,05
!!~!" ! = 2,5 ! ! ≥ 3 ≈ ! !! ≥ 3 =
= 1 − ! !! < 3 = 1 − ! !! ≤ 2= 1 − 0,5438= 0,4562
19. Para una muestra de 165 individuos, la probabilidad de que menos de diez sufran una trombosis en la semana posterior a la intervención es, aprox.:
a. 58,01% b. 67,36% c. 75,12% d. 61,62% e. 42,86%
!~!" ! = 165; ! = 0,05 !~! ! = 8,25;!! = 7,8375 ! ! < 10 ≈ ! !! ≤ 9,5 =
! ! ≤9,5 − 8,25
7,8375= ! ! ≤ 0,45
= 0,6736
En los tres casos X es el número de intervenidos que sufren una trombosis y en los tres casos estamos ante una variable binomial con ! = 0,05. En el primer caso podemos emplear la tabla binomial, ya que ! = 9. En el segundo caso ! = 50 y, al no tener tabla adecuada, hacemos la aproximación binomial (al ser !" = 2,5, la aproximación normal no es la indicada). En el tercer caso hacemos la aproximación normal, ya que !" = 8,25 > 5 y ! 1 − ! = 156,75 > 5.
20. En una población se espera, para el año próximo, cuatro nuevos casos de una enfermedad no contagiosa. La probabilidad de que se produzcan menos de cinco nuevos casos el año que viene es, aproximadamente:
a. 79% X es el número de casos que se producirán el año que viene, que será: !~!" !; ! . No conocemos n ni p, pero sabemos que !" = 4. Además, sabemos que n es grande y p pequeño, con lo que X es, aproximadamente, una variable !" ! = !" = 4 , con lo que la probabilidad pedida será, aproximadamente: ! ! < 5 = ! ! ≤ 4 = 0,6288.
b. 67% c. 48% d. 54% e. 63%
Enunciado común para los ejercicios 21 y 22: el tiempo necesario para completar una intervención se considera una variable normal con media 55 minutos y desviación típica 10 minutos.
21. La proporción de tales intervenciones que se completan en más de una hora es:
a. 12,33% !~! ! = 55;! = 10 ! ! > 60 = ! ! >!"!!!!"
= ! ! > 0,5 = 1 −! ! ≤ 0,5 = =1 − 0,6915 = 0,3085
b. 42,15% c. 30,85% d. 9,06% e. 88,01%
22. Podemos estimar que el 20% de tales intervenciones se completan en más de …
a. 55,1 minutos Piden !!": ! ! ≤ !!" = 0,8 tipificando: ! ! ≤ !!"!!!
!"= 0,8
Pero ! ! ≤ 0,84 = 0,8, de dónde: !!"!!!!"
= 0,84 → !!" = 63,4.
b. 84,0 minutos c. 60,2 minutos d. 63,4 minutos e. 72,9 minutos
23. Al estimar la media del tiempo necesario para completar cierta intervención, en minutos, se ha construido el intervalo de confianza [26,2; 34,6], con una significación del 1%.
a. El tiempo medio necesario para completar la intervención es significativamente mayor que 25 minutos.
b. Tenemos una confianza del 99% en que el tiempo necesario para completar la intervención está entre 26,2 y 34,6 minutos
c. El p-‐value correspondiente al contraste: “el tiempo medio necesario para completar la intervención es 34 minutos” es menor que 0,01.
d. El p-‐value correspondiente al contraste: “el tiempo medio necesario para completar la intervención es 34 minutos” es mayor que 0,05.
e. Las afirmaciones a, b y c son ciertas.
La opción a es cierta. b es falsa, ya que el intervalo de confianza no es para el tiempo, sino para el tiempo medio. c es falsa, ya que, al estar 34 dentro el intervalo, el p-‐value será mayor que 0,01 (aceptamos H0). d también es falsa, ya que , por lo dicho antes, sólo sabemos que el p-‐value es mayor que 0,01, pero no sabemos si llega a ser mayor que 0,05.
Examen Final de Bioestadística 1º Medicina 5 de junio de 2012
Universidad Católica de Valencia 5
24. Para comparar el tiempo medio necesario para completar dos tipos de intervención, A y B, en minutos, se ha construido el intervalo de confianza: !"!% !! − !! = −1,3; 12,8 , empleando una muestra de 50 intervenciones tipo A y 40 tipo B.
a. No hay diferencia significativa en el tiempo medio necesario para completar ambos tipos de intervención.
b. El tiempo medio necesario para completar la intervención A es significativamente mayor que el correspondiente a la intervención B.
c. El tiempo medio necesario para completar la intervención es significativamente menor para las intervenciones tipo A que para las tipo B.
d. Para el 95% de los pares posibles formados por una intervención tipo A y una tipo B el tiempo medio de intervención es mayor para la intervención A que para la B.
e. No podemos estudiar la significación de la diferencia de medias porque ambas muestras no tienen el mismo tamaño.
Al estar el cero dentro del intervalo, aceptamos la igualdad de medias, es decir, la diferencia entre las medias muestrales no es significativa, con lo que la opción correcta es la a.
25. Se asume que entre los afectados por cierta dolencia el 10% son niños, el 30% son jóvenes, el 50% son adultos de menos de 60 años y el 10% son ancianos. Para una muestra tomada en nuestro hospital hemos encontrado 17 niños, 41 jóvenes, 68 adultos menores de 60 años y 24 ancianos. Trabajamos con una significación del 5%. con estos datos podemos decir:
a. Las proporciones en nuestro hospital coinciden con las asumidas. b. Aceptamos la independencia entre las proporciones y los hospitales. c. El p-‐value del contraste es menor que 0,05. d. No hemos encontrado una evidencia lo suficientemente fuerte para rechazar las proporciones
asumidas, por lo que las aceptamos. e. Todas las afirmaciones son ciertas.
Es un contraste de proporciones:
Niños Jóvenes Adultos Ancianos Al ser !!;!,!"! = 7,8, cómo la discrepancia está por debajo del valor crítico, aceptamos la igualdad de proporciones. El que aceptemos la igualdad de proporciones no significa que sean iguales, por lo que a es falsa (demasiado categórica).
O 17 41 68 24 Suman 150
T 15 45 75 15
d 17 − 15 !
15
41 − 45 !
45
68 − 75 !
75
24 − 15 !
15 ! = 6,7
b no tiene sentido, ya que no es un test de independencia y c es falsa, ya que al aceptar la igualdad de proporciones el p-‐value será mayor que la significación, que es 0,05. La opción d es la correcta.
26. De entre los siguientes valores, ¿Cuál es más creíble para ser el p-‐value del contraste del ejercicio 25?: a. 0,083
Como ! = 6,7 está entre 6,25 y 6,9, el p-‐value estará entre 0,075 y 0,10. b. 0,012
c. 0,071 d. 0,119 e. 0,075
27. Queremos estimar la proporción de individuos con alguna deficiencia visual leve en cierta población, para lo cual tomaremos una muestra. Si queremos que la probabilidad de cometer un error de estimación superior a 5 puntos porcentuales sea inferior al 1%, indica cual de los siguientes valores se aproxima más al tamaño muestral necesario, asumiendo que no tenemos ninguna información previa acerca de la proporción que deseamos estimar.
a. 9604 ! =!! !
!
!! 1 − !
! = 0,05; ! = 0,01 !! ! = !!,!!" = 2,5758
Desconocemos p, por lo que nos ponemos en el peor de los casos, que es ! = 0,5, en cuyo caso ! 1 − ! sería 0,25. Con todo esto:
! =!! !
!
!! 1 − ! =
2,57580,05
!
0,25 ≈ 664 b. 385 c. 13 d. 665 e. 452
Examen Final de Bioestadística 1º Medicina 5 de junio de 2012
Universidad Católica de Valencia 6
28. En una muestra formada por 120 niños con TDAH se ha comprobado que 30 de los niños tenían trastornos del sueño. A partir de estos datos, con una significación del 5%, podemos decir que…
a. … aceptamos que el porcentaje de niños con trastornos del sueño entre los que padecen TDAH es del 35%.
b. … el porcentaje de niños con trastornos del sueño entre los que padecen TDAH es significativamente menor que el 30%.
c. … aceptamos que el TDAH es independiente de los trastornos del sueño. d. … el porcentaje de niños con trastornos del sueño entre los que padecen TDAH es
significativamente mayor que el 15%. e. … aceptamos que el porcentaje de niños con TDAH entre los que padecen trastornos del sueño es del
30%.
La proporción estimada es ! = 30 120 = 0,25. Si construimos el intervalo de confianza para la proporción poblacional:
!"! ! = ! ± !! !! !!!
!= 0,25 ± 1,96 !,!"×!,!"
!"#= 0,25 ± 0,078 = 17,2%; 32,8%
Al estar 35% fuera del intervalo, no podemos aceptar que este sea el porcentaje poblacional de niños con trastornos del sueño entre los que tienen TDAH, por lo que a es falsa. b también es falsa, ya que 30% está dentro del intervalo. c no tiene sentido, ya que no es un test de independencia. d es la opción correcta, ya que 15% está fuera y a la izquierda del intervalo. e es falsa, ya que estamos estudiando el porcentaje de niños con trastornos del sueño entre los que tienen TDAH, no al contrario.
29. Queremos comparar la concentración media de estrona en plasma libre, entre fumadores y no fumadores, para lo que tomamos una muestra formada por 18 hombres no fumadores, para los cuales !!" = 45 y !!" = 4 y una muestra formada por 22 hombres fumadores, para los cuales !!" = 42 y !!" = 3. Si asumimos que para ambas poblaciones la concentración de estrona en plasma libre es una variable normal, con la misma varianza, aunque desconocida, indica cuál de las siguientes conclusiones te parece adecuada a los datos proporcionados, si trabajamos con una significación del 5%:
a. Aceptamos que la concentración media de estrona en plasma libre es la misma, entre los fumadores y los no fumadores.
b. La concentración de estrona en plasma libre es mayor para los no fumadores que para los fumadores. c. El ser fumador reduce significativamente la concentración media de estrona en plasma libre. d. El p-‐value para la comparación de medias es mayor que 0,05. e. Ninguna de las afirmaciones anteriores es cierta.
!"! !!" − !!" = !!" − !!" ± !!!"!!!"!!;! !!!!!!"
+ !!!"
; !!" − !!" = 3; !!";!,!"# = 2,024; !!"+ !
!!= 0,3178
!!! =!!" − 1 !!"! + !!" − 1 !!"
!
!!" + !!" − 2=17×16 + 21×9
38= 12,1316 → !! = 12,1316 = 3,48
!"! !!" − !!" = 3 ± 2,024×3,48×0,3178 = 3 ± 2,24 = 0,76; 5,24
Como el cero está fuera del intervalo, rechazamos la igualdad de medias, por lo que a es falsa. b es falsa por demasiado categórica. c es cierta, ya que el cero está a la izquierda. Al rechazar la igualdad de medias, el p-value será menor que 0,05.
30. Estamos interesados en saber si la probabilidad de padecer cierto efecto secundario tras un tratamiento está relacionada con la edad del paciente. Para una muestra de 100 niños y 80 jóvenes y 70 adultos a los que se les ha sometido a dicho tratamiento verificamos el efecto secundario en 35 niños, en 20 jóvenes y en 10 adultos. Para una significación del 5%:
a. Hemos encontrado una relación significativa entre la presencia del efecto secundario y la edad del paciente.
b. Aceptamos la independencia entre la aparición del efecto secundario y la edad del paciente. c. El efecto secundario es significativamente más frecuente entre los adultos que entre los jóvenes. d. Las respuestas a y c son correctas. e. Ninguna de las respuestas anteriores es cierta.
O (T) Si No Niños 35 (26) 65 (74) 100 Jóvenes 20 (20,8) 60 (59,2) 80 Adultos 10 (18,2) 60 (51,8) 70 65 185 250
! = !"!!" !
!"+⋯+ !"!!",! !
!",!= 9,24, como !!;!,!"! = 5,99, rechazamos la
independencia y decimos que hemos encontrado una relación significativa entre la edad del paciente y la presencia del efecto secundario. c es falsa, porque el contraste chi-‐2 no se pronuncia acerca de en qué consiste la relación encontrada.
Recommended