View
106
Download
0
Category
Preview:
Citation preview
Variables
Distribución Normal
Distribución Normal
Si las observaciones siguen una distribución normal se pueden utilizar muchas pruebas estadísticas. Es útil saber que aproximadamente 2 terceras partes de las
observaciones que siguen una distribución normal difieren en menos de una desviación estándar de la
media; y cerca del 95% están a menos de 2 desviaciones estándar de la media
Estadística descriptiva (Medidas de tendencia central)
Media aritmética
Mediana
Moda
Se obtiene de sumar los valores individuales de la serie y dividir el resultado de esa suma entre el número de elementos de esa seriec
Es el valor que se encuentra justo en el centro de los
valores de la serie cuando estos son acomodados
progresivamente
Es el valor que mas veces se repite en una serie
Estadística descriptiva (Medidas de dispersión)
Varianza
La varianza de la población se define
como la suma de cuadrados de las
desviaciones de los datos con respecto a
la media de la población, dividida por el número de
observaciones de la población.
Desviación estándar
Es un estadístico universalmente
empleado para medir la variabilidad de
una población o de una muestra. Se
interpreta como el valor absoluto que
en promedio se alejan los datos de
las observaciones de la media de la
población, o de la muestra.
Rango o intervalo
El rango de un conjunto de datos numéricos es la
diferencia entre el mayor y el menor de
todos ellos. La información que presenta es muy
general, siendo útil en distribuciones normales
para estimar la desviación estándar, de manera aproximada.
Métodos estadísticos básicos
T de Student X2 (Chi
Cuadrada)
Análisis de regresión
ANOVA
T de Student
Esta prueba se utiliza para comparar si la media de dos distribuciones normales son iguales (H0-hipótesis 0) o diferentes una de otra (H1-hipótesis 1).
Su finalidad es la de aceptar y rechazar hipótesis.
Utilizada para variables cuantitativas Tiene 2 colas de distribución
X2 Chi cuadrada Estima la probabilidad de que la magnitud con la
que se desvían las observaciones de lo esperado, sea o no producto del azar.
La X2 mide la desviación de lo observado con lo esperado
Si el valor de p es > 0.05 debe interpretarse como que la desviación es aleatoria
En el caso opuesto (p<0.05) la desviación no es producto del azar y debe tener otra explicación.
Análisis de Varianza (ANOVA)
Esta prueba compara las medias entre los grupos de variables dependientes mediante el análisis de las fuentes de variación de la variable dependiente.
El objetivo es encontrar la fuente de variación que determina cambios en la variable dependiente.
Se pueden analizar mas datos a la vez
Waber RL, Shiv B, Carmon Z, Ariely D. Commercial features of placebo and therapeutic efficacy.JAMA. 2008 Mar 5;299(9):1016-7
Placebo barato, placebo caro
• 82 voluntarios• Uso de un nuevo
analgésico opiode similar a codeína (en realidad placebo)
• Choques eléctricos en muñeca
Regresión múltiple
¿Cómo puede el investigador controlar las variables de confusión en un estudio observacional?
¿Qué sucede cuando es necesario estratificar por muchas variables, o cuando para estratificar variables numéricas es necesario hacer categorizaciones a menudo arbitrarias?
El análisis de regresión múltiple, conocido desde hacía muchos años, fue las solución a este problema. Su utilidad fue puesta de manifiesto en 1967 cuando fue empleado en el estudio Framingham
Análisis de regresión múltiple Análisis de regresión lineal múltiple: En este caso la variable dependiente o
resultado es continua, las variables independientes pueden ser continuas o dicotómicas.
En el estudio INTERSALT fue analizada la relación entre el consumo de sal, medido por el Na en orina de 24hs, y la presión arterial. Otras variables formaron parte del modelo como el BMI, el consumo de alcohol y la edad
Análisis de regresión logística múltiple: La variable dependiente es dicotómica y las variables independientes continuas o dicotómicas.
Este tipo de análisis fue utilizado en el estudio Modo de nacimiento y riesgo de transmisión del HIV
La regresión logística permite calcular el odds ratio e IC, que tienen un importante valor biológico porque cuantifican el incremento o decremento del riesgo, ajustado por las demás variables.
Furness S, Connor J, Robinson E, et al.Car colour and risk of car crash injury: population basedcase control study. BMJ 2003;327:1455–6
Carros Plateados tienen menor riesgo de tener lesiones en accidentes
automovilísticos
El color de los carros y el riesgo de lesión en accidentes: estudio de casos y controles
Procesamiento y analisisTipo de pruebas estadisticas
Parametricas:Prueba t de
StudentANOVA
No parametricas:P. (x2)P. de WilcoxonP. de Mann y
WhitneyP. de Kruskal
Wallis
Asociación de variables y estadístico
Correlación Spearman Regresión linealCuantitativaCuantitativa
2 Prueba T +3 ANOVA
categóricaCuantitativa
Regresión logísticacuantitativacategórica
chi-cuadradacategóricacategórica
Prueba Tipos de variableDependiente independiente
Asociación de variables y estadístico
chi-cuadrada
Kruskal wallis
ANOVA
McNemarchi-cuadrada*
Wilcoxon Mann-Whitney
Prueba t pareada
Prueba tCuantitativa
Ordinal
Categórica
Número de variables independientes 2 grupos datos pareados >2grupos
Variable
* Cuando 1 celda tiene <5 esperados, se usa prueba exacta de FischerCuando 1 de las celdas tiene <5 observados, se usa corregida de Yates
Procesamiento y análisis Selección de la prueba estadística para observaciones independientes
Variable de resultadoNominal Categórica
(>2 categorías)
Ordinal Cuantitativa discreta
Cuantitativa No-normal
Cuantitativa normal
Variable de entrada
Nominal X2 o de Fisher
X2 tendencia o Mann-Whitney
Mann-Whitney
Mann-Whitney o log-rank (a)
Prueba t de student
Categórica (>2 categorías)
Kruskal-Wallis (b)
Kruskal-Wallis (b)
Kruskal-Wallis (b)
Análisis de la varianza (ANOVA) (c) Ordinal
(categorías ordenadas)
X2 de tendencia o Mann – Whitney
(e) Rangos de Spearman
Rangos de Spearman
Rangos de Spearman
Rangos de Spearman o regresión lineal (d)
Cuantitativa Discreto
Regresión Logística
(e) (e) Rangos de Spearman
Rangos de Spearman
Rangos de Spearman o regresión lineal (d)
Cuantitativa no-normal
Regresión Logística
(e)
(e)
(e)
Ploteo de datos, Pearson o rangos de Spearman
Ploteo de datos, Pearson o Rangos de Spearman y regresión lineal Cuantitativ
a normal Regresión Logística
(e)
(e)
(e)
Regresión lineal (d)
Pearson y regresión lineal
X2
X2
X2
CorrelaciónEl coeficiente de correlación de Pearson es el calculado para variables continuas, si tenemos dos variables X e Y, la correlación entre ellas se la nombra r (X,Y), o solo r y está dada por: r = (xi-x) (yi-y ) Donde xi e yi son los valores de X e Y para el (xi-x)2(yi-y)2 individuo i
-1 +1 fuerte fuerte negativa positiva -0.5 +0.5 débil débil negativa positiva 0 Sin correlación
Correlación perfecta negativa Correlación perfecta positiva
Sin Correlación
Variables
Continuas Medias2 T de
studentEdad
entre 2 grupos
>2 ANOVAEdad
entre >2 grupos
Discretas
Ordinal2 U de Mann
Whitney
Escolaridad
Numero de
intentos>2 Kruskal- Wallis
Nominal
Chi cuadrada Género
F Fisher
Todas las pruebas nos dan un valor de p
Estadística
Recommended