Upload
antonio-paquito
View
17
Download
0
Embed Size (px)
DESCRIPTION
Resumen
Citation preview
BIOESTADSTICA
Variables
1. Cualitativas: todas aquellas que resumen cualidades de las personas
(gnero, trabajo...). Tendremos que recoger el nombre de la cualidad. Se
representan por tablas de frecuencias y grficos de barras, de sectores. Con
2 variables categricas Tablas de contingencia (d. marginales, conjunta y
condicionada la de la leyenda es la que conocemos)
2. Cuantitativas (numricas): aquellas que se pueden recoger en una
escala numrica (peso, estatura...)
2.1. Discretas: toman un conjunto finito de valores. Ej.: nmero de
hermanos de varias personas (0, 1, 2...). Se representan por Diagramas
de Barras y de Sectores.
2.2. Continuas: es aquella variable que puede tomar cualquier valor
dentro de un intervalo real. Ej.: estatura, peso. Se representan por:
Diagramas de tallo hojas
Histograma y polgono de frecuencias (el rea total del histograma =
rea total del polgono = 1)
Diagrama de cajas (Mnimo, P25, Mediana, P75 y Mximo) con:
R.I. = P75 P25; Bigotes P75+(1,5 R.I.) y P25-(1,5 R.I.)
Se suelen hacer tablas de frecuencias:
1. Organizar varias clases o categoras (). Amplitud constante.
Lmites de las clases con el mismo n de casas decimales.
2. Fronteras de cada clase (FS = (LS) de una clase
(LI) de la siguiente clase)
3. Marcas de clase (MCi =
2 )
4. Frecuencia absoluta (ni = n de sujetos en cada clase)
5. Frecuencia relativa (f = ni / total de sujetos)
6. Frecuencia acumulada (F = la suma de los datos de una clase
ms los que se encuentran en la anteriores) Ojiva
Parmetro: cantidad numrica calculada sobre una poblacin. (ej.: la altura
media de los individuos de un pas).
Estadstico: cantidad numrica calculada sobre una muestra. (ej.: la altura
media de los alumnos de una clase).
Central: Media: = xi / n (muy sensible a valores extremos)
Mediana: divide en 2 partes iguales (no es sens. a val. estr.)
Moda: valor ms repetido
Posicin: Cuantiles: se define el cuantil de orden como un valor
de la variable por debajo del cual se encuentra una frecuencia
acumulada . (ej.: 0,36)
Percentiles: Pk = cuantil de orden k/100 (P50 = mediana).
Cuartiles: 1er cuartil = P25= cuantil 0,25 2o cuartil = P50 = cuantil 0,5 = Mediana 3o cuartil = P75 = cuantil 0,75 Deciles
Dispersin: Amplitud: Max Min (muy sens. a valores extremos)
Rango Intercuartlico: P75 P25 (no sens. a val. extr.)
Varianza (S2) =()2
n (muy sens. a valores extremos)
Desviacin estndar (S) = S2; ( = 0,68; 2 =
0,95; 3 = 0,99)
Coeficiente de Variacin o Variabilidad : CF=S/Media
Forma: Asimetra (Sesgo): Distribucin Simtrica: Media = Mediana
Dist. c/ Asimetra Izda: Media < Mediana
Dist. c/ Asimetra Dcha: Media > Median
Apuntamento (Kurtosis):
Leptocrtica (valores concentr.) g2>3 kurtosis > 0
Mesocrtica (como la normal): g2=3 kurtosis = 0
Platicrtica (aplanada, valores muy separados): g2
Probabilidad
1. Suceso elemental: cualquier acontecimiento que puede ocurrir como
resultado de un experimento. Se nombran con letras maysculas: A, B, C
2. Relacin entre sucesos: Interseccin: A B (A y B) Al mismo tiempo
Unin: A B (A o B) Uno u otro
Complementario o no A: () A + = 1
Disjunto (incompatible/mutuamente excluyente):
si hay A, no hay B No hay interseccin
Diferencia: A B = P(A B) P(B)
Diferencia Simtrica: A B = P(AB) P(AB)
Axioma de Probabilidad: P(AB)=P(A)+P(B)-P(AB)
3. Espacios Muestrales (E o ): conjunto de sucesos que pueden ser el
resultado de un experimento aleatorio. Tienen que ser exhaustivos y que
sean sucesos mutuamente excluyentes, que no haya interseccin entre
ellos. P()=1
4. Tipos de espacios muestrales: Discretos: variables/sucesos discretos
Continuas: infinitos sucesos posibles
5. Probabilizacin: Subjetiva: damos el valor que creamos a ese suceso
Clsica/Laplace: P(R) =
Frecuentista: P(R) = .
. .
6. Independencia: P (E, T) = P(E) P(T) Si no se cumple, hay asociacin
Independencia: Las d. marg. dan la d. conjunta
Asociacin: Las d. marginales. no dan la d.
conjunta estimar Prob. Condicionada: P(E|T) = (,)
()
7. Parmetros Importantes: Test Diagnstico (Clnica):
Valor. Pred. Pos.: P(E|T) = P(E,T) / P(T) prob. de q un individuo
est enfermo sabiendo que el test fue Positivo.
Valor. Pred. Neg.: P(|) = P(,) / P() prob. de q un individuo
no est enfermo sabiendo que el test fue Negativo.
Medir efectividad de los test (Laboratorio):
Sensibilidad P(+|E): P(T|E) = P(T,E) / P(E) prob. de q un enfermo
de Positivo al realizar el test diagnstico.
Especificidad P(-|): P(|) = P(,) / P() prob. de que una
persona no enferma de Negativo, al realizar el test diagnstico.
Falso Negativo (1-Sensibil.) P(-|E): P(|E) prob. de que un
enfermo de Negativo, al realizar el test diagnstico.
Falso Positivo (1-Especif.) P(+|): P(T|) prob. de que un sano
de Positivo, al realizar el test diagnstico.
8. Probabilidades Condicionadas: = 0 (Independentes): P(E,T)=P(E).P(T)
P(E|T) = P(E); P(T|E) = P(T)
= 1 (Asoc. Perfecta) Patognomnico
entre 0 y 1 Clnica
9. Teorema de Bayes: Valor Pred. Pos., Sensibilidad, Prevalencia, FPos.
(|) = (, )
()=
(, )
(, ) + (, )=
(|) P(E)
(|) P(E) + (|) P()
Distribuciones de Probabilidad
1. Variables Discretas y Continuas Espacios Muestrales Discretos y
Continuos
2. Frecuencia Relativa Funcin de Densidad (Cont.) o Funcin
Cuanta (Disc.): f(x) = P[X=x] Repres.: (Disc.: Diagrama de Barras;
Cont.: Histograma y Polgono de Frecuencias P[aXb] = F[b] - F[a] =
()
)
3. Frecuencia Acumulada Funcin de Distribucin: F(x) = P[Xx]
Repres.: Ojiva (Disc.: a saltos; Cont.: contnua)
4. Funcin de Supervivencia: S(x) = 1 Funcin de Distribucin = 1 F(x)
= P[Xx] Repres.: Ojiva inversa
5. Media Esperanza Matemtica
Modelos de Probabilidad
1. Bernoulli: 1 experimento 2 resultados
=[EX=1(xito); FX=0(fracaso)]
Funcin Cuanta: f(1) = P[X=1] = p (prob. de xito)
f(0) = P[X=0] = q =(1 p) (prob. de fracaso)
Funcin Distribucin: F(1) = P[X1] = p + q = 1
F(0) = P[X0] = (1 p)
x = E[X] = p | 2x(varianza)=p.q | x=.
2. Binomial: n experimentos de Bernoulli, de forma independiente.
Para cada exper. una variable dicotmica X(1,2,n) que toma
valores 1(xito) o 0(fracaso).
X1+X2+Xn = X = n de xitos en n pruebas
X Bi(n,p) | 0Xn n=n pruebas indep. | p=prob. xito en cada prueba n
Funcin Cuanta: f(x) = P[X=x] = . . (1 )() Stata: di
binomialp(n,x,p)
Funcin Distribucin: F(x) = P[Xx] = . . (1 )()
=0
Stata: di binomial(n,k,p)
Muestreo con
replazamiento
Donde: =
=
!
!()!
x = E[X] = n.p | 2x(varianza)=n.p.q | x=. .
3. Poisson: Dist. discreta ms utilizada de la binomial, para pZ>3
5. Aproximaciones: Binomial a Poisson (Lmite I): n +, y p muy peqo
Poisson a Normal (Lmite II): >10
Binomial a Normal (Lmite III): nxp>5
Asociacin: Var. Cuantitativas Numericas
Modelo de Regresin: 2 variables: ej. peso y permetro torcico: 2 metodos
1. Estudio Grafico: Diagramas de Dispersin: Nube (0): asociacin nula;
Nube (Alargada): pendiente positiva asoc. positiva / negativa negativ.
2. Estudio Analitico: Calcular media y d.est.; las medias de las 2 variables
se cruzan en el centro de gravedad
Covarianza (Sx,y): medida de dispersin respecto al centro de
gravedad
Coeficiente de Correlacin (Pearson): entre -1 y +1. Cuanto
ms se acerquen al cero menos asociacin habr. Hablaremos de una
asociacin significativa a partir de +/-0,8
3. Modelo de Regresin Lineal: y=ax+b b = ,
^2 = rx,y .
R2x,y = r2x,y . 100
Stata:1. Para hacer el anlisis mediante stata haremos un diagrama
de dispersin: Grficos - Twoway graph Scatter.
2.Calcularemos las medias y editaremos el grafico para aadir las
lneas de referencia, as tendremos el punto de gravedad
3.Haremos el anlisis de regresin Statistics - Lineal models - Lineal regressions. Obtendremos la pendiente b y la constante a.
Estadstica Inferencial
Muestreo aleatorio simple mediante tablas. Este se puede hacer con o sin
reemplazamiento
Muestreo sistemtico, estratificado y por conglomerados
Inferencia: dar un salto de la muestra a la poblacin, tomando los
resultados de la primera. Ese salto va a implicar siempre el error aleatorio.
Sesgo de seleccin = error sistemtico
Dos tipos de sesgos:
Sesgos o errores sistemticos si hay P= 0 de ser incluido. No es
representativa, hay un sesgo de seleccin
Sesgo de informacin si no recogemos la informacin de forma
idntica en todos los individuos podemos estar cometiendo un sesgo
de informacin