39
Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Estadística Descriptiva II: Relación entre variables Iniciación a la Investigación Ciencias de la Salud Jesús Montanero Fernández MUI Ciencias de la Salud, UEx 25 de octubre de 2010 Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Estadística Descriptiva II: Relación entre variablesmatematicas.unex.es/~jmf/Archivos/Desciptiva_II_MUI.pdf · Regresión-correlación Tablas de contingencia Comparación de grupos

Embed Size (px)

Citation preview

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Estadística Descriptiva II: Relación entrevariables

Iniciación a la Investigación Ciencias de la Salud

Jesús Montanero Fernández

MUI Ciencias de la Salud, UEx

25 de octubre de 2010

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

¿De qué trata?

Descripción conjunto concreto de datos (sin generalizar)Clasificación Tablas de frecuenciaRepresentación GráficosResumen Valores típicos

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Tipos de variables ¿?

Según SPSSCualitativas (factores)

Nominales: Grupo sanguíneoOrdinales: Grado enfermedad

Cuantitativas o de escala : Temperatura, estatura, glucemia,no hijos...

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Problemas estadísticos: relación

Tipos de relacionesCualitativa (factor)↔ Cuantitativa (Comparación degrupos o tratamientos)Cuantitativa↔ Cuantitativa (Regresión)Cualitativa (factor)↔ Cuanlitativa (Tablas decontingencia)

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Relación entre dos variables cuantitativas

Peso-altura

X =peso(kg) 80 45 63 94 24 75 56 ...Y =altura(cm) 174 152 160 183 102 183 148 ...

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Gráfico

Diagrama de dispersión

-

6

X

Y

|10

|20

|30

|40

|50

|60

|70

|80

|90

|100

100−

110−

120−

130−

140−

150−

160−

170−

180−

190−

200−

qq q

q

q

qqqq

qq

q

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Otro ejemplo

Longitud cabeza

9,0008,7008,4008,1007,800

An

ch

ura

ca

be

za

5,200

5,100

5,000

4,900

4,800

4,700

4,600

4,500

Página 1

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Estudiamos inicialmente relaciones lineales

Concentración de hormona paratiroidea (mug/ml)

5,004,003,002,001,000,00

Co

nc

en

tra

ció

n d

e c

alc

io (

mg

/10

0m

l)11,00

10,00

9,00

8,00

7,00

6,00

5,00

Página 1

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Valores típicos

Dos tiposDe las variables por separados.Referentes a la relación entre las variables

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Variables por separado

x, sx, y, sy, y, . . .

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Referentes a la relación entre las variables: Covarianza→ r

sxy =

∑ni=1(xi − x)(yi − y)

n− 1

− sx · sy ≤ sxy ≤ + sx · sy .

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Interpretación gráfica

−630,71 ≤ sxy ≤ +630,71 sxy = 577,86

Peso

10080604020

Alt

ura

200

175

150

125

100

Página 1

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Longitud cabeza

9,0008,7008,4008,1007,800

An

ch

ura

ca

be

za

5,200

5,100

5,000

4,900

4,800

4,700

4,600

4,500

Página 1

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Interpretación gráfica covarianza

-

6

X

Y

q q q q q q q

-

6

X

Y

q qq

qqqq

-

6

X

Y q q q q q q q

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Covarianza próxima a cero

x

8,006,004,002,00

y8,00

7,00

6,00

5,00

4,00

3,00

2,00

1,00

Página 1

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Covarianza negativa

Concentración de hormona paratiroidea (mug/ml)

5,004,003,002,001,000,00

Co

nc

en

tra

ció

n d

e c

alc

io (

mg

/10

0m

l)11,00

10,00

9,00

8,00

7,00

6,00

5,00

Página 1

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Coeficiente de correlación lineal r

Medida adimensional del grado de correlación

− sx · sy ≤ sxy ≤ + sx · sy .

r =sxy

sx · sy

−1 ≤ r ≤ 1

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

r = 0,91

-

6

X

Y

|10

|20

|30

|40

|50

|60

|70

|80

|90

|100

100−

110−

120−

130−

140−

150−

160−

170−

180−

190−

200−

qq q

q

q

qqqq

qq

q

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

r = 0,625

an

ch

5,200

5,000

4,800

4,600

longt

9,0008,7008,4008,1007,800

Página 1

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

r = −0,97

Concentración de hormona paratiroidea (mug/ml)

5,004,003,002,001,000,00

Co

nc

en

tra

ció

n d

e c

alc

io (

mg

/10

0m

l)11,00

10,00

9,00

8,00

7,00

6,00

5,00

Página 1

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Recta de regresión lineal

y = a + b · x y = 89,11 + 1,10xPredicciones: x = 62kg→ y = 89,11 + 1,10 · 60 = 155,11cm

Peso

10080604020

Alt

ura

200

175

150

125

100

Página 1

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Regresión múltiple

¿Pueden introducirse más variables explicativas en la ecuación?

y = a + b1x1 + b2x2 + b3x3

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Varianza residual

Mide el error cometido por la recta de regresión

s2y←x =

1n−2

∑ni=1[yi − (a + bxi)]

2 = 1335,32/10

xi yi (a + bxi) [yi − (a + bxi)]2

80 174 176.80 7.8645 152 138.44 183.9463 160 158.17 3.3694 183 192.15 83.7024 102 115.42 180.0575 183 171.32 136.3756 148 150.50 6.2352 152 146.11 34.6961 166 155.98 100.4834 140 126.38 185.5121 98 112.12 199.6678 160 174.61 213.47

1335.32

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Coeficiciente de determinación r2

s2y←x

s2y

= 1− r2xy

1− r2xy indica la proporción de la variabilidad total de Y no

explicada por la regresión.r2

xy expresa lo contrario.

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

r2 = 0,82

Peso

10080604020

Alt

ura

200

175

150

125

100

Página 1

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

r2 ' 0

x

8,006,004,002,00

y

8,00

7,00

6,00

5,00

4,00

3,00

2,00

1,00

Página 1

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

r2 = 0,39

Longitud cabeza

9,0008,7008,4008,1007,800

An

ch

ura

ca

be

za

5,200

5,100

5,000

4,900

4,800

4,700

4,600

4,500

Página 1

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Regresión no lineal

Edad días-Peso embrión: Transformar variables

Edad embrión

16141210

Pe

so

Em

bri

ón

3.000

2.000

1.000

0

Página 1

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Relación entre variables cualitativas

nivel contaminación - salud árbolesCloroplastos

SO2

(3× 3) Alto Medio Bajo TotalAlto 3 4 13 20

Medio 5 10 5 20Bajo 7 11 2 20Total 15 25 20 60

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Vacunación-hepatitisVacunación

Hepatitis

(2× 2) Sí No TotalSí 11 70 81No 538 464 1002Total 549 534 1083

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Gráfico

Barras agrupadas

Nivel de SO2

SO2 bajoSO2 medioSO2 alto

Re

cu

en

to

12,5

10,0

7,5

5,0

2,5

0,0

Gráfico de barras

Cloroplatos bajo

Cloroplastos medio

Cloroplastos alto

Nivel de cloroplastos

Página 1

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Medidas del grado de dependencia

Observados vs Esperados independencia: distancia χ2

χ2exp =

∑i,j

(Oij − Eij)2

Eij

0 ≤ χ2exp ≤ +∞

Coeficiente de contingencia de Pearson C

C =

√χ2

exp

χ2exp + n

0 ≤ C ≤

√q− 1

q, q = min{no filas, no colunas}

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Ejemplo: cloropastosTabla 3× 3. Por lo tanto,

0 ≤ C ≤√

23= 0,816

En este caso concreto,

C = 0,444

Grado de asociación medio

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Independencia C = 0Cloroplastos

SO2

(3× 3) Alto Medio Bajo TotalAlto 5 8.3 6.7 20

Medio 5 8.3 6.7 20Bajo 5 8.3 6.7 20Total 15 25 20 60

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Máxima dependencia C = 0, 816Los valores observados deberían ser éstos:

Cloroplastos

SO2

(3× 3) Alto Medio Bajo TotalAlto 0 0 20 20

Medio 0 20 0 20Bajo 20 0 0 20Total 20 20 20 60

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Cualitativa→ cuantitativa

Grupo

Viven con otras personasViven solos

Pu

ntu

ació

n d

e an

sied

ad d

e H

amilt

on

20,00

18,00

16,00

14,00

12,00

10,00

8,00

5

Página 1

¿Influye el estilo de vida en la ansiedad?

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

¿Influye la acidosis en la glucemia?

Tipo de acidosis

Acidosis MixtaAcidosis MetabólicaAcidosis RespiratoriaControl

Niv

el d

e g

luce

mia

en

el c

ord

ón

um

bili

cal

100,000

90,000

80,000

70,000

60,000

50,000

40,000

Página 1

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Contrastes de hipótesis

H0 : µ1 = µ2 = µ3 = µ4

Parámetros poblacionalesµ denota la media poblacional de una variable cuantitativa

Parámetros muestralesNosotros sólo contamos con los valores típicos (x,s, etc) de unamuestra de cada población.

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables

Regresión-correlaciónTablas de contingencia

Comparación de grupos o tratamientos

Inferencia Estadística

En general, ¿cómo generalizar conclusiones a partir de unamuestra?

Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables