Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
1
UNIVERSIDAD DE CIENCIAS EMPRESARIALES Y SOCIALES
Facultad de Psicología y Ciencias Sociales
Carrera SociologíaCursoCurso
ESTADESTADÍÍSTICA ISTICA IClase 6: AnClase 6: Anáálisis de Correlacilisis de Correlacióón Lineal Simplen Lineal Simple
Prof. Titular: Lic. RubProf. Titular: Lic. Rubéén Josn Joséé RodrRodrííguezguezProf. Adjunta: Lic. Micaela Prof. Adjunta: Lic. Micaela BazzanoBazzano
Segundo Cuatrimestre 2012Segundo Cuatrimestre 2012
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
2
• Comprender las medida de la relación entre varia-bles métricas y variables ordinales
• Diferenciar correlación de causalidad.• Reconocer independencia y dependencia estadística
entre variables.• Interpretar un diagrama de dispersión.• Comprender los conceptos de desvío, varianza y
covarianza.• Calcular el Coeficiente de Correlación ‘r’ de Pearson.• Interpretar el ‘r’ en términos de sus coeficientes
derivados.• Aplicar análisis bivariados con datos 1rios y 2rios.
OBJETIVOS DE APRENDIZAJECorrelación de Correlación Lineal Simple
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
3
Varianza: Medida de dispersión paramétrica, igual a la media de los cuadrados de las devíos (X-M) de los datos de una distribución respecto de la media.Se simboliza con para la población y la muestra
Covarianza: Medida estadística paramétrica que expre-sa el grado de variación conjunta de dos variables.Es la medida de la suma de los productos entre las desviaciones respecto de su media, de los valores de X e Y. La Cov se basa en las unidades de medida origina-les de las dos variables. Por eso no varía entre –1 a +1 , ni se puede comparar. Se standariza dividiendo su fórmula por las , lo que da lugar al Coeficiente de Correlación Producto-Momento ‘r’ de Pearson.
VARIANZA Y COVARIANZA
22xy sX
2 2y X Y
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
4
KARL PEARSON CREADOR DE LA ESTADÍSTICA APLICADA
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
5
COVARIANZA Y FÓRMULA GENERAL DELCOEFICIENTE DE CORRELACIÓN
‘r’ DE PEARSON (a)
x j y1
1(x, y) = ( - ) (Y- )n
n
jj
Cov X
1,
( ) ( )
n
j Jj
x yX y
X X Y Yr
n
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
6
COEFICIENTE DE CORRELACIÓN ‘r’ DE PEARSON (b)
1
*
* *
n
jxy
X Y
X X Y Yr
n
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
7
COEFICIENTE DE CORRELACIÓN ‘r’ DE PEARSON (c)
1,
2 2
1 1
( ) ( )
( ) ( )
n
j jj
x y n n
i ij j
X X Y Yr
X X Y Yn
n n
1 * *xy x yr z zn
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
8
Correlación indica relación recíproca. En Esta-
dística, designa no una relación recíproca, sino
la correspondencia en las pautas de variación
de dos o más variables. La covariación puede
no deberse a una relación de influencia entre
las variables, no implica causalidad.El grado de correlación entre las variables es
medido mediante el cálculo de los coeficientes de correlación.
CORRELACIÓN ENTRE VARIABLES
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
9
Coeficiente de Correlación lineal y paramétrico, que sirve para determinar el grado y signo de la covariación entre dos variables de nivel intervalar.
Puede variar de –1 a +1, indicando la fuerza o intensidad de la relación y el sentido o dirección:
Requiere que las variables se distribuyan normalmente.
Los puntos en el diagrama de dispersión deben ajustarse al modelo de la ecuación de la línea recta.
Y = a + b . X La herogeneidad o dispersión a lo largo de la recta, debe ser
aproximadamente la misma (homocedasticidad).
COEFICIENTE ‘r’ de PEARSON
x,y( 1 r +1)
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
10
Son independientes dos o más variables
cuando la variación de los valores de una varia-
ble no está relacionada con la variación de los
valores de las otras. El ‘r’ es igual a 0.
Dos sucesos son independientes, cuando la
probabilidad de ocurrencia de uno no depende,
o es la misma tenga o no tenga lugar el otro
suceso.
INDEPENDENCIA ESTADÍSTICA
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
11
Variables independientes que en la investigación se
estudian como no dependientes en su variación de
otras variables, sino que, al contrario, mediante ellas
se pretende explicar la variación de las variables de-
pendientes.
Variables dependientes que en su variación, dependen
de otras variables, que determinan el alcance y sentido
de las modificaciones que en ellas se observan. Son las
que se quieren estudiar y explicar en la investigación.
VARIABLES INDEPENDIENTES Y DEPENDIENTES
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
12
Comparación de diagramas de dispersión (Razón alumnos-cargo*NBI)
CicloInicial
CicloEGB
CicloMedio
CicloEspecial
CicloForm. Prof
CicloCEC
CicloCENS
CicloEduc. Art.
CicloSuperior
CicloAdultos
CicloEd. Física
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
13
Coeficiente r: 0,87
Coeficiente r2: 0,75
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
14
Coeficiente r: 0,97
Coeficiente r2: 0,93
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
15
Coeficiente r: 0,94
Coeficiente r2: 0,89
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
16
Coeficiente r: - 0,66
Coeficiente r2: 0,43
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
17
Coeficiente r: 0,15
Coeficiente r2: 0,02
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
18
Coeficiente r: 0,70
Coeficiente r2: 0,48
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
19
Coeficiente r: 0,42
Coeficiente r2: 0,17
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
20
Coeficiente r: 0,42
Coeficiente r2: 0,18
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
21
Coeficiente r: 0,78
Coeficiente r2: 0,60
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
22
Coeficiente r: 0,72
Coeficiente r2: 0,52
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
23
Coeficiente r: 0,19
Coeficiente r2: 0,04
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
24
Comparación de Diagramas de Dispersión (Puntajes de Tests Mentales y de Rendimiento
Lector de 36 alumnos de EGB)Nivel intelectual
* Madurez lectoraNivel intelectual* Comprensión
Nivel intelectual* Memoria General
Nivel intelectual* Cálculo
Madurez lectora* Velocidad lectora
Velocidad lectora* Comprensión
Nivel de vocabulario* Comprensión
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
25
Coeficiente r: 0,70
Coeficiente
r2: 0,49
4 8
Madurez Lectora
Nivel Intelectual
18 4317 307 1812 2315 196 227 2610 209 194 182 127 1720 299 2210 2013 2511 152 1116 338 283 249 204 132 1419 2714 2215 289 198 1811 2010 2013 2410 214 1810 103 14
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
26
Ejercicio SPSS-Regresión SimpleFichero ALTURA
Analizar > Correlaciones > Bivariadas
1 ,962**. ,000
339 339,962** 1,000 .339 339
Correlación de PearsonSig. (bilateral)NCorrelación de PearsonSig. (bilateral)N
Edad del CHICO
Altura del CHICO
Edad delCHICO
Altura delCHICO
La correlación es significativa al nivel 0,01 (bilateral).**.
Coeficiente de Correlación “r” de PearsonMatriz de Correlaciones
Fuente: Etxcheberría, Juan (1999). Regresión Múltiple, Cuadernos de Estadística nº 4, Madrid: Editorial La Muralla-Hespérides.
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
27
Ejercicio SPSS-Regresión SimpleFichero ALTURA
Analizar > Regresión > LinealVariables introducidas/eliminadasb
Edad delCHICO
a . Introducir
Modelo1
Variablesintroducidas
Variableseliminadas Método
Todas las variables solicitadas introducidasa.
Variable dependiente: Altura del CHICOb.
Resumen del modelo
,962a ,926 ,925 6,927Modelo1
R R cuadradoR cuadradocorregida
Error típ. de laestimación
Variables predictoras: (Constante), Edad del CHICOa.
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
28
Ejercicio SPSS-Regresión SimpleFichero ALTURA
Analizar > Regresión > LinealIdentificación de casos atípicos (outliers)
Diagnósticos por casoa
-3,009 154 174,85 -20,85-4,209 151 180,16 -29,16-3,776 154 180,16 -26,16
Número de caso290324330
Residuo tip.Altura delCHICO
Valorpronosticado Residuo bruto
Variable dependiente: Altura del CHICOa.
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
29
Ejercicio SPSS-Regresión SimpleFichero ALTURA
Analizar > Regresión > Lineal
ANOVAb
201226,814 1 201226,814 4193,343 ,000a
16171,687 337 47,987217398,501 338
RegresiónResidualTotal
Modelo1
Suma decuadrados gl
Mediacuadrática F Sig.
Variables predictoras: (Constante), Edad del CHICOa.
Variable dependiente: Altura del CHICOb.
Coeficientesa
89,900 ,903 99,586 ,0005,309 ,082 ,962 64,756 ,000
(Constante)Edad del CHICO
Modelo1
B Error típ.
Coeficientes noestandarizados
Beta
Coeficientesestandarizad
ost Sig.
Variable dependiente: Altura del CHICOa.
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
30
Ecuación de regresión: ESTATURA = f (EDAD)Coeficientesa
89,900 ,903 99,586 ,0005,309 ,082 ,962 64,756 ,000
(Constante)Edad del CHICO
Modelo1
B Error típ.
Coeficientes noestandarizados
Beta
Coeficientesestandarizad
ost Sig.
Variable dependiente: Altura del CHICOa.
1 1
0 1 1
**
i
i
Y a b XY b b X
Y1 = 89,00+5,309*X1 = 89,00+5,309*EDAD=
ESTATURA=89,00+5,309*12 años= 152,7 08 cm.
Yc = Y´= 152,708 cm.
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
31
Ecuación de estimación de ESTATURA verdadera
Yc = 143 cm. ± 1,96 * 6,927 = 143 ± 13,577=
Límite Inferior: ESTATURA (estimada) = 143-13,577 = 129, 423 cm.
Límite Superior: ESTATURA (estimada) = 143+13,577 = 156,577 cm.
Resumen del modelo
,962a ,926 ,925 6,927Modelo1
R R cuadradoR cuadradocorregida
Error típ. de laestimación
Variables predictoras: (Constante), Edad del CHICOa.
1,96 *Xc o YY Y z S
152,708 cm. ESTATURA estimada por la Ecuación de Regresión en función de EDAD
143 cm. Media Aritmética de los n = 339 chicos de 2 a 17 años.
158,60 cm. Media Aritmética de los n = 20 chicos de 12 años.
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
32
Gráfico ConvencionalDiagrama de Dispersión Simple
ALTURA del chico según
la EDAD del chico
Edad del CHICO
181614121086420
Altu
ra d
el C
HIC
O200
180
160
140
120
100
80
Etx
eber
ría, R
afaé
l (19
99).
Reg
resi
ón M
últip
le.
Cua
dern
os d
e E
stad
ístic
a n°
4. M
adrid
:E
dito
rial H
espé
rides
-La
Mur
alla
, pp.
6-5
1
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
33
Gráfico InteractivoRecta de Regresión Lineal Simple
Regresión lineal
4 8 12 16
Edad del CHICO
100
125
150
175
Altu
ra d
el C
HIC
O
A
AAAA
AAAA
AAAAAA AAA
AAAA
A
AAA
A
AA
AA
AAAAAAAA
A
A
AAA
AAAA
AAAAAAA
AAAA
A
AAA
A
AAA
AAA
A
A
A AA
AAAA
AAA
A
A
AAA
A
AAA
AAA
A
AAA
A
AAA
A
AAAA
A
AA
AAAA
AA
A
A
AA
AA
A
AA
A
AA
A
AA
A
AAA
A
AA
AAAA
AA
A
A
A
AAAAA
A
AAA
A
AAA
A
AAAA
AAA
A
AAA
A
AA
A
A
AAAA
A
AA
A
A
AAA
AAAAAA
A
AA
A
A
A
AAAAA
A
AAAA
AA
A
AAA
AA
AAA
A
A
AAAA
A
AAAA
A
A
AA
AA
AAAAA
AA
A
A
AAAA
AA
A
A
AAA
AA
A
A
AA
AA
AA
AAA
AAAA
A
AA
A
A
AA
A
A
A
AA
A
A
AA
A
A
A
A
AAA
A
A
A
AAA
A
A
A
A
A
A
A
A
A
AA
AA
A
AA
A
A
A
A
AA
AA
A
AA
AA
AA
AAA
290324330
1Altura del CHICO = 89,90 + 5,31 * edadR-cuadrado = 0,93
ALTURA del chico en funcion de la EDAD del chico
Etx
eber
ría, R
afaé
l (19
99).
Reg
resi
ón M
últip
le.
Cua
dern
os d
e E
stad
ístic
a n°
4. M
adrid
:E
dito
rial H
espé
rides
-La
Mur
alla
, pp.
6-5
10 1 1*iY b b X
ESTATURA=89,00+5,309*12 años= 152,708 cm.
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
34
Gráfico InteractivoRecta de Regresión Lineal Simple.
Suma de Cuadrado Total2( )oSCT Y Y
Etx
eber
ría, R
afaé
l (19
99).
Reg
resi
ón M
últip
le.
Cua
dern
os d
e E
stad
ístic
a n°
4. M
adrid
:E
dito
rial H
espé
rides
-La
Mur
alla
, pp.
6-5
1 ALTURA del chico en funcion de la EDAD del chicoMedia
4 8 12 16
Edad del CHICO
100
125
150
175
Altu
ra d
el C
HIC
O
A
AAAA
AAAA
AAAAAA AAA
AAAA
A
AAA
A
AA
AA
AAAAAAAA
A
A
AAA
AAAA
AAAAAAA
AAAA
A
AAA
A
AAA
AAA
A
A
A AA
AAAA
AAA
A
A
AAA
A
AAA
AAA
A
AAA
A
AAA
A
AAAA
A
AA
AAAA
AA
A
A
AA
AA
A
AA
A
AA
A
AA
A
AAA
A
AA
AAAA
AA
A
A
A
AAAAA
A
AAA
A
AAA
A
AAAA
AAA
A
AAA
A
AA
A
A
AAAA
A
AA
A
A
AAA
AAAAAA
A
AA
A
A
A
AAAAA
A
AAAA
AA
A
AAA
AA
AAA
A
A
AAAA
A
AAAA
A
A
AA
AA
AAAAA
AA
A
A
AAAA
AA
A
A
AAA
AA
A
A
AA
AA
AA
AAA
AAAA
A
AA
A
A
AA
A
A
A
AA
A
A
AA
A
A
A
A
AAA
A
A
A
AAA
A
A
A
A
A
A
A
A
A
AA
AA
A
AA
A
A
A
A
AA
AA
A
AA
AA
AA
AAA
290324330
Media = 143
Carrera de SociologíaAutor: Lic. Rubén José Rodríguez
35
Gráfico InteractivoRecta de Regresión Lineal Simple.
Intervalo de Confianza de la Ecuación del estimación de YcE
txeb
erría
, Raf
aél (
1999
). R
egre
sión
Múl
tiple
.C
uade
rnos
de
Est
adís
tica
n° 4
. Mad
rid:
Edi
toria
l Hes
périd
es-L
a M
ural
la, p
p. 6
-51
Regresión lineal conIntervalo de predicción individual al 95,00%
4 8 12 16
Edad del CHICO
100
125
150
175
Altu
ra d
el C
HIC
O
A
AAAA
AAAA
AAAAAA AAA
AAAA
A
AAA
A
AA
AA
AAAAAAAAA
A
AAA
AAAA
AAAAAAA
AAAA
A
AAA
A
AAA
AAA
A
A
A AA
AAAA
AAA
A
A
AAA
A
AAA
AAA
A
AAA
A
AAA
A
AAAA
A
AA
AAAA
AA
A
A
AA
AA
A
AA
A
AA
A
AA
A
AAA
A
AA
AAAA
AA
A
A
A
AAAAA
A
AAA
A
AAA
A
AAAA
AAA
A
AAA
A
AA
A
A
AAAA
A
AA
A
A
AAA
AAAAAA
A
AA
A
A
A
AAAAA
A
AAAA
AA
A
AAA
AA
AAA
A
A
AAAA
A
AAAA
A
A
AA
AA
AAAAA
AA
A
A
AAAA
AA
A
A
AAA
AA
A
A
AA
AA
AA
AAA
AAAA
A
AA
A
A
AA
A
A
A
AA
A
A
AA
A
A
A
A
AAA
A
A
AAAA
A
A
A
A
A
A
A
A
A
AA
AA
A
AA
A
A
A
A
AA
AA
A
AA
AA
AA
AAA
290324330
1Altura del CHICO = 89,90 + 5,31 * edadR-cuadrado = 0,93
ALTURA del chico en funcion de la EDAD del chico
Y∞ = 152,708 cm. ± 1,96 * 6,927 = 152,708 ± 13,577=139,131
166,357
1,96 *xc yY Y z S