35
Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De Investigación Grupo No. 10 Seminario Integrador Profesional

Regresión y Correlación

Embed Size (px)

DESCRIPTION

Temas financiero de mucha ayuda

Citation preview

Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10

Seminario Integrador Profesional

Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10

INDICEPág.

Introducción........................................................................................................................i

Distribuciones Bidimensionales........................................................................................1

Idea De Correlación...........................................................................................................1

Nube De Puntos O Diagrama De Dispersión....................................................................1

Correlación Lineal Y Recta De Regresión........................................................................2

Medida De La Correlación................................................................................................4

Estimación Mediante La Recta De Regresión...................................................................5

Propiedades De La Recta De Regresión De Los Mínimos Cuadráticos...........................6

Mapa De Esparcimiento O Nube De Puntos.....................................................................6

Analisis De Regresión.......................................................................................................7

Tipos Análisis De Regresión.............................................................................................7

Regresión Lineal Simple...................................................................................................7

Fórmulas Para Encontrar "A" Y "B":...............................................................................8

Diagrama De Esparcimiento, Nube De Puntos O Mapa De Dispersion:.........................8

Error Estandar De Regresión:............................................................................................8

Hay Dos Formas De Calcularlo:........................................................................................9

Intervalo De Confianza:....................................................................................................9

Analisis De Correlacion..................................................................................................14

Símbolo " R”...............................................................................................................14

Tipos De Correlación......................................................................................................14

Correlación Perfectamente Positiva...............................................................................14

Correlación Perfecta Negativa.........................................................................................15

Correlación Irregular O Nula.........................................................................................15

Coeficiente De Determinación.......................................................................................16

Coeficiente De Correlación.............................................................................................16

Ejercicio...........................................................................................................................17

Conclusiones....................................................................................................................20

Recomendaciones............................................................................................................21

Bibliografía......................................................................................................................22

Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10

INTRODUCCIÓN

Parte de la Estadística corresponde a la Estadística Inferencial y dentro de ella los

capítulos de correlación y regresión son muy usados en la Investigación Científica, una

herramienta muy útil cuando se trata de relacionar 2 o más variables, relacionadas entre

sí, como por ejemplo., el nivel de hemoglobina y embarazo en el ámbito de las Ciencias

de la Salud, la Correlación implica el grado de dependencia de una variable respecto a

otra y la Regresión es otra técnica que ayuda en la investigación de la salud Psicología

costos de una Empresa etc.

El Análisis de Regresión Lineal y La Correlación nos permite establecer la relación que

se produce entre una variable dependiente Y y un conjunto de variables independientes

(X1, X2,... XK). El análisis de regresión lineal múltiple, a diferencia del simple, se

aproxima más a situaciones de análisis real puesto que los fenómenos, hechos y

procesos sociales, por definición, son complejos y, en consecuencia, deben ser

explicados en la medida de lo posible por la serie de variables que, directa e

indirectamente, participan en su concreción.

Al aplicar el análisis de regresión múltiple lo más frecuente es que tanto la variable

dependiente como las independientes sean variables continuas medidas en escala de

intervalo o razón. No obstante, caben otras posibilidades: (1) también podremos aplicar

este análisis cuando relacionemos una variable dependiente continua con un conjunto de

variables categóricas; (2) o bien, también aplicaremos el análisis de regresión lineal

múltiple en el caso de que relacionemos una variable dependiente nominal con un

conjunto de variables continuas

Seminario Integrador Profesional Página i

Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10

DISTRIBUCIONES BIDIMENSIONALES

“Cuando sobre una población estudiamos simultáneamente los valores de dos variables

estadísticas, el conjunto de los pares de valores correspondientes a cada individuo se

denomina distribución bidimensional.

Ejemplo 1:

Las notas de 10 alumnos en Matemáticas y en Lengua vienen dadas en la siguiente

tabla:

MATEMÁTICAS 2 4 5 5 6 6 7 7 8 9

LENGUA 2 2 5 6 5 7 5 8 7 10

Los pares de valores {(2,2), (4,2), (5,5),...;(8,7), (9,10)}, forman la distribución

bidimensional.

IDEA DE CORRELACIÓN

Es frecuente que estudiemos sobre una misma población los valores de dos variables

estadísticas distintas, con el fin de ver si existe alguna relación entre ellas, es decir, si

los cambios en una de ellas influyen en los valores de la otra. Si ocurre esto decimos

que las variables están correlacionadas o bien que hay correlación entre ellas.

En el ejemplo anterior parece que hay cierta tendencia a que cuanto mejor es la nota en

Matemáticas, mejor es la de lengua.

NUBE DE PUNTOS O DIAGRAMA DE DISPERSIÓN

La primera forma de describir una distribución bidimensional es representar los pares de

valores en el plano cartesiano. El gráfico obtenido recibe el nombre de nube de puntos o

diagrama de dispersión.

Seminario Integrador Profesional Página 1

Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10

CORRELACIÓN LINEAL Y RECTA DE REGRESIÓN.

Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan

cerca de alguna curva. Aquí nos limitaremos a ver si los puntos se distribuyen alrededor

de una recta. Si así ocurre diremos que hay correlación lineal. La recta se denomina

recta de regresión.

Hablaremos de correlación lineal fuerte cuando la nube se parezca mucho a una recta y

será cada vez más débil (o menos fuerte) cuando la nube vaya desparramándose con

respecto a la recta.

En el gráfico observamos que en nuestro ejemplo la correlación es bastante fuerte, ya

que la recta que hemos dibujado está próxima a los puntos de la nube.

Seminario Integrador Profesional Página 2

Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10

Cuando la recta es creciente la correlación es positiva o directa: al aumentar una

variable, la otra tiene también tendencia a aumentar, como en el ejemplo anterior.

Cuando la recta es decreciente la correlación es negativa o inversa: al aumentar una

variable, la otra tiene tendencia a disminuir.

Ejemplo 2:

Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50

preguntas. En la gráfica se describen el nº de errores que corresponden a los intentos

realizados.

Observa que hay una correlación muy fuerte (los puntos están "casi" alineados) y

negativa (la recta es decreciente).

Ejemplo 3:

A 12 alumnos de un centro se les preguntó a qué distancia estaba su residencia del

Instituto, con fin de estudiar si esta variable estaba relacionada con la nota media

obtenida. Se obtuvieron los datos que figuran en la siguiente tabla:

Distancia (en km) 0,05 0,1 0,12 0,4 0,5 0,7 1 1,2 2,1 2,5 3 3

Nota media 8,4 4 5,7 9,1 6,3 6,7 4,3 5,4 7,8 4,5 7,2 8,1

Seminario Integrador Profesional Página 3

Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10

Observamos una nube de puntos que no nos sugiere ninguna recta concreta, porque la

correlación es prácticamente inexistente, es decir, no tiene nada que ver con el

rendimiento académico la distancia del domicilio al instituto,

MEDIDA DE LA CORRELACIÓN

La apreciación visual de la existencia de correlación no es suficiente. Usaremos un

parámetro, llamado coeficiente de correlación que denotaremos con la letra r, que nos

permite valorar si ésta es fuerte o débil, positiva o negativa.  

El cálculo es una tarea mecánica, que podemos realizar con una calculadora o un

programa informático. Nuestro interés está en saber interpretarlo.

Antes de ponernos a trabajar destacaremos una de sus propiedades

-1 < r < 1

A continuación tienes unos ejes con una nube de puntos que puedes modificar haciendo

clic sobre ellos con el ratón y arrastrándolos. No tengas miedo de equivocarte, siempre

puedes volver a la posición inicial pulsando el botón inicio. Las coordenadas de los

puntos las puedes saber con aproximación naciendo clic en cualquier punto del plano y

arrastrando hasta colocarte encima del punto.

Observa el valor de r, así como el ajuste de la nube a la recta. Intenta deducir las

propiedades de r, relacionando su valor con la forma de la nube y realizando los

siguientes ejercicios.

Seminario Integrador Profesional Página 4

Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10

1. Acerca los puntos a la recta. ¿Hacia qué valor se aproxima r?

2. Aleja los puntos de la recta, separándolos entre sí ¿Hacia qué valor se aproxima

r?

3. Mueve los puntos hasta que la recta tenga pendiente negativa, es decir, sea

decreciente. En estas condiciones contesta a las preguntas anteriores.

4. Si alineas todos los puntos ¿Qué valor  aproximadamente toma r?

Anota tus conclusiones en tu cuaderno; puedes ayudarte con el siguiente esquema:

ESTIMACIÓN MEDIANTE LA RECTA DE REGRESIÓN

Es evidente que no todos dibujaríamos exactamente la misma recta para una nube de

puntos, aunque la correlación fuera bastante fuerte.

De todas las rectas posibles los matemáticos han elegido como la mejor aproximación la

llamada de los mínimos cuadráticos, Su cálculo es también algo mecánico que podemos

hacer con calculadora o un ordenador. En el siguiente apartado encontrarás un ejercicio

para estudiar sus propiedades. 

La recta de regresión sirve para hacer estimaciones, teniendo en cuenta que:

Los valores obtenidos son aproximaciones en términos de probabilidad: es

probable que el valor correspondiente a x0 sea y0.

La fiabilidad es mayor cuanto más fuerte sea la correlación.

La fiabilidad aumenta al aumentar el número de datos.

La estimación es más fiable para los valores de x próximos a la media.

Ejemplo 1:

Con los datos del primer ejemplo, (las notas de 10 alumnos en Matemáticas y en

Lengua), podemos contestar con aproximación a la siguiente cuestión: si un alumno no

realizó el examen de lengua, pero sí el de matemáticas, obteniendo un 7, ¿qué nota cabe

esperar que obtuviera en lengua?

MATEMÁTICAS 2 4 5 5 6 6 7 7 8 9

Seminario Integrador Profesional Página 5

Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10

LENGUA 2 2 5 6 5 7 5 8 7 10

Observa el punto amarillo, cuya abscisa corresponde a la nota de matemáticas y su

ordenada a la nota que esperamos que tenga en lengua. Es resultado es aproximado y

relativamente fiable, ya que la correlación es fuerte Y el valor de la nota no está muy

próximo a la media, aunque el nº de datos que tenemos no es muy alto.

Puedes cambiar el valor de la nota de matemáticas sin más que cambiar su valor en el

recuadro de la parte inferior.

PROPIEDADES DE LA RECTA DE REGRESIÓN DE LOS MÍNIMOS CUADRÁTICOS.

En la siguiente escena puedes comprobar las principales propiedades de la recta de

regresión mínimo-cuadrática.

1. Observa la recta blanca, cuyos coeficientes a y b puedes hacer variar en los

recuadros inferiores de la escena, bien con las flechas o introduciendo los

valores deseados. Observa los segmentos denominados di, que marcan las

distancias de los puntos de la nube a la recta en la dirección del eje OY”. i

MAPA DE ESPARCIMIENTO O NUBE DE PUNTOS

“Esla representación grafica del predictor y el predictando o sea de las variables

consideradas, es decir los datos de dos variable, marcadas en un grafica. Como primer

punto cuando se cuenta con dos variables, es representarlas gráficamente porque esto

permite tener una apreciación visual del comportamiento lineal o no; también se puede

apreciar si su comportamiento es positivo o negativo, importante porque si es negativo

el valor del coeficiente de regresión “b” en la ecuación de regresión tendrá signo

negativo.

i..http://recursostic.educacion.es/descartes/web/materiales_didacticos/

Correlacion_regresion_recta_regresion/correlacion_y_regresion.htm. Verificado el

27/09/2011.

Seminario Integrador Profesional Página 6

Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10

ANALISIS DE REGRESIÓN

Es la técnica mas usada en investigación económica y comercial para buscar una

relación entre 2 o más variables ligadas de un modo causal. Consiste en general en: una

función a partir de datos o información conocida para hacer estimaciones.

TIPOS ANÁLISIS DE REGRESIÓN

a) REGRESION LINEAL SIMPLE: Se refiere al análisis de 2 variables.

b) REGRESION MULTIPLE: Cuando se relacionan 3 o más variables.

REGRESIÓN LINEAL SIMPLE

Seminario Integrador Profesional Página 7

VALOR DE COMSUMO DE COMBUSTIBLE Q.

KMSRECORRIDOS

Y275 300260 290310 325400 400425 410

Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10

Para este análisis es necesario ajustar los datos a una línea recta, para poder estimar una

variable con relación a otra. Para esto utilizamos la ecuación de la línea recta:

Y = a+ bx ===® yc = a+ bx = Ecuación de Regresión

Donde:

Yc = Variable estimada o calculada.

a y b = Coeficientes de regresión.

X = Variable que sirve para estimar la otra variable. Predictor en base a ella

se estima el predictando. (Variable Independiente).

Y = Constituye la Variable a estimar y recibe el nombre de Predictando.

(Variable Dependiente).

Ecuaciones Normales: å Y = n.a + b å X

å XY = åX a + b å X2

FÓRMULAS PARA ENCONTRAR "a" y "b":

a = åæx2ö (åyö - åæxåæöxyö

nåx2 - åæxö 2

b = nåxy - åæxåæöyö

nåxy2 - åæxö 2

DIAGRAMA DE ESPARCIMIENTO, NUBE DE PUNTOS O MAPA DE DISPERSION:

Es la representación gráfica del Predictor y el predictando. Es una gráfica que nos

muestra la forma en que los puntajes de dos variables cualquiera X y Y están dispersas.

Así a cada elemento de una muestra de tamaño N se le puede hacer corresponder un

par de números. Los números de cada par son las medidas o valores correspondientes a

determinadas características o aspectos que tienen los elementos de la muestra. El

diagrama de esparcimiento es la representación gráfica de los valores "X" y "Y"

A continuación se presentan 4 tipos de gráficas que muestran los tipos de

relaciones lineales:

RELACION LINEAL ASCEDENTE

Seminario Integrador Profesional Página 8

Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10

RELACION LINEAS DESCENDENTE

RELACION LINEAL CURVILÍNEA

RELACION LINEAL CONSTANTE

ERROR ESTANDAR DE REGRESIÓN:

(SÍMBOLO Syx) Mide el grado de error de las estimaciones alrededor de la línea de

regresión; si este es igual a cero ( 0 ) se dirá que existe una estimación perfecta.

Propiedades de Syx;

Yc, +, - Syx = Agrupa aproximadamente al

68.26% de los datos.

Yc , +, - 2 (Syx) = Agrupa aproximadamente al

95.46% de los datos.

Yc , +, - 3 (Syx) = Agrupa aproximadamente al

99.72% de los datos.

Hay dos formas de calcularlo:

1.) Varianza no explicada (ve)

___________

Syx = å (y- yc)

N

2.) Formula general

Syx = å y2 - åy a - åXY b

N

INTERVALO DE CONFIANZA:

Yc = Z+,- Syx

APLICACIÓN: Al tabular los costos Unitarios y la producción de una empresa

industrial durante el año anterior, se encontró el siguiente comportamiento:

COSTO POR PROD EN MILES

Seminario Integrador Profesional Página 9

Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10

UNIDAD DE UNIDADESQ 1.00 20Q. 2.00 15Q 3.00 12Q. 4.00 11Q. 5.00 7

1.) Con los datos tabulados de la contabilidad de la empresa se pide: Elaborar la representación gráfica sabiendo que la empresa desea estimar su producción.

0

5

10

15

20

25

0 2 4 6

Costo Unitario

Pro

du

cció

n (

Miles Q

)

Serie1

DESARROLLO:

DATOS N = 5åx = 15 åy = 65åx2 = 55åy2 = 939åxy = 165

2). Encuentre la Ecuación de Regresión del comportamiento de la producción en

función de los costos unitarios

65 = 5 a + 15b (-3) Factor que multiplica a la Ec. -195 = -15a -45bb = -30 b= -3

165 = 15 a + 55b 165 = 15a +55b 10

Seminario Integrador Profesional Página 10

x y x2 y2 xy

1 20 1 400 20

2 15 4 225 30

3 12 9 144 36

4 11 16 121 44

5 7 25 49 35

15 65 55 939 165

Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10

-30 = 10B

Encontrar "a":65 = 5 a + 15 (-3) Valor de “b”

65 = 5 a - 45-5 a = -65 – 45a = -110 = a = 22

-5La Ecuación de regresión de la Producción en función de los costos = Y = 22 – 3x

3.) OBTENER "a" y "b" por Fórmula:a = (åx2 ) (åy) – (åx) (åxy) nå x2 - (åx)2

b = n åxy - (åx) (åy) n åx2 - (åx) 2

a = ( 55 ) (65) – (15) (165) = 3575 – 2475 = 1100 a = 22 5 (55) - (15) 2 275 - 225 50

b = 5 (165) – (15) (65) = 825 – 975 = -150 b = -3 5 (55) - (15) 2 275 – 225 50

4.) El Departamento de Ventas de la empresa solicita le indique qué número de

unidades puede producir el presente año, si según estudios se considera que su

costo unitario será igual a Q.3.75

Y = a + bx Yc = 22 – 3 (3.75)Yc = 22 – 11.25 = 10.75

5.) CALCULAR EN ERROR ESTANDAR DE REGRESION;

Syx = å y2 - åy.a - åxy.b N

Syx = 939 – 22 ( 65) – (-3) 165 5

Syx = 939 – 1430 + 495 = 4 5 5

Seminario Integrador Profesional Página 11

Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10

Syx = 0.894427191

Yc Yc=22-3x (y-Yc) (y-Yc)2

19 22 - 3 (1) 1 1

16 22 - 3 (2) -1 1

13 22 - 3 (3) -1 1

10 22 - 3 (4) 1 1

7 22 - 3 (5) 0 0

65 xxxx 0 4

Otra forma:Syx = å (y- yc)2 N ___________Syx = 4 5Syx = 0.894427191 6.) Estimar por intervalo la producción para costo de Q.6.00 con un 85% de

confianza

yc = a +bx 4 +, - 1.43 (0.89442719)

yc = 22 +-3 (6) 4 + 1.28 = 5.28

yc = 22 – 18 4 – 1.28 = 2.72

yc = 4

La producción estimada para costos de Q 6.00 oscila entre 2.72 y 5.28 miles de

unidades.

7.) Según el presupuesto de la empresa para el presente año su producción

alcanzará la suma de 11,500 unidades. ¿Se quiere saber a qué costo debe producir

?. En ejemplos anteriores en base al costo se estima la producción, en este caso es a

la inversa. Entonces, para el desarrollo de este caso se invierte la fórmula original Yc

= a + bx por la siguiente: Xc = a + by

Así como las ecuaciones normales, las cuales quedan así:

å x = n. A + å yb

å xy = å y a + å y2b

Seminario Integrador Profesional Página 12

Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10

15 = 5a + 65b (-13)

165 = 65a + 939b

-195 = - 65a - 845b

165 = 65a + 939b

-30 94b

b = -30 b = -0.31915

94

Encontrar el valor de "a":

15 = 5 a + 65 ( -0.31915 ) ® 15 = 5 a – 2074475

-5 a = -15 – 20.74475 ® -5 a = -35.74475

a = 7.14895

La Ecuación de los costos en función de la producción queda:

X = 7.14895 - 0.31915y

Costos a que debe producir:

Xc = 7.14895- 0.31915 ( 11.5)

Xc = 3.48

8.) Con las ecuaciones de regresión de la producción en función de los costos

unitarios y los costos unitarios en función de la producción, encontrar el promedio

del costo por unidad y el costo promedio.

Las ecuaciones encontradas son:

Y=22–3x

X = 7.1489 – 0.319148y

Las colocamos en orden:

y = 22.0000 – 3x

0.319148y = 7.1489 - x (-3) Se multiplica por este valor la 2ª. Ecuación

y = 22.0000 – 3x

-0.9574y = -21.4467 + 3x

0.0426y = 0.5533

Y = 0.5533 = 12.9882 Y = 13 Producción

Seminario Integrador Profesional Página 13

Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10

0.0426 Promedio

Comprobación: Y = 65 = 13

5

Costo Promedio:

Y= 22-3X = 13 = 22 – 3 (X)

3X = 22 – 13

3X = 9

X = 3

Comprobación X = 15 = 3

5

ANALISIS DE CORRELACION

Mide el grado de asociación de dos o más variables. La correlación también se puede

usar por si misma para medir el grado de asociación de dos variables.

SÍMBOLO " r”

Si r es igual a 0 = no existe correlación

Si r mayor que 0 = correlación positiva

Si r menor que 0 = correlación negativa

Si r es igual a menos 1 = correlación perfecta negativa

Si r es igual a uno = correlación perfecta positiva.

Entonces los límites o extremos del coeficiente de correlación son –1y 1.

TIPOS DE CORRELACIÓN

a.) Por el comportamiento de las variables: positiva, negativa y nula o irregular

B) por el numero de variables: simple, múltiple y parcial

CORRELACIÓN PERFECTAMENTE POSITIVA

Aumenta una variable y la otra también aumenta o a la inversa.

Precio Ingresos

Seminario Integrador Profesional Página 14

Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10

Venta (x) (y) 1.0 10.00

2.0 12.00 3.0 14.004.0 16.005.0 18.0015 70.00

================= Mapa de Dispersión

Correlación perfecta positiva r = 1

CORRELACIÓN PERFECTA NEGATIVA

Una variable aumenta la otra disminuye.

Costo UnidsUnidad Vendidas(x) (y)18.00 160.00 16.00 180.0015.00 190.0014.00 200.0013.00 210.0076.00 940.00===================

Mapa de Dispersión Correlación perfecta negativa r = -1

Seminario Integrador Profesional Página 15

Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10

CORRELACIÓN IRREGULAR O NULA

No sabemos el compartimiento de la variable, Eje. Aumentamos costo, las ventas

puede que aumenten o disminuyan.

Precios Ingresos(y)1.00 11.00 2.00 9.003.00 2.004.00 15.005.00 8.0015.00 45.00

===================

Mapa de Dispersión

No hay correlación r = 0

COEFICIENTE DE DETERMINACIÓN

Es la forma primaria por la cual se puede medir la extensión o fuerza, de la asociación

que existe entre 2 variables X y Y.

r2 = a (åy) + b (åxy) - n ( y )2

Seminario Integrador Profesional Página 16

Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10

åy2 - n ( y )2

COEFICIENTE DE CORRELACIÓN

Sirve para medir la relación entre dos variables. Es la segunda medida que se pueda

usar para describir lo bien que una variable se explica por otra. Cuando se está

tratando de muestras, el coeficiente de correlación se denota por “1” y es la raíz

cuadrada del coeficiente de determinación muestral .

Fórmula

.r = r2

o bien:

.r = a (åy) + b (åxy) - n ( y promedio)2 åy2 - n (y promedio)2

APLICACIÓN:

Con los datos del ejemplo que se ha desarrollado en el Análisis de Regresión,

calcular la forma en que primariamente se relacionan las variables:

r2 = a (åy) + b (åxy) - n ( y promedio)2 åy2 - n (y promedio)2

.r 2= 65 (22) + 165 (-3) - 5 ( 13)2 939 - 5 (13)2

.r2 = 0.957447

A continuación calcular el grado de asociación entre las dos variables, (la fuerza o

extensión en que se asocian las variables):

r = 0.957447

r = 0.978492Por ser “r” mayor que cero se dice que la correlación es positiva”.ii

ii Libro de Estadística I Guía de Estudio, José Luis Reyes Donis, Catedrático de

Estadística, facultad de ciencias economías, Segunda Edición, Pág. 189 a 201.

Seminario Integrador Profesional Página 17

Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10

EJERCICIO

La empresa “Chapín” le proporciona a usted como asesor financiero de la empresa la

siguiente información en miles de quetzales:

Años 1 2 3 4 5

Costos 50 60 65 70 90

Ventas (Q. miles) 65 70 75 85 105

Se pide:

a) Determinar la ecuación de regresión para estimar las ventas;

b) Determinar las ventas para un costo de Q. 120,000.00;

c) Determinar el grado de asociación entre las dos variables;

d) Interpretar el coeficiente hallado en el inciso anterior; y

e) El error estándar de estimación.

n Costos (x) Ventas (y) xy x2 y21 50 65 3250 2500 42252 60 70 4200 3600 49003 65 75 4875 4225 56254 70 85 5950 4900 72255 90 105 9450 8100 11025

335 400 27725 23325 33000

a) Ecuación de regresión

a = (Σx) ( Σ xy) – (Σy) (Σx2)(Σ x)2 – n(Σx2)

a = (335) ( 27725) – (400) (23325)(335)2 - 5 (23325)

a = -42125-4400

a = 9.57

Seminario Integrador Profesional Página 18

Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10

b = (400) (335) – 5 (27725)(335)2 - 5 (23325)

b = -4625-4400

b = 1.05

Yc = 9.57 + 1.05 X

b) Ventas para un costo de Q 120,000.00

Y (20,000) = 9.57 + 1.05

(120)

Y (20,000) = 135.71

c) Grado de asociación de las variables

Ŷ = 400=

805

r = a (Σ y) + (b)(Σ xy) – n(Ŷ)2

(Σ y2) – n(Ŷ )2

r =(9.57) (400) + (1.05) (27725) – (5)

(80)2

(33000) – (5) (80)2

r = 972.3011361000

r = 0.97230114

r = 0.9861

Seminario Integrador Profesional Página 19

b = (Σy) ( Σ x) – n (Σxy) (Σ x)2 – n(Σx2)

Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10

d) Interpretación del coeficiente de correlación

Coeficiente de correlación positivo, lo que implica que al aumentar una variable

(Costos) la otra (Ventas) también aumenta.

e) Error Estándar de Estimación

Syx = ∑ y2 – a ∑ y – b ∑ xyN

Syx =(33000) – (9.57) (400) – (1.05)

(27725)5

Syx = 60.755

Syx = 12.15

Syx = 3.49

Seminario Integrador Profesional Página 20

Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10

CONCLUSIONES

La correlación es frecuente que estudiemos sobre una misma población los valores

de dos variables estadísticas distintas, con el fin de ver si existe alguna relación

entre ellas.

La primera forma de describir una distribución bidimensional es representar los

pares de valores en el plano cartesiano.

Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan

cerca de alguna curva.

El análisis de regresión es la técnica más usada en investigación económica y

comercial para buscar una relación entre 2 o más variables ligadas de un modo

causal.

Seminario Integrador Profesional Página 21

Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10

RECOMENDACIONES

Al realizar estimar una variable con base a la otra se trata de regresión y si se desea

conocer la relación existente entre variables entonces se refiere al tema de

correlación.

La regresión y correlación son una herramienta estadística para la toma de

decisiones por tal motivo nos proporcionan indicadores que nos lleva a conocer el

comportamiento de una variable a otra, la cual de esta manera obtendremos los

resultados esperados.

Seminario Integrador Profesional Página 22

Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10

REFERENCIAS BIBLIOGRÁFICAS

Seminario Integrador Profesional Página 23