34
Correlación De Wikipedia, la enciclopedia libre Saltar a: navegación , búsqueda Para otros usos de este término, véase Correlación (desambiguación) . En probabilidad y estadística , la correlación indica la fuerza y la dirección de una relación lineal y proporcionalidad entre dos variables estadísticas . Se considera que dos variables cuantitativas están correlacionadas cuando los valores de una de ellas varían sistemáticamente con respecto a los valores homónimos de la otra: si tenemos dos variables (A y B) existe correlación si al aumentar los valores de A lo hacen también los de B y viceversa. La correlación entre dos variables no implica, por sí misma, ninguna relación de causalidad (Véase cum hoc ergo propter hoc ). Contenido [ocultar ] 1 Fuerza, sentido y forma de la correlación 2 Coeficientes de correlación o 2.1 Interpretación geométrica o 2.2 Distribución del coeficiente de correlación 3 Referencias 4 Enlaces externos [editar ] Fuerza, sentido y forma de la correlación La relación entre dos super variables cuantitativas queda representada mediante la línea de mejor ajuste , trazada a partir de la nube de puntos. Los principales componentes

Correlación

Embed Size (px)

Citation preview

CorrelaciónDe Wikipedia, la enciclopedia libreSaltar a: navegación, búsquedaPara otros usos de este término, véase Correlación (desambiguación).

En probabilidad y estadística, la correlación indica la fuerza y la dirección de una relación lineal y proporcionalidad entre dos variables estadísticas. Se considera que dos variables cuantitativas están correlacionadas cuando los valores de una de ellas varían sistemáticamente con respecto a los valores homónimos de la otra: si tenemos dos variables (A y B) existe correlación si al aumentar los valores de A lo hacen también los de B y viceversa. La correlación entre dos variables no implica, por sí misma, ninguna relación de causalidad (Véase cum hoc ergo propter hoc).

Contenido

[ocultar]

1 Fuerza, sentido y forma de la correlación 2 Coeficientes de correlación

o 2.1 Interpretación geométrica o 2.2 Distribución del coeficiente de correlación

3 Referencias 4 Enlaces externos

[editar] Fuerza, sentido y forma de la correlación

La relación entre dos super variables cuantitativas queda representada mediante la línea de mejor ajuste, trazada a partir de la nube de puntos. Los principales componentes elementales de una línea de ajuste y, por lo tanto, de una correlación, son la fuerza, el sentido y la forma:

La fuerza extrema según el caso, mide el grado en que la línea representa a la nube de puntos: si la nube es estrecha y alargada, se representa por una línea recta, lo que indica que la relación es fuerte; si la nube de puntos tiene una tendencia elíptica o circular, la relación es débil.

El sentido mide la variación de los valores de B con respecto a A: si al crecer los valores de A lo hacen los de B, la relación es positiva; si al crecer los valores de A disminuyen los de B, la relación es negativa.

La forma establece el tipo de línea que define el mejor ajuste: la línea recta, la curva monotónica o la curva no monotónica.

[editar] Coeficientes de correlación

Existen diversos coeficientes que miden el grado de correlación, adaptados a la naturaleza de los datos. El más conocido es el coeficiente de correlación de Pearson (introducido en realidad por Francis Galton), que se obtiene dividiendo la covarianza de dos variables por el producto de sus desviaciones estándar. Otros coeficientes son:

Coeficiente de correlación de Spearman Correlación canónica Coeficiente de Correlación Intraclase

[editar] Interpretación geométrica

Dados los valores muestrales de dos variables aleatorias e

, que pueden ser consideradas como vectores en un espacio a n dimensiones, puden construirse los "vectores centrados" como:

e .

El coseno del ángulo alfa entre estos vectores es dada por la fórmula siguiente:

Pues es el coeficiente de correlación muestral de Pearson. El coeficiente de correlación es el coseno entre ambos vectores centrados:

Si r = 1, el ángulo °, ambos vectores son colineales (paralelos). Si r = 0, el ángulo °, ambos vectores son ortogonales. Si r =-1, el ángulo °, ambos vectores son colineales de dirección opuesto.

Más generalmente: .

Por supuesto, del punto vista geométrica, no hablamos de correlación lineal: el coeficiente de correlación tiene siempre un sentido, cualquiera si que sea su valor entre -1 y 1. Nos informa de modo preciso, no tanto sobre el grado de dependencia entre las variables, que sobre su distancia angular en la hiperesfera a n dimensiones.

La Iconografía de las correlaciones es un método de análisis multidimensional que reposa en esta idea. La correlacion lineal se da cuando en una nube de puntos estos se encuentran o se distribuyen alrededor de una recta.

[editar] Distribución del coeficiente de correlación

El coeficiente de correlación muestral de una muestra es de hecho una varible aleatoria, eso significa que si repetimos un experimento o consideramos diferentes muestras se obtendrán valores diferentes y por tanto el coeficiente de correlación muestral calculado a partir de ellas tendrá valores ligeramente diferentes. Para muestras grandes la variación en dicho coeficiente será menor que para muestras pequeñas. R. A. Fisher fue el primero en determinar la distribución de probabilidad para el coeficiente de correlación.

Si las dos variables aleatorias que trata de relacionarse proceden de una distribución gaussiana bivariante entonces el coeficiente de correlación r sigue una distribución de probabilidad dada por:1 2

donde:

es la distribución gamma

es la función gaussiana hipergeométrica.

Nótese que , por tanto r es estimador sesgado de .

Puede obtenerse un estimador aproximado no sesgado resolviendo la ecuación:

for

Aunque, la solucón:

es subóptima. Se puede obtener un estimador sesgado con mínima varianza para grandes

valores de n, con sesgo de orden buscando el máximo de la expresión:

, i.e.

En el caso especial de que , la distribución original puede ser reescrita como:

CORRELACION

La corre lac ión t ra ta de es tab lece r l a re lac ión o dependenc ia que ex i s te

en t re l as dos va r i ab les que in te rv ienen en una distr ibuc ión b id imensional .

E s dec i r , de te rminar s i l o s camb ios en una de l as va r i ab les i n f l uyen en

l os camb ios de l a o t ra . En caso de que suceda , d i remos que l as va r i ab les es tán

co r re lac ionadas o que hay corre lac ión en t re e l l a s .

Tipos de correlación

1º Corre lac ión d i recta

La co r re lac ión d i rec ta se da cuando a l aumenta r una de l as va r i ab les l a

o t ra aumenta .

La rec ta co r respond ien te a l a nube de puntos de l a d i s t r i buc ión es una

rec ta c rec ien te .

2º Corre lac ión inversa

La co r re lac ión i nve rsa se da cuando a l aumenta r una de l as va r i ab les l a

o t ra d i sminuye .

La rec ta co r respond ien te a l a nube de puntos de l a d i s t r i buc ión es una

rec ta dec rec ien te .

3º Corre lac ión nula

La co r re lac ión nu la se da cuando no hay dependenc ia de n ingún t i po

en t re l as va r i ab les .

En es te caso se d i ce que l as va r i ab les son i nco r re ladas y l a nube de

puntos t i ene una fo rma redondeada .

Grado de correlación

E l grado de corre lac ión i nd i ca l a p rox im idad que hay en t re l os puntos

de l a nube de puntos . Se pueden da r t res t i pos :

1. Corre lac ión fuerte

La co r re lac ión se rá fue r te cuanto más ce rca es tén l os puntos de l a rec ta .

2. Corre lac ión débi l

La co r re lac ión se rá déb i l cuanto más separados es tén l os puntos de l a

rec ta .

3. Corre lac ión nula

Coefic iente de correlación l ineal

E l coef ic iente de corre lac ión l inea l e s e l coc ien te en t re l a covar ianza

y e l p roduc to de l as desv iac iones t íp icas de ambas va r i ab les .

E l coef ic iente de corre lac ión l inea l se expresa med ian te l a l e t ra r .

Propiedades del coef ic iente de correlación

1. E l coef ic iente de corre lac ión no va r í a a l hace r l o l a esca la de

med ic ión .

Es dec i r , s i expresamos l a a l tu ra en met ros o en cen t ímet ros e l

coe f i c i en te de co r re lac ión no va r í a .

2. E l s i gno de l coef ic iente de corre lac ión e s e l m i smo que e l de l a

covar ianza .

S i l a cova r ianza es pos i t i va , l a co r re lac ión es d i rec ta .

S i l a cova r ianza es nega t i va , l a co r re lac ión es i nve rsa .

S i l a cova r ianza es nu la , no ex i s te co r re lac ión .

3. E l coef ic iente de corre lac ión l inea l e s un número rea l comprend ido

en t re −1 y 1 .

−1 ≤ r ≤ 1

4. S i e l coef ic iente de corre lac ión l inea l t oma va lo res ce rcanos a −1

l a co r re lac ión es fuerte e inversa , y se rá tan to más fue r te cuanto más se

ap rox ime r a −1 .

5. S i e l coef ic iente de corre lac ión l inea l t oma va lo res ce rcanos a 1 l a

co r re lac ión es fuerte y d i recta , y se rá tan to más fue r te cuanto más se

ap rox ime r a 1 .

6. S i e l coef ic iente de corre lac ión l inea l t oma va lo res ce rcanos a 0 ,

l a co r re lac ión es débi l .

7. S i r = 1 ó −1 , l os puntos de l a nube es tán sobre l a rec ta c rec ien te o

dec rec ien te . En t re ambas va r i ab les hay dependenc ia func ional .

Ejemplos

Las no tas de 12 a lumnos de una c lase en Matemát i cas y F í s i ca son l as

s igu ien tes :

Matemáticas 2 3 4 4 5 6 6 7 7 8 10 10

Física 1 3 2 4 4 4 6 4 6 7 9 10

Ha l l a r e l coef ic iente de corre lac ión de l a d i s t r i buc ión e i n te rp re ta r l o .

x i y i

x i

·y i

x i2 y i

2

2 1 2 4 1

3 3 9 9 9

4 2 8 16 4

4 4 16 16 16

5 4 20 25 16

6 4 24 36 16

6 6 36 36 36

7 4 28 49 16

7 6 42 49 36

8 7 56 64 49

1

09 90

10

081

1

0

1

0

10

0

10

0

10

0

7

2

6

0

43

1

50

4

38

0

1º Ha l l amos l as med ias a r i tmét i cas .

2º Ca lcu lamos l a covar ianza .

3º Ca lcu lamos l as desv iac iones t í p i cas .

4º Ap l i camos l a f ó rmu la de l coef ic iente de corre lac ión l inea l .

A l se r e l coef ic iente de corre lac ión pos i t i vo , l a co r re lac ión es d i rec ta .

Como coef ic iente de corre lac ión e s tá muy p róx imo a 1 l a co r re lac ión

es muy fue r te .

Los va lo res de dos va r i ab les X e Y se d i s t r i buyen según l a tab la

s igu ien te :

Y/X 0 2 4

1 2 1 3

2 1 4 2

3 2 5 0

Dete rminar e l coef ic iente de corre lac ión .

Conver t imos l a tab la de dob le en t rada en tab la s imp le .

x i y i f i

x i ·

f i

x i2 ·

f i

y i ·

f i

y i2

·

f i

x i · y i

· f i

0 1 2 0 0 2 2 0

0 2 1 0 0 2 4 0

0 3 2 0 0 6 18 0

2 1 1 2 4 1 1 2

2 2 4 8 16 8 16 16

2 3 5 10 20 15 45 30

4 1 3 12 48 3 3 12

4 2 2 8 32 4 8 16

20 40 120 41 97 76

A l se r e l coef ic iente de corre lac ión nega t i vo , l a co r re lac ión es i nve rsa .

Como coef ic iente de corre lac ión e s tá muy p róx imo a 0 l a co r re lac ión

es muy déb i l .

Ejercicios de regresión y correlación

1. C inco n iños de 2 , 3 , 5 , 7 y 8 años de edad pesan , respec t i vamente ,

14 , 20 , 32 , 42 y 44 k i l os .

1 Ha l l a r l a ecuac ión de l a recta de regres ión de l a edad sobre e l peso .

2 ¿Cuá l se r í a e l peso ap rox imado de un n iño de se i s años?

2. Un cen t ro comerc ia l sabe en func ión de l a d i s tanc ia , en k i l ómet ros , a

l a que se s i túe de un núc leo de pob lac ión , acuden l os c l i en tes , en c ien tos , que

f i gu ran en l a tab la :

Nº de cl ientes (X) 8 7 6 4 2 1

Distancia (Y) 15 19 25 23 34 40

1 Ca lcu la r e l coef ic iente de corre lac ión l inea l .

2 S i e l cen t ro comerc ia l se s i túa a 2 km, ¿cuántos c l i en tes puede

espera r?

3 S i desea rec ib i r a 500 c l i en tes , ¿a qué d i s tanc ia de l núc leo de

pob lac ión debe s i tua rse?

3. Las no tas ob ten idas po r c inco a lumnos en Matemát i cas y Qu ím ica son :

Matemáticas 6 4 8 5 3. 5

Química 6. 5 4. 5 7 5 4

Dete rminar l a s rectas de regres ión y ca l cu la r l a no ta esperada en

Qu ím ica pa ra un a lumno que t i ene 7 .5 en Matemát i cas .

4. Un con jun to de da tos b id imens iona les (X , Y ) t i ene coef ic iente de

corre lac ión r = −0 .9 , s i endo l as med ias de l as d i s t r i buc iones marg ina les =

1 , = 2 . Se sabe que una de l as cua t ro ecuac iones s igu ien tes co r responde a l a

recta de regres ión de Y sobre X :

y = -x + 2 3x - y = 1 2x + y = 4 y = x + 1

Se lecc ionar razonadamente es ta rec ta .

5. Las es ta tu ras y pesos de 10 j ugadores de ba lonces to de un equ ipo

son :

Estatura (X) 186 189 190 192 193 193 198 201 203 205

Pesos (Y) 85 85 86 90 87 91 93 103 100 101

Ca lcu la r :

1 La recta de regres ión de Y sobre X .

2 E l coef ic iente de corre lac ión .

3 E l peso es t imado de un j ugador que m ide 208 cm.

6. A par t i r de l os s igu ien tes da tos re fe ren tes a ho ras t raba jadas en un

ta l l e r (X ) , y a un idades p roduc idas (Y ) , de te rminar l a recta de regres ión de Y

sobre X , e l coef ic iente de corre lac ión l inea l e i n te rp re ta r l o .

Horas (X) 80 79 83 84 78 60 82 85 79 84 80 62

Producción

(Y)300 302 315 330 300 250 300 340 315 330 310 240

7. Se ha so l i c i t ado a un g rupo de 50 i nd iv iduos i n fo rmac ión sobre e l

número de ho ras que ded i can d ia r i amente a do rmi r y ve r l a te lev i s i ón . La

c l as i f i cac ión de l as respues tas ha pe rmi t i do e labora r l a s i en te tab la :

Nº de horas dormidas (X) 6 7 8 9 10

Nº de horas de televisión (Y) 4 3 3 2 1

Frecuencias absolutas (f i) 3 16 20 10 1

Se p ide :

1 Ca lcu la r e l coef ic iente de corre lac ión .

2 Dete rminar l a ecuac ión de l a recta de regres ión de Y sobre X .

3 S i una pe rsona duerme ocho ho ras y med ia , ¿ cuánto cabe espera r que

vea l a te lev i s i ón?

8. La tab la s igu ien te nos da l as no tas de l tes t de ap t i tud (X ) dadas a

se i s depend ien tes a p rueba y ven tas de l p r imer mes de p rueba (Y ) en c ien tos

de eu ros .

X 25 42 33 54 29 36

Y 42 72 50 90 45 48

1 Ha l l a r e l coef ic iente de corre lac ión e i n te rp re ta r e l resu l tado

ob ten ido .

2 Ca lcu la r l a recta de regres ión de Y sobre X . P redec i r l a s ven tas de

un vendedor que ob tenga 47 en e l t es t .

1. Una compañ ía desea hacer p red i cc iones de l va lo r anua l de sus ven tas

to ta les en c ie r to pa í s a pa r t i r de l a re lac ión de és tas y l a ren ta nac iona l . Pa ra

i nves t iga r l a re lac ión cuenta con l os s igu ien tes da tos :

X 189 190 208 227 239 252 257 274 293 308 316

Y 402 404 412 425 429 436 440 447 458 469 469

X representa l a ren ta nac iona l en m i l l ones de eu ros e Y rep resenta l as

ven tas de l a compañ ía en m i les de eu ros en e l pe r i odo que va desde 1990

has ta 2000 (ambos i nc lus i ve ) . Ca l cu la r :

1 La recta de regres ión de Y sobre X .

2 E l coef ic iente de corre lac ión l inea l e i n te rp re ta r l o .

3 S i en 2001 l a ren ta nac iona l de l pa í s fue de 325 mi l l ones de eu ros .

¿Cuá l se rá l a p red i cc ión pa ra l as ven tas de l a compañ ía en es te año?

2. La i n fo rmac ión es tad í s t i ca ob ten ida de una mues t ra de tamaño 12

sobre l a re lac ión ex i s ten te en t re l a i nve rs ión rea l i zada y e l rend im ien to

ob ten ido en c ien tos de m i les de eu ros pa ra exp lo tac iones ag r í co las , se

mues t ra en e l s i gu ien te cuadro :

Inversión (X) 11 14 16 15 16 18 20 21 14 20 19 11

Rendimiento (Y) 2 3 5 6 5 3 7 10 6 10 5 6

Ca lcu la r :

1 La recta de regres ión de l rend im ien to respec to de l a i nve rs ión .

2 La p rev i s i ón de i nve rs ión que se ob tendrá con un rend im ien to de 1 250

000 € .

3. E l número de ho ras ded i cadas a l es tud io de una as igna tu ra y l a

ca l i f i cac ión ob ten ida en e l examen co r respond ien te , de ocho pe rsonas es :

Horas (X) 20 16 34 23 27 32 18 22

Calif icación (Y) 6.5 6 8.5 7 9 9.5 7.5 8

Se p ide :

1 Recta de regres ión de Y sobre X .

2 Ca l i f i cac ión es t imada pa ra una pe rsona que hub iese es tud iado 28

ho ras .

4. En l a tab la s igu ien te se i nd i ca l a edad (en años ) y l a conduc ta

ag res i va (med ida en una esca la de ce ro a 10 ) de 10 n iños .

Edad 6 6 6.7 7 7.4 7.9 8 8.2 8.5 8.9

Conducta agresiva 9 6 7 8 7 4 2 3 3 1

1 Obtener l a recta de regres ión de l a conduc ta ag res i va en func ión de

l a edad .

2 A par t i r de d i cha rec ta , ob tener e l va lo r de l a conduc ta ag res i va que

co r responder ía a un n iño de 7 .2 años .

5. Los va lo res de dos va r i ab les X e Y se d i s t r i buyen según l a tab la

s igu ien te :

Y/X 100 50 25

14 1 1 0

18 2 3 0

22 0 1 2

Se p ide :

1 Ca lcu la r l a covar ianza .

2 Obtener e i n te rp re ta r e l coe f i c i en te de corre lac ión l inea l .

3 Ecuac ión de l a recta de regres ión de Y sobre X .

6. Las puntuac iones ob ten idas po r un g rupo de a lumnos en una ba te r í a

de tes t que m ide l a hab i l i dad ve rba l (X ) y e l razonamiento abs t rac to (Y ) son

l as s igu ien tes :

Y/X 20 30 40 50

(25-35) 6 4 0 0

(35-45) 3 6 1 0

(45-55) 0 2 5 3

(55-65) 0 1 2 7

Se p ide :

1 ¿Ex i s te corre lac ión en t re ambas va r i ab les?

2 Según l os da tos de l a tab la , s i uno de es tos a lumnos ob t i ene una

puntuac ión de 70 puntos en razonamiento abs t rac to , ¿en cuánto se es t imará su

hab i l i dad ve rba l ?

7. Se sabe que en t re e l consumo de pape l y e l número de l i t ros de agua

po r met ro cuadrado que se recogen en una c iudad no ex i s te re lac ión .

1 ¿Cuá l es e l va lo r de l a covar ianza de es tas va r i ab les?

2 ¿Cuánto va le e l coe f i c i en te de corre lac ión l inea l ?

3 ¿Qué ecuac iones t i enen l as dos rectas de regres ión y cuá l es su

pos i c i ón en e l p l ano?

8. En una empresa de t ranspor tes t raba jan cua t ro conduc to res . Los años

de an t igüedad de pe rmisos de conduc i r y e l número de i n f racc iones comet idas

en e l ú l t imo año po r cada uno de e l l os son l os s igu ien tes :

Años (X) 3 4 5 6

Infracciones (Y) 4 3 2 1

Ca lcu la r e l coef ic iente de corre lac ión l inea l e i n te rp re ta r l o .

9. Una pe rsona re l l ena semana lmente una qu in ie la y un bo le to de l o te r í a

p r im i t i va ano tando e l número de ac ie r tos que t i ene . Duran te l as cua t ro

semanas de l mes de feb re ro , l o s ac ie r tos fue ron :

Quiniela (X) 6 8 6 8

Primitiva (Y) 1 2 2 1

Obtener e l coef ic iente de corre lac ión l inea l e i n te rp re ta r l o .

¿O f rece r í an con f i anza l as p rev i s i ones hechas con l as rec tas de reg res ión?

Indice1. Introducción2. Marco teórico3. Análisis De Resultados4. Conclusiones

1. Introducción

En muchas situaciones de la vida real, se presentan problemas en los cuales existe una relación entre dos o más variables y se hace necesario encontrar la naturaleza de esta relación.Éste trabajo ilustra una situación real de la empresa ESTIMAR LTDA donde se tienen los ingresos y costos obtenidos durante los últimos 18 meses y se analiza la relación existente entre ellos.Para esto se hizo uso de la técnica de Regresión y Correlación, la cual resulta una herramienta muy útil a la hora de analizar el comportamiento de dos o más variables relacionadas.Se pretende entonces establecer mediante una regresión la relación entre dichos datos al igual que calcular algunos pronósticos que puedan dar una idea de cómo será el comportamiento de los ingresos y costos en los próximos meses.

ObjetivosGeneral:

Destacar la importancia y la utilidad de la Regresión y Correlación para modelar e investigar la relación entre dos variables.Específicos:

Aplicar la técnica de regresión a los ingresos, costos y utilidades obtenidos por la empresa ESTIMAR LTDA durante el año 2002 y los primeros seis meses del 2003.

Construir el modelo matemático que más se ajuste a la serie de datos recolectados.

Pronosticar los ingresos y costos de los seis meses siguientes de acuerdo al modelo matemático obtenido.

2. Marco Teórico

La regresión es una técnica estadística utilizada para simular la relación existente entre dos o más variables. Por lo tanto se puede emplear para construir un modelo que permita predecir el comportamiento de una variable dada.La regresión es muy utilizada para interpretar situaciones reales, pero comúnmente se hace de mala forma, por lo cual es necesario realizar una selección adecuada de las variables que van a construir las ecuaciones de la

regresión, ya que tomar variables que no tengan relación en la práctica, nos arrojará un modelo carente de sentido, es decir ilógico.

Según sea la dispersión de los datos (nube de puntos) en el plano cartesiano, pueden darse alguna de las siguientes relaciones, Lineal, Logarítmica, Exponencial, Cuadrática, entre otras. Las ecuaciones de cada relación se presentan en la siguiente tabla.

Tabla 1. Ecuaciones de regresión

REGRESIÓN ECUACIÓN

Lineal y = A + Bx

Logarítmica y = A + BLn(x)

Exponencial y = Ae(Bx)

Cuadrática y = A + Bx +Cx2

Sin embargo obtener el modelo de regresión no es suficiente para establecer la regresión, ya que es necesario evaluar que tan adecuado es el modelo de regresión obtenido. Para esto se hace uso del coeficiente de correlación R, el cual mide el grado de relación existente entre las variables. El valor de R varia entre -1 y 1, pero en la práctica se trabaja con el valor absoluto de R, entonces, a medida que R se aproxime a 1, más grande es el grado de correlación entre los datos, de acuerdo con esto el coeficiente de correlación se puede clasificar de varias formas, como se observa en la Tabla 2.

Tabla 2. Clasificación del grado de correlación.

CORRELACIÓN VALOR O RANGO

Perfecta |R| = 1

Excelente 0.9 <= |R| < 1

Buena 0.8 <= |R| < 0.9

Regular 0.5 <= |R| <0.8

Mala |R|< 0.5

Por lo tanto el análisis de regresión es una herramienta estadística que permite analizar y predecir o estimar observaciones futuras de dos o más variables relacionadas entre sí, es decir una herramienta útil para la planeación.

Después de éste tratamiento superficial acerca de regresiones, se continua con un caso práctico relacionado con la empresa ESTIMAR LTDA.A continuación se presentan los ingresos y costos en millones obtenidos mensualmente durante todo el año 2002 y los seis primeros meses del 2003.Optamos por presentar éste caso ya que resulta muy práctico a la hora de aplicar la técnica de regresión. Además porque permite analizar como se han comportado los ingresos y costos de la empresa a partir del año 2002 y a su vez pronosticar según la tendencia arrojada, como será el comportamiento de los ingresos y costos para el resto del año 2003 y con base en ellos inferir o tomar decisiones a corto plazo.

Distribuciones BivariantesEs cuando sobre una población estudiamos simultáneamente los valores de dos variables estadísticas, el conjunto de los pares de valores correspondientes a cada individuo se denomina distribución bivariantes.

Ejemplo 1:Las notas de 10 alumnos en Matemáticas y en Lengua vienen dadas en la siguiente tabla:

MATEMÁTICAS 2 4 5 5 6 6 7 7 8 9

LENGUA 2 2 5 6 5 7 5 8 7 10

Los pares de valores {(2,2),(4,2),(5,5),...;(8,7),(9,10)}, forman la distribución bivariante.

RegresionLa regresión es una técnica estadística utilizada para simular la relación existente entre dos o más variables. Por lo tanto se puede emplear para construir un modelo que permita predecir el comportamiento de una variable dada.

1. Correlación

Es frecuente que estudiemos sobre una misma población los valores de dos variables estadísticas distintas, con el fin de ver si existe alguna relación entre ellas, es decir, si los cambios en una de ellas influyen en los valores de la otra. Si ocurre esto decimos que las variables están correlacionadas o bien que hay correlación entre ellas.

Medida De La CorrelaciónLa apreciación visual de la existencia de correlación no es suficiente. Usaremos un parámetro, llamado coeficiente de correlación que denotaremos con la letra r, que nos permite valorar si ésta es fuerte o débil, positiva o negativa.

El cálculo es una tarea mecánica, que podemos realizar con una calculadora o un programa informático. Nuestro interés está en saber interpretarlo

destacaremos una de sus propiedades

-1 < r < 1

Correlación Lineal Y Recta De RegresiónCuando observamos una nube de puntos podemos apreciar si los puntos se agrupan cerca de alguna curva. Aquí nos limitaremos a ver si los puntos se distribuyen alrededor de una recta. Si así ocurre diremos que hay correlación lineal. La recta se denomina recta de regresión.

Hablaremos de correlación lineal fuerte cuando la nube se parezca mucho a una recta y será cada vez más débil (o menos fuerte) cuando la nube vaya desparramándose con respecto a la recta.En el gráfico observamos que en nuestro ejemplo la correlación es bastante fuerte, ya que la recta que hemos dibujado está próxima a los puntos de la nube.

Cuando la recta es creciente la correlación es positiva o directa: al aumentar una variable, la otra tiene también tendencia a aumentar, como en el ejemplo anterior. Cuando la recta es decreciente la correlación es negativa o inversa: al aumentar una variable, la otra tiene tendencia a disminuir.

Ejemplo 2:Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50 preguntas. En la gráfica se describen el nº de errores que corresponden a los intentos realizados.Observa que hay una correlación muy fuerte (los puntos están "casi" alineados) y negativa (la recta es decreciente).

Diagrama De DispersiónLa primera forma de describir una distribución bivariante es representar los pares de valores en el plano cartesiano. El gráfico obtenido recibe el nombre de nube de puntos o diagrama de dispersión.

Un diagrama de dispersión es una representación gráfica de la relación entre dos variables, muy utilizada en las fases de Comprobación de teorías e identificación de causas raíz y en el Diseño de soluciones y mantenimiento de los resultados obtenidos. Tres conceptos especialmente destacables son que el descubrimiento de las verdaderas relaciones de causa-efecto es la clave de la resolución eficaz de un problema, que las relaciones de causa-efecto casi siempre muestran variaciones, y que es más fácil ver la relación en un diagrama de dispersión que en una simple tabla de números

Linea De TendenciaLa línea de tendencia es la herramienta básica más importante con la que cuenta el analista técnico.Es una línea o conjunto de líneas que se trazan en el gráfico uniendo con una misma pendiente series sucesivas de puntos mínimos (línea de tendencia alcista) o de puntos máximos (línea de tendencia bajista).Sirve para determinar en primer lugar la dirección del mercado y establecer sus objetivos de proyección.Marca los niveles de soporte o de resistencia que están proyectando los precios.Permite analizar en cada momento el nivel de Beneficio/Riesgo que se puede tomar al iniciar o cerrar una posición, tomando como referencia el precio actual respecto a línea de tendencia y su proyección.La ruptura de una línea de tendencia al alza o la baja es una de las señales que confirma un cambio en la dirección de los precios.Son la base para trazar los canales que encuadran el posible movimiento de los precios.Según sea la dispersión de los datos (nube de puntos) en el plano cartesiano, pueden darse alguna de las siguientes relaciones, Lineal, Logarítmica, Exponencial, Cuadrática, entre otras.

Modelo Matematico

Llamado tambien ajuste de curvas es una ecuacion dada en un grafico, dependiendo del grado de correlacion que mas se ajuste al conjunto de datos.

AJUSTE LINEAL: Y=BX+A AJUSTE LOGARITMICO: Y=B Ln X+A AJUSTE EXPONENCIAL: Y=AC BX AJUSTE PARABOLICO, CUADRATICO O POLINOMIAL: Y= AX2 + BX + A

EstimativosEs una valoracion aproximada basado en datos de periodos anteriores (datos historicos o estadisticos) a traves de muestreos.

PronósticosEs estimar un valor de y dado o supesto un valor de x. Tambien se puede decir que es preveer el futuro.Enuncie Los Pasos Para Ajustar Un Conjunto De Datos Y Crear Un Conjunto Su Modelo MatematicoTener tabulado un conjunto de datos Xi, Yi cuyas variables tengan relación

Utilidades Vs Costos Costos Vs Cantidad Producida Utilidades Vs Mes Costos Vs Semanas Ingresos Vs Año

Graficar los datos Xi, Yi (Diagrama de dispersion o nube de puntos). Esto permite visualizar la linea de tendencia.Contruya el modelo matematico que mas se ajuste teniendo en cuenta el grado de correlacion.

Perfecta [r]=1 Excelente 0.9 <=[r]<=1 Regular 0.5<=[r]<0.8 Mala [r]<0.5

Series CronológicasUna SERIE cronológica es un conjunto de observaciones (ordenado en términos de tiempo). Algunos ejemplos de series cronológicas serian aspectos tales registros de precipitación pluvial diaria, las ventas semanales, el producto nacional bruto trimestral, mediciones de la temperatura.El objeto de analizar tales datos es determinar si se presentan ciertos patrones o pautas no aleatorias.Algunas veces se trata de descubrir patrones no aleatorios que se puedan utilizar para predecir el futuro.En otras coacciones, el objetivo es asegurarse de que no haya patrones no aleatorios. En estos casos, dichos patrones son considerados como una señal de que un sistema o proceso esta " fuera de control".La siguiente explicación tiene relacion con el análisis intrínseco, el cual se concentra en los datos históricos de la variable de estudio. Cabria destacar que el análisis intrínseco es ampliamente empleado en los negocios y en l a industria. El objetivo reconocido del análisis intrínseco es describir mas que explicar los patrones históricos de los datos (es decir, identificar diversos patrones). Además

el supuesto en el que se basa el análisis intrínseco, estable que existe un constante sistema causal relacionado con el tiempo, el cual influye en los datos. En otras palabras, los datos históricos supuestamente reflejan l a influencia de todos los factores de manera uniforme atravez del tiempo. Por ejemplo, un estudio de ventas realizadas en un periodo de 14 años puede revelar que las ventas han aumentado de manera uniforme a razón de casi 10% anual. Con base en esto se lleva a cabo una proyección de las ventas futuras, suponiendo que cualesquiera que fuesen las fuerzas que hayan dado lugar a este patrón, continuaran en le futuro.

Números ÍndicesUn número índice mide qué tanto una variable ha cambiado con el tiempo.Mide la variación relativa entre las variables económicas: Variaciones en los precios, en los salarios, en los ingresos, etc.Se calculan para 2 períodos de una serie de tiempo o para todos los períodos de una serie de tiempo con respecto a un período fijo llamado período base.Que importancia tienen estas tematicas para cualquier ciencia.La Estadistica es de gran importancia en las diferentes empresas, enfocadas desde cualquier area profesional ya que ayudan a lograr una adecuada planeacion y control apoyados en los estudios de pronosticos, presupuestos etc.

Motivan a la alta gerencia para que definan los objetivos basicos de la empresa.

Propician que se defina una estructura adecuada, determinando la responsabilidad y autoridad de cada una de las partes que integran la organización.

Incrementan la participación de los diferentes niveles de la organización, cuando existe motivacion adecuada.

Obligan a mantener un archivo de datos historicos controlables. Facilitan a la administracion la utilizacion optima de los diferentes insumos. Facilitan la coparticipación e integracion de las diferentes areas de la

compañía. Obligan a realizar un autoanalisis periodico. Facilitan el control administrativo. Son un reto que constantementese presenta a los ejecutivos de una

organización para ejercitar su creatividad y criterio profesional a fin del mejoramiento de la empresa.

Ayudan a lograr una mayor efectividad y eficiencia en las operaciones.

Que importancia tiene para usted como contador (a) la realización de pronósticos.

Para prevenir los cambios del entorno, de manera que anticipandose a ellos sea mas fácil la adaptacion de las organizaciones.

Para integrar los objetivos y decisiones de la organización. A traves de los pronosticos, se pueden prever las perdidas en los resultados de

los estados financieros futuros, y de esta manera se pueden tomar decisiones bien sea la reduccion de costos y gastos, planear estrategias que ayuden al mejoramiento de la empresa, y que se cumpla con el objetivo de toda empresa que es obtener utilidades.

Con base en analisis de rotacion de inventarios se puede tomar la decision de aumentar o sacar del mercado un producto.

En cuales areas de su competencia profesional es útil aplicar este conocimiento.

Economia Administración Psicología y las demas áreas afines (Ciencias exactas y ciencias Sociales) Medicina etc. Nosotras pensamos que estos temas de estadística son

indispensables en cualquier área ya que a diario se presentan situaciones donde intervienen dos variables y es importante este conocimiento para la toma de decisiones.

3. Análisis De Resultados

Realizando un breve análisis de la EMPRESA ESTIMAR LTDA. Podemos observar la poca o nula estabilidad comercial , la cual tuvo mucha variabilidad en cada uno de los meses, donde podemos concluir que la empresa tuvo acogida por los clientes, si observamos los ingresos mensuales que fueron aumentando, sinembargo las utilidades fueron cada vez más decrecientes debido a la mala administración dada por los jefes de producción donde invirtieron mas de lo que realmente vendían. Esto a su vez, demuestra que en una situación como la que se presentó en el periodo del año 2002 y los seis primeros meses del año 2003, es más difícil lograr un punto de equilibrio; es decir, el esfuerzo en la inversión es mayor para compensar lo que se deja de ganar en el margen.

Como podemos observar en la tabla de números índices base fija (# pagina) en el mes de junio de 2003 se hace demasiado notable la mala administración por parte de la empresa debido a que tenemos una variación en el costo del 250%, una variación en los ingresos del 125% y una variación de las utilidades de un déficit del 125%; lo cual no tiene sentido alguno en el desarrollo de las actividades de una empresa, donde el objetivo general de una empresa es obtener rentabilidad.

En la tabla de números índice en base móvil, observamos que el porcentaje de variación de costos y el de los ingresos respecto a la tabla en base fija van disminuyendo a medida que avanza el periodo, mientras que el porcentaje de variación en las utilidades en las dos tablas fueron muy diferentes, el la base móvil las utilidades estuvieron muy variables entre utilidad y perdida, en cambio en la base fija siempre se presento déficit en forma creciente a medida en que avanzaba el periodo.

4. Conclusiones

Es de suma importancia que la empresa ESTIMAR LTDA. Realice una planeación de presupuesto con el fin de investigar sobre el comportamiento de los diferentes mercados, los cuales tienen incidencia directa sobre el producto, como también realizar el plan de necesidades de insumos el cual consiste en detectar los requerimientos de los diferentes recursos que intervienen en el proceso productivo de tal modo que se pueda hacer frente al plan de mercados.

Realizar el plan financiero que tiene como finalidad decidir como se resolvera el problema de liquidez y de financiamiento de la empresa, una vez que se haya pronosticado los ingresos y los desembolsos provenientes del plan de requerimientos de insumos.

Mediante un buen grado de correlación, podemos fácilmente hacer estimativos acerca de cómo se va a comportar una variable de interés (en nuestro caso los ingresos, costos y utilidades mensuales de la empresa ESTIMAR LTDA.) a través del tiempo.

Los ingresos de ESTIMAR LTDA. desde Enero de 2002, presentan una tendencia creciente y se ajustó aun modelo matemático polinomial con un grado de correlación excelente, R = 0.9627, mostrando una buena relación entre los datos manejados.

Se observa que ESTIMAR LTDA. es una empresa con una muy mala gestión administrativa, porque fueron mas altos los costos que los ingresos a pesar que estos estuvieron mas o menos por el mismo nivel afectando notablemente las utilidades en forma negativa; por tal motivo es necesario mantener en la empresa costos estándar actualizados, con el propósito de que facilite la elaboración del presupuesto de requisiciones de materia prima, mano de obra y de gastos de fabricación indirectos, ya que de otra forma, se determinarían en forma muy imprecisa

La mejor estrategia para que no suceda lo anterior estriba en tomar medidas practicas para la reducción de costos, lo cual generara mayor margen y permitirá a la empresa mejorar su posición competitiva.

5. Bibliografía

MONTGOMERY Douglas C., RUNGER George C., Probabilidad y Estadística Aplicadas a la Ingeniería, Ed. McGraw Hill, 1996, Capítulo 9.

AULAFACIL.COM, Curso de Estadística, Capítulos 12 y 13, 2003. CONTABILIDAD ADMINISTRATIVA, David Noel Ramírez Padilla

http://www.monografias.com/trabajos14/estadistica/estadistica.shtml

http://www.uclm.es/profesorado/raulmmartin/Estadistica/PracticasSPSS/CORRELACION_CON_SPSS.pdf