View
60
Download
0
Category
Preview:
DESCRIPTION
Variables estadísticas bidimensionales. Se trata de variables que surgen cuando se estudian dos características asociadas a la observación de un fenómeno. Variables estadísticas bidimensionales. - PowerPoint PPT Presentation
Citation preview
Variables estadísticas Variables estadísticas bidimensionales bidimensionales
Se trata de variables que surgen cuando Se trata de variables que surgen cuando se estudian dos características asociadas se estudian dos características asociadas a la observación de un fenómeno.a la observación de un fenómeno.
Variables estadísticas Variables estadísticas bidimensionales bidimensionales
Ejemplo 1.- Estudiamos la talla, medida en cm. y el peso, medido en Ejemplo 1.- Estudiamos la talla, medida en cm. y el peso, medido en kg. de un grupo de 10 personas, podemos obtener los siguientes kg. de un grupo de 10 personas, podemos obtener los siguientes
valoresvalores
TallaTalla
(cms)(cms)160160 165165 168168 170170 171171 175175 175175 180180 180180 182182
Peso Peso
(kgs)(kgs)5555 5858 5858 6161 6767 6262 6666 7474 7979 8383
Podemos llamar X a la talla e Y al peso con lo que se Podemos llamar X a la talla e Y al peso con lo que se obtendría la obtendría la variable bidimensional (X, Y) que que toma 10 valores: toma 10 valores:
(160,55), (165,58),…, etc.(160,55), (165,58),…, etc.
83797466626761585855Peso
(kgs)
182180180175175171170168165160Talla
(cms)
83797466626761585855Peso
(kgs)
182180180175175171170168165160Talla
(cms)
Variables estadísticas Variables estadísticas bidimensionalesbidimensionales
Variables estadísticas Variables estadísticas bidimensionalesbidimensionales En algunos casos el número de "parejas" de valores (x,y) es En algunos casos el número de "parejas" de valores (x,y) es
grande y además muchos de ellos aparecen repetidos; en este grande y además muchos de ellos aparecen repetidos; en este caso se utiliza una caso se utiliza una ""Tabla de doble entradaTabla de doble entrada""
En la primera fila se colocan los valores de una de las En la primera fila se colocan los valores de una de las características o variable que componen la variable características o variable que componen la variable
bidimensional y en la primera columna los de la otrabidimensional y en la primera columna los de la otra..
(x(xii)) (y(yii))
X11 Y11
X22 Y22
. .
. .
. .
Xnn Ynn
Variables estadísticas Variables estadísticas bidimensionales bidimensionales
Ejemplo 1.Ejemplo 1.
Estudiamos la talla, medida en Estudiamos la talla, medida en cm. y el peso, medido en kg. cm. y el peso, medido en kg. de un grupo de 10 personas. de un grupo de 10 personas.
Talla (x)Talla (x) Peso (y)Peso (y)160 55
165 58
168 58
170 61
171 67
175 62
175 66
180 74
180 79
182 83
Total 1726Total 1726 663663
Variables estadísticas Variables estadísticas bidimensionales bidimensionales
Ejemplo 2.El esfuerzo cortante del suelo en un cierto estrato arcilloso, parece estar relacionado con la profundidad.En una región se toman 10 muestras de suelo a diferentes profundidades y se mide a cada una el esfuerzo cortante, en miles de libras por pie cuadrado [Klb/pie2].
OBSERVACION (i)
Profundidad x (pies)
Esfuerzo cortante y (Klb/pie2)
1 6 0,282 8 0,583 14 0,504 14 0,835 18 0,716 20 1,017 20 1,298 24 1,509 28 1,29
10 30 1,58
Variables estadísticas Variables estadísticas bidimensionales bidimensionales
Ejemplo 3.Ejemplo 3.Con el fin de determinar la Con el fin de determinar la relación existente entre la relación existente entre la resistenciaresistencia de una de una determinada pieza de determinada pieza de plástico y plástico y uno de sus uno de sus componentescomponentes (componente (componente A) se fabrican 10 piezas de A) se fabrican 10 piezas de prueba, cada una con una prueba, cada una con una concentración distinta y se concentración distinta y se obtienen los siguientes obtienen los siguientes resultados:resultados:
Pieza X (% A)
Y (Rotura)
1 1,5 3,04
2 1,2 2,96
3 1,1 2,66
4 1 3,17
5 4,5 9,82
6 5,2 9,68
7 8,7 17,71
8 9 18,18
9 9,2 18,32
10 9,5 19,3
Total 50,9 104,84
Variables estadísticas Variables estadísticas bidimensionales bidimensionales
Ejemplo 4.Ejemplo 4.El tiempo de respuesta (en El tiempo de respuesta (en nanosegundos) de un nanosegundos) de un circuito lógico en frió (X) y circuito lógico en frió (X) y tras una hora de uso tras una hora de uso intensivo (Y), para un intensivo (Y), para un conjunto de 8 maquinas conjunto de 8 maquinas
Maquina X Y
1 6 4
2 5 8
3 8 11
4 16 9
5 7 10
6 4 6
7 5 9
8 9 6
Total 60 63
Variables estadísticas Variables estadísticas bidimensionales bidimensionales
Ejemplo 5.Ejemplo 5.
El número de libras de vapor utilizadas por mes por una planta química, está relacionado con la temperatura ambiente promedio (en grados Farenheit) de ese mes. En la tabla siguiente se muestra el uso del vapor de un año y la temperatura del mes correspondiente.
Consumo de Vapor por Mes
MesTemperatura
Uso/1000
Enero 21 185.79
Febrero 24 214.47
Marzo 32 288.03
Abril 47 424.84
Mayo 50 454.58
Junio 59 539.03
Julio 68 21.55
Agosto 74 675.06
Septiembre 62 562.03
Octubre 50 452.93
Noviembre 41 369.96
Diciembre 30 273.98
Representación Representación gráficagráfica
Diagramas de dispersión o Diagramas de dispersión o nubes de puntos nubes de puntos
Diagramas de dispersión o Diagramas de dispersión o nubes de puntos nubes de puntos
La representación gráfica de este tipo de La representación gráfica de este tipo de variables es en realidad semejante a la variables es en realidad semejante a la representación de puntos en el plano, representación de puntos en el plano, usando unos ejes de coordenadas. Cada usando unos ejes de coordenadas. Cada pareja de valores da lugar a un punto en el pareja de valores da lugar a un punto en el plano y el conjunto de puntos que se plano y el conjunto de puntos que se obtiene se denomina obtiene se denomina ""diagrama de diagrama de dispersión o nube de puntosdispersión o nube de puntos".".
Diagramas de dispersión o Diagramas de dispersión o nubes de puntos nubes de puntos
En el En el ejemplo 1ejemplo 1 en el que se estudia la talla y el peso de en el que se estudia la talla y el peso de 10 personas se obtendría el siguiente diagrama de 10 personas se obtendría el siguiente diagrama de dispersión: (En el eje X se representa la talla en cm. y en dispersión: (En el eje X se representa la talla en cm. y en el eje Y el peso en kg.) el eje Y el peso en kg.)
0102030405060708090
155 160 165 170 175 180 185
Peso
(kg)
Talla (cms)
Peso por tallaTalla (x)Talla (x) Peso (y)Peso (y)
160 55
165 58
168 58
170 61
171 67
175 62
175 66
180 74
180 79
182 83
Total 1726Total 1726 663663
Diagramas de dispersión o Diagramas de dispersión o nubes de puntos nubes de puntos
Ejemplo 2. El esfuerzo cortante del suelo en un cierto estrato arcilloso, parece estar relacionado con la profundidad.
En una región se toman 10 muestras de suelo a diferentes profundidades y se mide a cada una el esfuerzo cortante, en miles de libras por pie cuadrado [Klb/pie2].
OBSERVACION (i)
Profundidad x (pies)
Esfuerzo cortante y (Klb/pie2)
1 6 0,28
2 8 0,58
3 14 0,50
4 14 0,83
5 18 0,71
6 20 1,01
7 20 1,29
8 24 1,50
9 28 1,29
10 30 1,58
Diagramas de dispersión o Diagramas de dispersión o nubes de puntos nubes de puntos
En el ejemplo 3 en el que se estudia la relación existente la relación existente entre la entre la resistenciaresistencia (Y) de una determinada pieza de plástico (Y) de una determinada pieza de plástico y y uno de sus componentesuno de sus componentes (componente A) se fabrican 10 (componente A) se fabrican 10 piezas de prueba, cada una con una concentración distinta piezas de prueba, cada una con una concentración distinta
Pieza X (% A)
Y (Rotura)
1 1,5 3,04
2 1,2 2,96
3 1,1 2,66
4 1 3,17
5 4,5 9,82
6 5,2 9,68
7 8,7 17,71
8 9 18,18
9 9,2 18,32
10 9,5 19,3
Resistencia por componentes
0
5
10
15
20
25
0 1 2 3 4 5 6 7 8 9 10
Concentracion del componente
Res
iste
ncia
Diagramas de dispersión o Diagramas de dispersión o nubes de puntos nubes de puntos En el ejemplo 4 en el que se estudia El tiempo de respuesta (en El tiempo de respuesta (en nanosegundos) de un circuito lógico en frió (X) y tras una nanosegundos) de un circuito lógico en frió (X) y tras una hora de uso intensivo (Y), para un conjunto de 8 maquinas hora de uso intensivo (Y), para un conjunto de 8 maquinas
Maq. X Y
1 6 4
2 5 8
3 8 11
4 16 9
5 7 10
6 4 6
7 5 9
8 9 6
Tiempo de respuesta por uso de un circuito
0
2
4
6
8
10
12
0 2 4 6 8 10 12 14 16 18
Tiempo
Uso
Diagramas de dispersión o Diagramas de dispersión o nubes de puntos nubes de puntos
Ejemplo 5. Ejemplo 5. El número de libras de vapor utilizadas por mes por una planta química, está relacionado con la temperatura ambiente promedio (en grados Farenheit) de ese mes. En la tabla siguiente se muestra el uso del vapor de un año y la temperatura del mes correspondiente.
Consumo de Vapor por Mes
MesTemperatura
Uso/1000
Enero 21 185.79
Febrero 24 214.47
Marzo 32 288.03
Abril 47 424.84
Mayo 50 454.58
Junio 59 539.03
Julio 68 21.55
Agosto 74 675.06
Septiembre 62 562.03
Octubre 50 452.93
Noviembre 41 369.96
Diciembre 30 273.98
Diagramas de dispersión o Diagramas de dispersión o nubes de puntosnubes de puntos
Se puede ver en el primera figura que correspondía Se puede ver en el primera figura que correspondía al diagrama deal diagrama de talla - peso talla - peso que la serie de puntos que la serie de puntos presenta una tendencia "presenta una tendencia "ascendenteascendente"" . Se dice en . Se dice en este caso que existen entre las dos variables una este caso que existen entre las dos variables una ""dependencia directadependencia directa" . " .
En caso en que la tendencia sea "En caso en que la tendencia sea "descendentedescendente" " se diría que estaríamos ante una " se diría que estaríamos ante una " dependencia dependencia inversainversa ""
Naturalmente en caso en que no se pueda Naturalmente en caso en que no se pueda observar una tendencia clara estaríamos ante una observar una tendencia clara estaríamos ante una dependencia muy débil que no se puede observar dependencia muy débil que no se puede observar mediante la nube de puntosmediante la nube de puntos
Regresión y CorrelaciónRegresión y Correlación
Regresión lineal simpleRegresión lineal simple
La regresión lineal simple, La regresión lineal simple, muestra como para cada muestra como para cada valor valor xx de una variable no aleatoria de una variable no aleatoria X X - conocida como - conocida como variable variable predictora o independientepredictora o independiente-, -, interviene una interviene una variable aleatoria variable aleatoria YY, denominada , denominada variable respuesta o variable respuesta o dependiente;dependiente; relacionadas, a través del valor medio o relacionadas, a través del valor medio o esperado de la esperado de la variable respuestavariable respuesta, por la expresión , por la expresión
Donde a y b son los coeficientes de regresiónDonde a y b son los coeficientes de regresión
bχaγ
Estimación de los parámetros de a recta de regresiónEl primer problema a abordar es obtener los
estimadores de los parámetros de la recta de regresión, partiendo de una muestra de tamaño n, es decir, n pares (x1, Y1) , (x2, Y2), ..., (xn, Yn); que
representan nuestra intención de extraer para cada xi un
individuo de la población o variable Yi .
Una vez realizada la muestra, se dispondrá de n pares de valores o puntos del plano (x1, y1) , (x2, y2), ..., (xn,
yn). El método de estimación aplicable en regresión,
denominado de los mínimos cuadrados, permite esencialmente determinar la recta que "mejor" se ajuste o mejor se adapte a la nube de n puntos.
Estimación de los parámetros de a recta de regresiónLas estimaciones de los parámetros de la recta de regresión obtenidas con este procedimiento son:
n n
ii
n
i
n
ii
n
i
xxn
yxyxnb
1
2
1
2
111
n
xbya
n
i
n
i 11
Estimación de los parámetros de a recta de regresión
Talla (x) Peso (y) XY X²
160 55 8.800 25.600
165 58 9.570 27.225
168 58 9.744 28.224
170 61 10.370 28.900
171 67 11.457 29.241
175 62 10.850 30.625
175 66 11.550 30.625
180 74 13.320 32.400
180 79 14.220 32.400
182 83 15.106 33.124
1726 663 114987 298364
a = -142.91
b = 1.2120
Y = -142.91 + (1.21)XY = -142.91 + (1.21)X
bXaY
n n
ii
n
i
n
ii
n
i
xxn
yxyxnb
1
2
1
2
111
n
xbya
n
i
n
i 11
En esta imagen se muestra la recta de regresión de y (peso) sobre x (talla). Se representa cómo depende el peso de su talla en en una persona
Si recordamos que entre la talla y el peso decíamos que existía una dependencia directa, la recta de regresión lo confirma ya que su pendiente es positiva: a medida que aumenta la talla aumenta el peso. Por tanto:
Hay dependencia directa con pendiente de la recta positiva creciente
Recta de regresiónRecta de regresión
Utilidad de la recta de regresión Utilidad de la recta de regresión
Mediante la recta de regresión podríamos obtener Mediante la recta de regresión podríamos obtener de manera aproximada el valor de la variable de manera aproximada el valor de la variable dependiente (y) de la que conociéramos la dependiente (y) de la que conociéramos la variable independiente (x), en una población variable independiente (x), en una población semejante a aquella de la que se ha obtenido la semejante a aquella de la que se ha obtenido la muestramuestra
De manera más precisa, si conocemos la De manera más precisa, si conocemos la expresión de la recta de regresión, se pueden expresión de la recta de regresión, se pueden calcular valores para la variable y, conocidos los calcular valores para la variable y, conocidos los de x, como si se tratara de una funciónde x, como si se tratara de una función
Si observamos la gráfica, podríamos suponer por ejemplo que una persona de 185 cm pesaría algo más de 80 kg
De acuerdo a la formula
La recta de regresión de la variable y (talla) sobre x (peso) será la recta:
El valor del peso estimado para una talla de 185 cm sería:
Peso= -142.91 + 185(1.21) = 81.33
Este valor obtenido es algo menor al esperado. Eso quiere decir que las predicciones hechas con la recta de regresión no son exactas. Mas adelante precisaremos la "fiabilidad" de las mismas.
Por tanto la recta de regresión se puede utilizar para realizar predicciones para la variable y a partir de valores conocidos de la variable x.
Y = -142.91 + (1.21)X
Estimación o pronostico
Coeficiente de correlaciónCoeficiente de correlación
Una vez observado que en una variable bidimensional Una vez observado que en una variable bidimensional existe una cierta dependencia entre las dos características existe una cierta dependencia entre las dos características o variables que la forman (nube de puntos), podemos o variables que la forman (nube de puntos), podemos precisar el grado de dicha dependencia. precisar el grado de dicha dependencia.
Si los puntos de la nube estuvieran todos sobre la recta de Si los puntos de la nube estuvieran todos sobre la recta de regresión se diría que existe una regresión se diría que existe una dependencia funcionaldependencia funcional. .
Si los puntos no están todos sobre la recta de regresión se Si los puntos no están todos sobre la recta de regresión se dice que entre las variables hay una ciertadice que entre las variables hay una cierta correlación correlación lineal.lineal. Este es el caso que nos ocupa. Para cuantificar el Este es el caso que nos ocupa. Para cuantificar el grado de dicha correlación se usa el coeficiente de grado de dicha correlación se usa el coeficiente de correlacióncorrelación
Dependencia de las variablesDependencia de las variables
El valor del coeficiente esta comprendido entre -1 y 1.
Si r se acerca a -1 o a +1, la dependencia es fuerte y por tanto las predicciones que se realicen a partir de la recta de regresión serán bastante fiables.
Si r se acerca a 0 la dependencia es débil y por tanto las predicciones que se realicen a partir de la recta de regresión serán poco fiables
2_
1
2_
1
__
1
)()(
))((
yyxx
yyxxr
n
i
n
i
i
n
i
Coeficiente de correlación Coeficiente de correlación de Pearsonde Pearson
Calcularemos la correlación para el ejemplo de las tallas y los pesos
r se acerca a 0 la dependencia es débil y por tanto las predicciones que se realicen a partir de la recta de regresión serán poco fiables
Coeficiente de correlación de Pearson
Talla (x)Talla (x) Peso (y)Peso (y) (x-x)(x-x) (x-x)(x-x)22 (y-y)(y-y) (y-y)(y-y)22
160 55 -13,0 169 -11,0 121
165 58 -8,0 64 -8,0 64
168 58 -5,0 25 -8,0 64
170 61 -3,0 9 -5,0 25
171 67 -2,0 4 1,0 1
175 62 2,0 4 -4,0 16
175 66 2,0 4 0,0 0
180 74 7,0 49 8,0 64
180 79 7,0 49 13,0 169
182 83 9,0 81 17,0 289
1726 663 -4 458 3 813
172,6 66,3
173_
x 66_
y
rr22 = = 0.820.82
Cálculos de los coeficientes Cálculos de los coeficientes con Excelcon Excel
Cálculos de los coeficientes Cálculos de los coeficientes con Excelcon Excel
a
Cálculos de los coeficientes Cálculos de los coeficientes con Excelcon Excel
b
r
Y = -142.9 + 1.21 XLa ecuación con el valor de los parámetros
bXaY
Recommended