6
IES LILA Curso 10/11 1º BACH. MÁT. APLICADAS 1 DOCUMENTO 8: ESTADÍSTICA BIDIMENSIONAL VARIABLES ESTADÍSTICAS BIDIMENSIONALES. Hasta el momento hemos estudiado una sola característica de una población, pero podríamos considerar, simultáneamente, varias de ellas. En concreto, estudiaremos dos características de una población. Una variable así definida se llama bidimensional. Por ejemplo: estudio sobre la relación entre peso y talla en un grupo de personas, gastos en publicidad y número de ventas de un producto, etc. Resumiendo, una variable estadística bidimensional es el estudio conjunto de dos caracteres o variables estadísticas unidimensionales X e Y sobre una misma población. Se representa (X, Y), siendo X una v. e. unidimensional que toma los valores x 1 , x 2 , ,…………x n e Y una v. e. unidimensional que toma los valores y 1 , y 2 , ,…………y n DEPENDENCIA Y CORRELACIÓN. Al considerar dos variables que intervienen en una distribución bidimensional puede ocurrir: Que haya una dependencia funcional entre ellas, de tal modo que a cada valor de una variable le corresponde un único valor de la otra. Ejemplos: altura desde la que cae un cuerpo y tiempo que tarda en llegar al suelo; velocidad a la que se desplaza un móvil y espacio recorrido. En la mayoría de las ocasiones suele existir una fórmula matemática que relaciona ambas variables y nos permite calcular el valor que toma la variable dependiente para un valor dado de la variable independiente. Que haya una dependencia estadística o correlación, de tal manera que exista una relación más o menos fuerte entre ellas. Si la correlación es fuerte, a partir de una variable podría estimarse la otra. La correlación es positiva si a medida que crece una variable crece la otra. Ejemplos: peso de una persona y sus estatura, número de horas de estudio y número de asignaturas aprobadas en la última evaluación. La correlación es negativa si a medida que crece una variable la otra decrece. Ejemplo: temperatura y número de enfermos de gripe, etc. Que se de una independencia o variación aleatoria entre los caracteres. Ejemplos: altura de una persona y cociente intelectual, color de un coche y velocidad que alcanza. ACTIVIDADES 1.- En cada uno de los casos siguientes debes decir, entre las dos variables que se citan, hay relación funcional, independencia o correlación. En este último caso indica si es positiva o negativa y fuerte o débil. Estatura media de los padres- estatura media de los hijos. Temperatura a la que se calienta una barra de hierro-longitud alcanzada Personas que viven en una casa-coste del recibo de la luz Estatura de un/a alumno/a- calificación en matemáticas Número de zapato- estatura de una persona Importe de la factura eléctrica-kilovatios consumidos 2.- Para cada uno de los siguientes casos indica: cuáles son las variables que se relacionan si se trata de una relación funcional o de una relación estadística el signo de la correlación a) dinero invertido en publicidad- ventas obtenidas en una empresa

DOCUMENTO 8: ESTADÍSTICA BIDIMENSIONALCuando uno o dos de los valores de la variable son de carácter continuo, los datos se representan en una tabla de doble entrada o tabla de contingencia,

  • Upload
    others

  • View
    6

  • Download
    0

Embed Size (px)

Citation preview

Page 1: DOCUMENTO 8: ESTADÍSTICA BIDIMENSIONALCuando uno o dos de los valores de la variable son de carácter continuo, los datos se representan en una tabla de doble entrada o tabla de contingencia,

IES LILA Curso 10/11 1º BACH. MÁT. APLICADAS

1

DOCUMENTO 8: ESTADÍSTICA BIDIMENSIONAL

• VARIABLES ESTADÍSTICAS BIDIMENSIONALES. Hasta el momento hemos estudiado una sola característica de una población, pero podríamos considerar, simultáneamente, varias de ellas. En concreto, estudiaremos dos características de una población. Una variable así definida se llama bidimensional. Por ejemplo: estudio sobre la relación entre peso y talla en un grupo de personas, gastos en publicidad y número de ventas de un producto, etc. Resumiendo, una variable estadística bidimensional es el estudio conjunto de dos caracteres o variables estadísticas unidimensionales X e Y sobre una misma población. Se representa (X, Y), siendo X una v. e. unidimensional que toma los valores x1, x2, ,…………xn e Y una v. e. unidimensional que toma los valores y1, y2, ,…………yn

• DEPENDENCIA Y CORRELACIÓN. Al considerar dos variables que intervienen en una distribución bidimensional puede ocurrir:

� Que haya una dependencia funcional entre ellas, de tal modo que a cada valor de una variable le corresponde un único valor de la otra.

Ejemplos: altura desde la que cae un cuerpo y tiempo que tarda en llegar al suelo; velocidad a la que se desplaza un móvil y espacio recorrido.

En la mayoría de las ocasiones suele existir una fórmula matemática que relaciona ambas

variables y nos permite calcular el valor que toma la variable dependiente para un valor dado de la variable independiente.

� Que haya una dependencia estadística o correlación, de tal manera que exista una relación

más o menos fuerte entre ellas. Si la correlación es fuerte, a partir de una variable podría estimarse la otra.

La correlación es positiva si a medida que crece una variable crece la otra. Ejemplos: peso de una persona y sus estatura, número de horas de estudio y número de asignaturas aprobadas en la última evaluación.

La correlación es negativa si a medida que crece una variable la otra decrece. Ejemplo: temperatura y número de enfermos de gripe, etc.

� Que se de una independencia o variación aleatoria entre los caracteres. Ejemplos: altura de una persona y cociente intelectual, color de un coche y velocidad que alcanza.

ACTIVIDADES

1.- En cada uno de los casos siguientes debes decir, entre las dos variables que se citan, hay relación funcional, independencia o correlación. En este último caso indica si es positiva o negativa y fuerte o débil.

• Estatura media de los padres- estatura media de los hijos. • Temperatura a la que se calienta una barra de hierro-longitud alcanzada • Personas que viven en una casa-coste del recibo de la luz • Estatura de un/a alumno/a- calificación en matemáticas • Número de zapato- estatura de una persona • Importe de la factura eléctrica-kilovatios consumidos

2.- Para cada uno de los siguientes casos indica: • cuáles son las variables que se relacionan • si se trata de una relación funcional o de una relación estadística • el signo de la correlación

a) dinero invertido en publicidad- ventas obtenidas en una empresa

Page 2: DOCUMENTO 8: ESTADÍSTICA BIDIMENSIONALCuando uno o dos de los valores de la variable son de carácter continuo, los datos se representan en una tabla de doble entrada o tabla de contingencia,

IES LILA Curso 10/11 1º BACH. MÁT. APLICADAS

2 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6 6.5

10

20

30

40

50

60

70

80

90

100

x

f(x)

b) Entre los países europeos: volumen de exportación-volumen de importación (con España) c) Entre los países del mundo: índice de mortalidad infantil- número de médicos por cada 1000

habitantes. d) Temperatura ambiental-número de quemados por el sol.

• CORRELACIÓN Y CAUSALIDAD.

DOCUMENTO 9: TABLAS BIDIMENSIONALES DE FRECUENCIAS. DIAGRAMA DE DISPERSIÓN O NUBE DE PUNTOS.

• DIAGRAMA DE DISPERSIÓN

De modo similar al caso unidimensional, podemos recoger la información relativa a una variable bidimensional en una tabla. Por ejemplo, los gastos en publicidad (en miles de euros) y las ventas de una compañía (en miles de euros) fueron en diez años consecutivos, los siguientes: PUBLICIDAD 7 8 8,5 10 11 12,5 13 14 15 17 VENTAS 200 210 230 235 240 280 270 305 315 325

Estos datos se pueden representar en los llamados diagramas de dispersión. Los puntos (x, y) se

sitúan sobre unos ejes de coordenadas, siendo x el primer valor de la variable independiente e y el primer valor de la variable dependiente.

El conjunto de puntos resultantes (nube de puntos) nos

da una primera idea de la relación existente entre los datos. En el ejemplo parece que se ajustan a una recta, lo que nos hace pensar que existe una dependencia estadística entre los gastos de publicidad y las ventas de la compañía.

Page 3: DOCUMENTO 8: ESTADÍSTICA BIDIMENSIONALCuando uno o dos de los valores de la variable son de carácter continuo, los datos se representan en una tabla de doble entrada o tabla de contingencia,

IES LILA Curso 10/11 1º BACH. MÁT. APLICADAS

3

Aumento de peso mensual (gr)

Aumento de peso mensual (gr)

Aumento de peso mensual (gr)

Podemos interpretar gráficamente los tres tipos de relación considerados en el documento anterior

según su nube de puntos. Fíjate en los siguientes ejemplos:

ACTIVIDADES

1.- Indica en los siguientes diagramas de dispersión si existe o no dependencia y, en caso de que exista, di si es lineal o curvilínea, positiva o negativa, fuerte o débil.

2.- Realizamos un experimento que consiste en suministrar a cada una de 10 ratas una dosis diaria de 1mg, 2 mg.....10mg respectivamente de cierto fármaco A y calculamos el aumento de peso de cada rata al cabo de un mes. Realizamos un segundo experimento idéntico con otras 10 ratas y otro fármaco B y, por último, un tercer experimento con otras 10 ratas y otro fármaco C. Los resultados obtenidos se reflejan en las siguientes gráficas:

Interpreta los resultados obtenidos con cada uno de los fármacos.

3.- Estas nubes de puntos muestran una correlación positiva entre variables. ¿En cuál de ellas la correlación es más fuerte? 4.- Estas nubes de puntos muestran una correlación negativa entre variables. ¿En cuál de ellas la correlación es más fuerte?

correlación lineal + fuerte dependencia funcional correlación lineal – débil independencia dependencia funcional

mg diarios de A mg diarios de B mg diarios de C

Page 4: DOCUMENTO 8: ESTADÍSTICA BIDIMENSIONALCuando uno o dos de los valores de la variable son de carácter continuo, los datos se representan en una tabla de doble entrada o tabla de contingencia,

IES LILA Curso 10/11 1º BACH. MÁT. APLICADAS

4

0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6 6.5

10

20

30

40

50

60

70

80

90

100

x

f(x)

0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6 6.5

10

20

30

40

50

60

70

80

90

100

x

f(x)

5.- La tabla siguiente muestra la clasificación de 10 países en función del Indicador de Desarrollo Humano (IDH) y el Índice bruto de escolaridad (en %) según El estado del mundo (Anuario económico geopolítico mundial) de 2010:

PAÍS Clasificación según IDH Índice bruto de escolaridad (%)

España 16 96,5 Emiratos Árabes 31 65,8 Venezuela 61 79,7 China 94 68,7 Vietnam 114 62,3 Camerún 150 50,8 Marruecos 127 59,6 Grecia 23 81

a) Con estos datos, dibuja una nube de puntos. En el eje horizontal pon la clasificación de los países y

en el eje vertical, el índice bruto de escolaridad. b) Di si la correlación entre las dos variables es fuerte o débil, positiva o negativa. Razona tu

respuesta. • TABLAS BIDIMENSIONALES DE FRECUENCIAS

En los ejemplos anteriores los valores de la variable bidimensional (X, Y) no aparecen repetidos, pero pueden estarlo como en el ejemplo que tienes a continuación:

Las calificaciones de 40 alumn@s en Matemáticas y Física fueron las siguientes:

X (calificación en Matemáticas) 3 4 5 6 6 7 7 8 10

Y (calificación en Física) 2 5 5 6 7 6 7 9 10

Nº de alumn@s 4 6 12 4 5 4 2 1 2

A este tipo de tabla se le denomina tabla simple. El diagrama de dispersión correspondiente a este

ejemplo lo podemos representar de dos formas distintas:

Cuando uno o dos de los valores de la variable son de carácter continuo, los datos se representan

en una tabla de doble entrada o tabla de contingencia, como en el ejemplo que tienes a continuación. Los pesos y estaturas de una muestra de 50 personas son los siguientes:

Pesos (X) Estaturas (Y)

[60, 70 ) [70, 80 ) [80, 90 ) [90, 100 ) TOTALES

[1, 60, 1,65 ) 4 2 [1,65, 1,70 ) 3 6 2 [1,70, 1,75 ) 1 8 6 2 [1,75, 1,80 ) 1 5 4 [1,80, 1,85 ) 1 2 3 TOTALES

Page 5: DOCUMENTO 8: ESTADÍSTICA BIDIMENSIONALCuando uno o dos de los valores de la variable son de carácter continuo, los datos se representan en una tabla de doble entrada o tabla de contingencia,

IES LILA Curso 10/11 1º BACH. MÁT. APLICADAS

5

0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6 6.5

10

20

30

40

50

60

70

80

90

100

x

f(x)

En este caso los datos también se pueden representar en un diagrama de dispersión o nube de puntos:

A partir de la tabla de distribución de una variable bidimensional se pueden construir las llamadas distribuciones marginales: la distribución marginal de la variable X y la distribución marginal de la variable Y. Siguiendo con el ejemplo anterior, las distribuciones marginales serían: Distribución marginal de X: Distribución marginal de Y: Pesos [60, 70 ) [70, 80 ) [80, 90 ) [90, 100 ) Estataturas

fi

fi A partir de las distribuciones marginales podemos realizar un estudio estadístico de ambas variables (cálculo de parámetros de centralización, dispersión…)

ACTIVIDADES

6.- Se realizó un estudio del número de hijos e hijas en una serie de familias, obteniéndose los siguientes resultados: Nº de hijos (x) 0 0 1 1 2 2 3 3 5 6 6 Nª de hijas (y) 0 1 2 3 2 3 3 0 1 2 3 Nº de familias (fi) 5 10 20 15 2 6 8 10 14 12 2

a) Representa el diagrama de puntos e indica si existe alguna correlación entre las dos variables. b) Haz las distribuciones marginales y calcula la media y la desviación típica de x e y.

7.- En una muestra de 64 familias se estudió el número de miembros en edad laboral, x, y el número de ellos que están en activo, y, Los resultados son los de la siguiente tabla:

Y X 1 2 3 1 6 0 0 2 10 2 0 3 12 5 1 4 16 8 4

a) Representa el diagrama de dispersión e indica qué tipo de relación existe entre ambas variables. b) Haz las distribuciones marginales y calcula la media y desviación típica de X e Y.

Page 6: DOCUMENTO 8: ESTADÍSTICA BIDIMENSIONALCuando uno o dos de los valores de la variable son de carácter continuo, los datos se representan en una tabla de doble entrada o tabla de contingencia,

IES LILA Curso 10/11 1º BACH. MÁT. APLICADAS

6

8.- De una encuesta realizada entre 40 alumnos y alumnas de 2º de ESO, para estudiar si el número de horas que ven semanalmente la televisión tiene alguna relación con la posición económica de los padres, se obtuvo la siguiente tabla:

Ingresos mensuales (en euros) X Horas semanales Y [360, 421) [421, 482) [482, 543)

[10, 20) 3 2 0 [20, 30) 4 6 6 [30, 40) 11 4 3 [40, 50) 1 0 0

a) Representa el diagrama de dispersión e indica qué tipo de relación existe entre ambas variables. b) Haz las distribuciones marginales y calcula la media y desviación típica de X e Y.

9.- Identifica cada representación gráfica con alguna de las siguientes tablas de doble entrada: