64
Fundamentos de Biología Aplicada I Cuaderno de Prácticas de Estadística con SPSS Curso 2010-2011 Departamento de Estadística e I.O. Universidad de Granada Autores: Ana María Lara Porras Nuria Rico Castro Ismael R. Sánchez Borrego Profesores de la asignatura: Javier Esquivel Sánchez Mª Dolores Huete Ruiz Ismael R. Sánchez Borrego Diego Torrecillas de Amo Silvia Valenzuela Ruiz

Cuaderno de practicas diseño exp

Embed Size (px)

Citation preview

Page 1: Cuaderno de practicas diseño exp

Fundamentos de Biología

Aplicada I

Cuaderno de Prácticas de Estadística con SPSS

Curso 2010-2011

Departamento de Estadística e I.O. Universidad de Granada

Autores: Ana María Lara Porras Nuria Rico Castro Ismael R. Sánchez Borrego

Profesores de la asignatura: Javier Esquivel Sánchez Mª Dolores Huete Ruiz Ismael R. Sánchez Borrego Diego Torrecillas de Amo Silvia Valenzuela Ruiz

Page 2: Cuaderno de practicas diseño exp
Page 3: Cuaderno de practicas diseño exp

Índice

pág.CONTRASTES DE HIPÓTESIS PARAMÉTRICOS Y NO PARAMÉTRICOS

3

Ejercicio 1 3 Ejercicio 2 5 Ejercicio 3 6 Ejercicio 4 7 Ejercicio 5 9

ANÁLISIS DE REGRESIÓN 10 Ejercicio 1 10 Ejercicio 2 14 Ejercicio 3 17 Ejercicio 4 19 Ejercicio 5 22

DISEÑO DE EXPERIMENTOS 25 Ejercicio 1 25 Ejercicio 2 27 Ejercicio 3 28 Ejercicio 4 29 Ejercicio 5 31 Ejercicio 6 33

ANÁLISIS DE LA COVARIANZA 35 Ejercicio 1 35 Ejercicio 2 37 Ejercicio 3 39 Ejercicio 4 41

ANÁLISIS CLUSTER 43 Ejercicio 1 43 Ejercicio 2 50

ANÁLISIS DE DATOS CUALITATIVOS 54 Ejercicio 1 54 Ejercicio 2 57 Ejercicio 3 60

Bibliografía 62

Page 4: Cuaderno de practicas diseño exp
Page 5: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 3

Departamento de Estadística e I.O. Universidad de Granada

CONTRASTES DE HIPÓTESIS PARAMÉTRICOS Y NO PARAMÉTRICOS

Ejercicio 1: En un estudio sobre angina de pecho en ratas se dividió aleatoriamente a 18 animales afectados en dos grupos de 9 individuos cada uno. A un grupo se le suministró un placebo y al otro un fármaco experimental FL113. Después de un ejercicio controlado sobre una “cinta sin fin” se determinó el tiempo de recuperación de cada rata. Se piensa que el FL113 reducirá el tiempo medio de recuperación. Se dispone de la siguiente información:

Placebo 203 229 215 220 223 233 208 228 209 FL113 221 207 185 203 187 190 195 204 212

Suponiendo que las distribuciones del tiempo necesario para la recuperación son

normales, comparar las muestras dadas para saber si se puede admitir que ambas muestras provienen de la misma población. Efectuar los correspondientes contrastes (sobre medias y varianzas) al nivel de significación α = 0.05.

X: “tiempo de recuperación de las ratas tratadas con placebo” → N(μ1, σ1) Y: “tiempo de recuperación de las ratas tratadas con FL113” → N(μ2, σ2)

Primer contraste H0: μ1= μ2 H1: μ1≠ μ2

Segundo contraste H0: σ12= σ2

2 H1: σ1

2≠ σ22

Page 6: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 4

Departamento de Estadística e I.O. Universidad de Granada

Estadísticos de grupo

Grupo placebo o FL113 N Media Desviación típ. Error típ. de la

media Tiempo de recuperación Grupo placebo 9 218,67 10,524 3,508 Grupo FL113 9 200,44 12,126 4,042

Page 7: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 5

Departamento de Estadística e I.O. Universidad de Granada

Ejercicio 2: Se ha realizado un estudio para investigar el efecto del ejercicio físico en el nivel de colesterol en plasma, en el que participaron 11 sujetos. Antes del ejercicio, se tomaron muestras de sangre para determinar el nivel del colesterol de cada participante. Después, los individuos fueron sometidos a un programa de ejercicios que se centraba en carreras y marchas diarias. Al final del periodo de ejercicios, se tomaron nuevamente muestras de sangre y se obtuvo una segunda lectura del nivel de colesterol en plasma de los sujetos. Se quiere estimar la diferencia entre el nivel medio de colesterol antes y después del ejercicio. Se recogieron los siguientes datos

Decidir si existen diferencias significativas entre estos niveles antes y después del ejercicio físico.

Prueba de muestras relacionadas

33,18 51,066 15,397 -1,12 67,49 2,155 10 ,057Colesterol antes dejercicio - Colestedespues del ejerc

Par 1Media

Desviacióntíp.

Error típ. dela media Inferior Superior

95% Intervalo deconfianza para la

diferencia

Diferencias relacionadas

t gl Sig. (bilateral)

Nivel previo mg/dl Nivel posterior mg/dl 182 198 232 210 191 194 200 220 148 138 249 220 276 219 213 161 241 210 480 313 262 226

Page 8: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 6

Departamento de Estadística e I.O. Universidad de Granada

Ejercicio 3: En unos laboratorios clínicos se toman muestras de 650 análisis de sangre y se anota el número de eritrocitos por milímetro cúbico de sangre. ¿Se puede admitir que el número de eritrocitos se distribuye normalmente? Los resultados agrupados en 7 clases son los que figuran en la tabla adjunta

Nº de eritrocitos en millones Nº de muestras 0-2,5 8

2.5-3.5 52 3.5-4.5 140 4.5-5.5 210 5.5-6.5 160 6.5-7.5 70 7.5-8.5 10

Prueba de Kolmogorov-Smirnov para una muestra

Eritrocitos N 650

Parámetros normales(a,b) Media 5,0862 Desviación típica

1,23238

Diferencias más extremas Absoluta ,164 Positiva ,159 Negativa -,164

Z de Kolmogorov-Smirnov 4,192 Sig. asintót. (bilateral) ,000

a La distribución de contraste es la Normal. b Se han calculado a partir de los datos.

Page 9: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 7

Departamento de Estadística e I.O. Universidad de Granada

Ejercicio 4: Se realiza una investigación para determinar si el hecho de contraer hepatitis es independiente de haber sido vacunado contra la enfermedad. Para ello se utilizan 1083 voluntarios varones. De ellos, se eligen aleatoriamente 549 y son vacunados con un nuevo fármaco. Los restantes, 534, no son vacunados. Después de un cierto tiempo, se observó que 70 de los 534 voluntarios no vacunados contrajeron la hepatitis, mientras que solamente 11 de los 549 vacunados no la contrajeron. Los datos se muestran en la tabla adjunta

Vacunación

Hepatitis SI NO SI 11 70

NO 538 464 Contrastar la independencia entre la vacunación y la enfermedad con α=0.05.

Tabla de contingencia HEPATITI * VACUNACI

Recuento

VACUNACI Total

no si HEPATITI no 464 538 1002 si 70 11 81 Total 534 549 1083

Page 10: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 8

Departamento de Estadística e I.O. Universidad de Granada

Pruebas de chi-cuadrado

Valor gl Sig. asintótica

(bilateral) Sig. exacta (bilateral)

Sig. exacta (unilateral)

Chi-cuadrado de Pearson 48,242(b) 1 ,000 Corrección por continuidad(a) 46,650 1 ,000

Razón de verosimilitud 53,194 1 ,000 Estadístico exacto de Fisher ,000 ,000

Asociación lineal por lineal 48,197 1 ,000

N de casos válidos 1083 a Calculado sólo para una tabla de 2x2. b 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 39,94.

Page 11: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 9

Departamento de Estadística e I.O. Universidad de Granada

Ejercicio 5: Se realiza un estudio para investigar la asociación entre el color de las flores y la fragancia de las azaleas silvestres. Se observan 200 plantas floridas seleccionadas aleatoriamente. Cada una de ellas se clasifica según el color y la presencia o ausencia de fragancia. Los datos se muestran en la tabla adjunta

Color Fragancia Blanca Rosa Naranja

SI 12 60 58 NO 50 10 10

Pruebas de chi-cuadrado

Valor gl Sig. asintótica

(bilateral) Chi-cuadrado de Pearson 82,293(a) 2 ,000 Razón de verosimilitud 83,848 2 ,000 Asociación lineal por lineal 59,712 1 ,000 N de casos válidos

200

a 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 21,70.

Page 12: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 10

Departamento de Estadística e I.O. Universidad de Granada

ANÁLISIS DE REGRESIÓN Ejercicio 1: Se realiza un estudio para establecer una ecuación mediante la cual se pueda utilizar la longitud en cm. de una cierta variedad de planta al cabo de un año de vida para predecir la longitud de esa variedad de planta en edad adulta:

Longitud en cm. el primer año

Longitud en cm. en edad adulta

15.3 30.7 14.8 32.5 12.6 26.3 18.4 35.9 17.9 34.3 15.6 28.5 18.4 37.4 14.1 29.7 20.2 38.8 21.7 40.4 20.4 40.9 16.5 33.3 15.9 30.1 17.9 35.7 16.7 31.4

Se pide:

a) Representar el diagrama de dispersión b) Estimar los parámetros del modelo c) Coeficientes de correlación lineal y de determinación. Interpretación d) Plantear y contrastar el test para conocer la significación de la variable

independiente a un nivel de significación del 5 %

Page 13: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 11

Departamento de Estadística e I.O. Universidad de Granada

a) Diagrama de dispersión

Page 14: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 12

Departamento de Estadística e I.O. Universidad de Granada

LONG_1

222018161412

LON

G_A

DU

42

40

38

36

34

32

30

28

26

b) Estimación de los parámetros del modelo

Coeficientesa

5,296 2,694 1,965 ,0711,663 ,156 ,947 10,657 ,000

(Constante)LONG_1

Modelo1

B Error típ.

Coeficientes noestandarizados

Beta

Coeficientesestandarizad

ost Sig.

Variable dependiente: LONG_ADUa.

Page 15: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 13

Departamento de Estadística e I.O. Universidad de Granada

c) Coeficientes de correlación lineal y de determinación. Interpretación

Resumen del modelo

,947a ,897 ,889 1,4666Modelo1

R R cuadradoR cuadradocorregida

Error típ. de laestimación

Variables predictoras: (Constante), LONG_1a.

d) Test de significación de la variable independiente.

ANOVAb

244,306 1 244,306 113,577 ,000a

27,963 13 2,151272,269 14

RegresiónResidualTotal

Modelo1

Suma decuadrados gl

Mediacuadrática F Sig.

Variables predictoras: (Constante), LONG_1a.

Variable dependiente: LONG_ADUb.

Page 16: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 14

Departamento de Estadística e I.O. Universidad de Granada

Ejercicio 2: Se realiza un estudio para establecer una ecuación mediante la cual se pueda utilizar la concentración de estrona en la saliva para predecir la concentración de dicho esteroide en plasma libre. Se tomaron los siguientes datos de 13 varones sanos:

Concentración de estrona en saliva pg./mL.

Concentración de estrona en plasma libre en pg./mL.

7.4 30 7.5 25 8.5 31.5 9 27.5 9 39.5 11 38 13 43 14 49

14.5 55 16 48.5 17 51 18 64.5 20 63

Se pide:

a) Representar el diagrama de dispersión b) Plantear el modelo de regresión y estimar los parámetros del modelo.

Interprétalos c) Obtener el coeficiente de correlación lineal de Pearson y el coeficiente de

determinación d) Obtener un intervalo de confianza al 95 % para la pendiente de la recta de

regresión e) Contrastar la significación del coeficiente de regresión

a) Diagrama de dispersión

saliva20,017,515,012,510,07,5

estr

ona

70,0

60,0

50,0

40,0

30,0

20,0

Page 17: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 15

Departamento de Estadística e I.O. Universidad de Granada

b) Planteamiento del modelo, estimación de los parámetros y su interpretación

Coeficientesa

6,887 3,965 1,737 ,1102,886 ,297 ,946 9,705 ,000

(Constante)saliva

Modelo1

B Error típ.

Coeficientes noestandarizados

Beta

Coeficientesestandarizad

ost Sig.

Variable dependiente: plasmaa.

c) Coeficiente de correlación lineal de Pearson y coeficiente de determinación

Resumen del modelo

,946a ,895 ,886 4,3997Modelo1

R R cuadradoR cuadradocorregida

Error típ. de laestimación

Variables predictoras: (Constante), salivaa.

d) Obtener un intervalo de confianza al 95 % para la pendiente de la recta de regresión

Coeficientesa

6,887 3,965 1,737 ,110 -1,841 15,6142,886 ,297 ,946 9,705 ,000 2,232 3,541

(Constante)saliva

Modelo1

B Error típ.

Coeficientes noestandarizados

Beta

Coeficientesestandarizad

os

t Sig. Límite inferiorLímite

superior

Intervalo de confianza paraB al 95%

Variable dependiente: plasmaa.

Page 18: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 16

Departamento de Estadística e I.O. Universidad de Granada

e) Contrastar la significación del coeficiente de regresión

ANOVAb

1823,070 1 1823,070 94,180 ,000a

212,930 11 19,3572036,000 12

RegresiónResidualTotal

Modelo1

Suma decuadrados gl

Mediacuadrática F Sig.

Variables predictoras: (Constante), salivaa.

Variable dependiente: plasmab.

Page 19: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 17

Departamento de Estadística e I.O. Universidad de Granada

Ejercicio 3: Un aficionado a las apuestas en las carreras de caballos desea estudiar la descendencia de una conocida raza de caballos que tiene mucho éxito en dichas carreras. Para ello estudia la relación existente entre el peso en gramos de embriones de caballos y el número de días transcurridos de vida de los mismos. Los datos aparecen en la siguiente tabla:

Días Peso 7 51.3 8 79.1 9 127.4 10 183.5 11 271.3 12 431.5 13 743.7 14 1143.2 15 1893.8 16 3102.4 17 4702.7

Se pide: a) Representar la nube de puntos b) Plantear el modelo de regresión y obtener la ecuación del modelo ajustado c) Bondad del ajuste

a) Representar la nube de puntos

DIAS

181614121086

PE

SO

5000

4000

3000

2000

1000

0

-1000

b) Plantear el modelo de regresión y obtener la ecuación del modelo ajustado.

MODEL: MOD_1.

Page 20: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 18

Departamento de Estadística e I.O. Universidad de Granada

Lineal

ANOVA

16841317 1 16841317 25,551 ,0015932167,3 9 659129,69522773485 10

RegresiónResidualTotal

Suma decuadrados gl

Mediacuadrática F Sig.

La variable independiente esdías.

Resumen del modelo

,860 ,740 ,711 811,868R R cuadrado

R cuadradocorregida

Error típico dela estimación

La variable independiente esdías.

Exponencial

ANOVA

22,756 1 22,756 6384,193 ,000,032 9 ,004

22,789 10

RegresiónResidualTotal

Suma decuadrados gl

Mediacuadrática F Sig.

La variable independiente esdías.

Resumen del modelo

,999 ,999 ,998 ,060R R cuadrado

R cuadradocorregida

Error típico dela estimación

La variable independiente esdías.

Page 21: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 19

Departamento de Estadística e I.O. Universidad de Granada

Ejercicio 4: Una empresa fabricante de cereales para el desayuno desea conocer la ecuación que permita predecir las ventas (en miles de euros) en función de los gastos en publicidad infantil en televisión (en miles de euros), el tiempo diario de aparición en televisión (en minutos) y los gastos en publicidad en los periódicos (en miles de euros). Se realiza un estudio en el que se reúnen los datos mensuales correspondientes a los últimos 20 meses. Estos datos aparecen en la siguiente tabla:

Ventas Pub. en tv.

Tiempo en tv.

Pub. en per.

10 1 50 0.4 12 1.2 57 0.4 11 1.3 56 0.42 13 1.4 55 0.5 12 1.5 60 0.4 14 1.7 65 0.44 16 1.75 69 0.4 12 1.3 67 0.44 14 1.45 68 0.46 11 0.9 67 0.46 10 0.8 97 0.45 19 0.9 66 1.1 8.5 0.8 65 0.3 8 1 60 0.5 9 1.7 70 0.45 13 1.8 110 0.4 16 1.85 75 0.8 18 1.9 80 0.9 20 2 85 0.9 22 2 90 1.1

Se pide:

a) Ajustar un modelo de regresión lineal múltiple. Obtener una estimación de los

parámetros del modelo y su interpretación b) Obtener e interpretar el valor de la suma de cuadrados residual c) Contrastar la significación del modelo propuesto

Page 22: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 20

Departamento de Estadística e I.O. Universidad de Granada

a) Ajustar un modelo de regresión lineal múltiple. Obtener una estimación de los parámetros del modelo y su interpretación

Coeficientesa

2,108 2,055 1,026 ,3203,432 1,121 ,358 3,060 ,007

1,477E-03 ,030 ,006 ,050 ,96111,347 1,802 ,711 6,298 ,000

(Constante)PUBL_TVTIEMP_TVPUBL_PER

Modelo1

B Error típ.

Coeficientes noestandarizados

Beta

Coeficientesestandarizad

ost Sig.

Variable dependiente: VENTASa.

b) Obtener e interpretar el valor de la suma de cuadrados residual

ANOVAb

247,677 3 82,559 26,440 ,000a

49,960 16 3,123297,638 19

RegresiónResidualTotal

Modelo1

Suma decuadrados gl

Mediacuadrática F Sig.

Variables predictoras: (Constante), PUBL_PER, TIEMP_TV, PUBL_TVa.

Variable dependiente: VENTASb.

Page 23: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 21

Departamento de Estadística e I.O. Universidad de Granada

c) Contrastar la significación del modelo propuesto

ANOVAb

247,677 3 82,559 26,440 ,000a

49,960 16 3,123297,638 19

RegresiónResidualTotal

Modelo1

Suma decuadrados gl

Mediacuadrática F Sig.

Variables predictoras: (Constante), PUBL_PER, TIEMP_TV, PUBL_TVa.

Variable dependiente: VENTASb.

Page 24: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 22

Departamento de Estadística e I.O. Universidad de Granada

Ejercicio 5: Se desea estudiar la relación entre la intensidad de regadío (medida en litros por metro cuadrado) y la productividad (medida en Kg/Ha) de una huerta de tomates. Se han obtenido los siguientes datos:

Productividad de un cultivo

Intensidad de regadío

2500.9 590.5 2000.8 540.4 3300.4 690 2500.6 605.2 1995.8 650 3312.3 724 3409 704.8

Se pide:

a) ¿Podemos afirmar la existencia de relación lineal entre las variables? b) Coeficiente de correlación y coeficiente de determinación. Interpretación Además del regadío se cree que el empleo de un abono ha influido de forma lineal en la productividad del cultivo. Por tanto se introduce en el modelo de regresión la variable que mide el número de Kg. de abono por hectárea. Abono 200.6 160.6 407.6 212.7 145 387.8 355 c) Ajustar un modelo de regresión lineal múltiple d) Interpretación de los coeficientes del modelo de regresión. ¿Qué variable tiene

mayor influencia en la variación de la productividad? e) Valor de la suma de cuadrados de la regresión. Interpretación f) Contrastar la significación del modelo propuesto g) Coeficiente de determinación múltiple y coeficiente de determinación múltiple

corregido. Interpretación h) ¿Ha sido útil la adición de la variable abono?

Page 25: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 23

Departamento de Estadística e I.O. Universidad de Granada

a) ¿Muestran los datos una relación lineal?

REGADIO

800700600500

PR

OD

UC

T

3600

3400

3200

3000

2800

2600

2400

2200

2000

1800

ANOVAb

1557184,3 1 1557184,3 10,479 ,023a

743017,305 5 148603,4612300201,6 6

RegresiónResidualTotal

Modelo1

Suma decuadrados gl

Mediacuadrática F Sig.

Variables predictoras: (Constante), REGADIOa.

Variable dependiente: PRODUCTb.

b) Coeficiente de correlación lineal y coeficiente de determinación. Interpretación

Correlaciones

1,000 ,823,823 1,000

, ,012,012 ,

7 77 7

PRODUCTREGADIOPRODUCTREGADIOPRODUCTREGADIO

Correlación de Pearson

Sig. (unilateral)

N

PRODUCT REGADIO

Resumen del modelo

,823a ,677 ,612 385,491Modelo1

R R cuadradoR cuadradocorregida

Error típ. de laestimación

Variables predictoras: (Constante), REGADIOa.

Page 26: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 24

Departamento de Estadística e I.O. Universidad de Granada

c) Ajustar un modelo de regresión lineal múltiple Coeficientesa

942,755 988,031 ,954 ,394,674 1,897 ,073 ,355 ,740

5,021 1,141 ,911 4,402 ,012

(Constante)REGADIOABONO

Modelo1

B Error típ.

Coeficientes noestandarizados

Beta

Coeficientes

estandarizados

t Sig.

Variable dependiente: PRODUCTa.

e) Valor de la suma de cuadrados de la regresión. Interpretación

ANOVAb

2173045,5 2 1086522,8 34,179 ,003a

127156,069 4 31789,0172300201,6 6

RegresiónResidualTotal

Modelo1

Suma decuadrados gl

Mediacuadrática F Sig.

Variables predictoras: (Constante), ABONO, REGADIOa.

Variable dependiente: PRODUCTb.

g) Coeficiente de determinación múltiple y coeficiente de determinación múltiple corregido

Resumen del modelo

,972a ,945 ,917 178,295Modelo1

R R cuadradoR cuadradocorregida

Error típ. de laestimación

Variables predictoras: (Constante), ABONO, REGADIOa.

Page 27: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 25

Departamento de Estadística e I.O. Universidad de Granada

DISEÑO DE EXPERIMENTOS

Ejercicio 1: Se sabe que el dióxido de carbono tiene un efecto crítico en el crecimiento microbiológico. Cantidades pequeñas de CO2 estimulan el crecimiento de muchos microorganismos, mientras que altas concentraciones inhiben el crecimiento de la mayor parte de ellos. Este último efecto se utiliza comercialmente cuando se almacenan productos alimenticios perecederos. Se realizó un estudio para investigar el efecto del CO2 sobre la tasa de crecimiento de Pseudomonas fragi, un corruptor de alimentos. Se administró dióxido de carbono a cinco presiones atmosféricas diferentes. La respuesta anotada fue el cambio porcentual en la masa celular después de un tiempo de crecimiento de una hora. Se utilizaron diez cultivos en cada nivel. Se obtuvieron los siguientes datos:

Nivel del factor (presión de CO2 en atmósferas) 0.0 0.083 0.29 0.5 0.86 62.6 50.9 45.5 29.5 24.9 59.6 44.3 41.1 22.8 17.2 64.5 47.5 29.8 19.2 7.8 59.3 49.5 38.3 20.6 10.5 58.6 48.5 40.2 29.2 17.8 64.6 50.4 38.5 24.1 22.1 50.9 35.2 30.2 22.6 22.6 56.2 49.9 27 32.7 16.8 52.3 42.6 40 24.4 15.9 62.8 41.6 33.9 19.6 8.8

a) Se suponen efectos fijos: ¿qué implica esto respecto de los niveles atmosféricos elegidos?

b) Plantear la hipótesis nula a contrastar c) Evaluar el estadístico F utilizado para contrastar H0 d) ¿Puede rechazarse H0? Explicarlo basándose en el p-valor del contraste

Page 28: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 26

Departamento de Estadística e I.O. Universidad de Granada

ANOVA

CRECIMIE

11274,319 4 2818,580 101,628 ,0001248,038 45 27,734

12522,357 49

Inter-gruposIntra-gruposTotal

Suma decuadrados gl

Mediacuadrática F Sig.

Page 29: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 27

Departamento de Estadística e I.O. Universidad de Granada

Ejercicio 2: Una compañía textil utiliza diversos telares para la producción de telas. Aunque se desea que los telares sean homogéneos con el objeto de producir tela de resistencia uniforme se supone que puede existir una variación significativa en la resistencia de la tela debida a la utilización de distintos telares. A su disposición tiene 5 tipos de telares con los que realiza determinaciones de la resistencia de la tela. Este experimento se realiza en orden aleatorio y los resultados se muestran en la tabla adjunta. Analizar los datos y obtener las conclusiones apropiadas.

Telares Resistencia 1 51 49 50 49 51 50 2 56 60 56 56 57 3 48 50 53 44 45 4 47 48 49 44 5 43 43 46 47 45 46

a) Plantear la hipótesis nula a contrastar b) ¿Puede rechazarse 0H ? Explicarlo basándose en el p-valor del contraste c) Comprobar la hipótesis de homocedasticidad

ANOVA

RESIST

439,885 4 109,971 23,565 ,00098,000 21 4,667

537,885 25

Inter-gruposIntra-gruposTotal

Suma decuadrados gl

Mediacuadrática F Sig.

Prueba de homogeneidad de varianzas

RESIST

2,367 4 21 ,086

Estadísticode Levene gl1 gl2 Sig.

Page 30: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 28

Departamento de Estadística e I.O. Universidad de Granada

Ejercicio 3: En una determinada fábrica de galletas se desea saber si las harinas de sus cuatro proveedores producen la misma viscosidad en la masa. Para ello, produce durante un día 16 masas, 4 de cada tipo de harina y mide su viscosidad. Los resultados obtenidos se muestran en la siguiente tabla:

Proveedor A

Proveedor B

Proveedor C

Proveedor D

98 97 99 96 91 90 93 92 96 95 97 95 95 96 99 98

a) Plantear la hipótesis nula a contrastar b) ¿Puede rechazarse 0H ? Explicarlo basándose en el p-valor del contraste c) Comprobar la hipótesis de normalidad

ANOVA

VISCOSID

14,188 3 4,729 ,581 ,63997,750 12 8,146

111,938 15

Inter-gruposIntra-gruposTotal

Suma decuadrados gl

Mediacuadrática F Sig.

Normal gráfico Q-Q de Residuo para VIS

Valor observado

6420-2-4-6

Val

or N

orm

al e

sper

ado

6

4

2

0

-2

-4

-6

Page 31: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 29

Departamento de Estadística e I.O. Universidad de Granada

Ejercicio 4: Los científicos comprometidos en el tratamiento del agua residual de arenas asfálticas estudiaron tres métodos de tratamientos para la eliminación del carbono orgánico (basado en W.R. Pirie, Statistical Planning and Analysis for Treatments of Tar Sand Waste-water, Centro de Información Técnica, Oficina de Información Tecnológica y Científica, Departamento de Energía de Estados Unidos). Los tres métodos de tratamiento utilizados fueron: flotación de aire (FA), separación de espuma (SF) y coagulación ferroclórica (CFC). Las mediciones del material de carbono orgánico para los tres tratamientos arrojaron los siguientes datos:

FA SE CFC34.6 38.8 26.7 35.1 39.0 26.7 35.6 40.1 27.0 35.8 40.9 27.1 36.1 41.0 27.5 36.5 43.2 28.1 36.8 44.9 28.1 37.2 46.9 28.7 37.4 51.6 30.7 37.7 53.6 31.2

a) Contrastar 0 1 2 3:H μ μ μ= = al nivel α =0.10 b) Si se rechaza 0H utilizar los contrastes de Tukey para precisar qué métodos difieren

estadísticamente entre sí

ANOVA

CARBONO

1251,603 2 625,801 60,742 ,000278,172 27 10,303

1529,775 29

Inter-gruposIntra-gruposTotal

Suma decuadrados gl

Mediacuadrática F Sig.

Page 32: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 30

Departamento de Estadística e I.O. Universidad de Granada

Comparaciones múltiples

Variable dependiente: carbonoHSD de Tukey

-7,72000* 1,43546 ,000 -10,7960 -4,64408,10000* 1,43546 ,000 5,0240 11,17607,72000* 1,43546 ,000 4,6440 10,7960

15,82000* 1,43546 ,000 12,7440 18,8960-8,10000* 1,43546 ,000 -11,1760 -5,0240

-15,82000* 1,43546 ,000 -18,8960 -12,7440

(J) metodo231312

(I) metodo1

2

3

Diferencia demedias (I-J) Error típico Sig. Límite inferior

Límitesuperior

Intervalo de confianza al90%

La diferencia entre las medias es significativa al nivel .1.*.

Page 33: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 31

Departamento de Estadística e I.O. Universidad de Granada

Ejercicio 5: Se ha realizado un estudio sobre el efecto de las temporadas de caza del ciervo en los hábitos de éstos. Se seleccionan cuatro sendas que se sabe utilizan los ciervos. Antes de comenzar la temporada de caza, durante la temporada y al terminar la temporada se determinó el promedio de huellas halladas por semana en un área específica de cada senda. Las sendas se trataron como bloques y se obtuvieron los siguientes datos:

Senda Antes Durante Después 1 62.5 57 49 2 46.5 53.3 50 3 45 59.3 37 4 24 35.7 50

a) Contrastar la hipótesis nula de igualdad de medias en los tratamientos al nivel α =0.05 b) Contrastar la hipótesis nula de igualdad de medias en los bloques al nivel α =0.05

Page 34: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 32

Departamento de Estadística e I.O. Universidad de Granada

Pruebas de los efectos inter-sujetos

Variable dependiente: HUELLAS

700,631a 5 140,126 1,376 ,35127008,541 1 27008,541 265,137 ,000

98,482 2 49,241 ,483 ,639602,149 3 200,716 1,970 ,220611,198 6 101,866

28320,370 121311,829 11

FuenteModelo corregidoIntersecciónTEMPORADSENDAErrorTotalTotal corregida

Suma decuadrados

tipo III glMedia

cuadrática F Significación

R cuadrado = ,534 (R cuadrado corregida = ,146)a.

Page 35: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 33

Departamento de Estadística e I.O. Universidad de Granada

Ejercicio 6: Una industria desea comprobar el efecto que tienen cinco productos químicos sobre la resistencia de un tipo particular de fibra. Como también puede influir la máquina empleada en la fabricación, decide utilizar un diseño en bloques aleatorizados, considerando las distintas máquinas como bloques. La industria dispone de cuatro máquinas a las que asigna los cinco productos químicos en orden aleatorio. Los resultados obtenidos se muestran en la tabla adjunta.

Tipos de máquinas Producto químico A B C D

1 87 86 88 83 2 85 87 95 85 3 90 92 95 90 4 89 97 98 88 5 99 96 91 90

a) Contrastar la hipótesis nula de igualdad de medias en los tratamientos al nivel α =0.05 b) Contrastar la hipótesis nula de igualdad de medias en los bloques al nivel α =0.05 c) Si se rechaza 0H en los apartados a) o b), utilizar los contrastes LSD y Tukey, respectivamente, para precisar qué medias difieren estadísticamente entre sí

Page 36: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 34

Departamento de Estadística e I.O. Universidad de Granada

Comparaciones múltiples

Variable dependiente: RESISTDMS

-2,00 2,336 ,409 -7,09 3,09-5,75* 2,336 ,030 -10,84 -,66-7,00* 2,336 ,011 -12,09 -1,91-8,00* 2,336 ,005 -13,09 -2,912,00 2,336 ,409 -3,09 7,09

-3,75 2,336 ,134 -8,84 1,34-5,00 2,336 ,054 -10,09 ,09-6,00* 2,336 ,025 -11,09 -,915,75* 2,336 ,030 ,66 10,843,75 2,336 ,134 -1,34 8,84

-1,25 2,336 ,602 -6,34 3,84-2,25 2,336 ,355 -7,34 2,847,00* 2,336 ,011 1,91 12,095,00 2,336 ,054 -,09 10,091,25 2,336 ,602 -3,84 6,34

-1,00 2,336 ,676 -6,09 4,098,00* 2,336 ,005 2,91 13,096,00* 2,336 ,025 ,91 11,092,25 2,336 ,355 -2,84 7,341,00 2,336 ,676 -4,09 6,09

(J)PRODUCT 2 3 4 5 1 3 4 5 1 2 4 5 1 2 3 5 1 2 3 4

(I)PRODUCT 1

2

3

4

5

Diferenciaentre

medias (I-J) Error típ. Significación Límite inferiorLímite

superior

Intervalo de confianza al95%.

Basado en las medias observadas.La diferencia de medias es significativa al nivel ,05.*.

Se ha detectado el símbolo ,05 donde se esperaba un paréntesis de cierre en el subcomandoTEST.

*.

Page 37: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 35

Departamento de Estadística e I.O. Universidad de Granada

ANÁLISIS DE LA COVARIANZA

Ejercicio 1: Un distribuidor de bebidas está estudiando la efectividad de los métodos de descarga, para lo cual se mide el tiempo de descarga de unas cajas en minutos. Las bebidas se distribuyen en tres tipos distintos de furgonetas (atendiendo a su diferente capacidad de carga y antigüedad). Se conoce que el tiempo de descarga guarda una estrecha relación con el volumen de cajas descargadas. Se obtuvieron los siguientes datos:

Furgoneta 1 2 3

y x y x y x 12 20 70 64 31 27 19 23 64 62 28 25 15 22 55 47 25 22 21 30 77 66 22 26 11 15 66 50 29 28 19 22 44 42 28 29

a) Planteamiento del modelo b) Contrastar los efectos del factor y de la covariable sobre la variable respuesta c) Indicar el porcentaje de variabilidad explicada por el modelo propuesto SOLUCIÓN: b) Contrastar los efectos del factor y de la covariable sobre la variable respuesta

Page 38: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 36

Departamento de Estadística e I.O. Universidad de Granada

Pruebas de los efectos inter-sujetos

Variable dependiente: TIEMPO

7679,373a 3 2559,791 160,974 ,0003,758 1 3,758 ,236 ,634

174,246 2 87,123 5,479 ,017592,373 1 592,373 37,252 ,000027222,627 14 15,902

30374,000 187902,000 17

FuenteModelo corregidoIntersecciónFURGONETVOLUMENErrorTotalTotal corregida

Suma decuadrados

tipo III glMedia

cuadrática F Significación

R cuadrado = ,972 (R cuadrado corregida = ,966)a.

Page 39: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 37

Departamento de Estadística e I.O. Universidad de Granada

Ejercicio 2: Se quiere analizar el efecto que tienen tres tipos distintos de terreno en el rendimiento de una determinada plantación de almendros. Se sospecha que el rendimiento del cultivo (medido en kg.) está relacionado con la cantidad de kg. de abono recibidos. Los datos observados se muestran en la tabla adjunta:

Terreno A B C

Y x y x y x 130,5 20,3 110,3 15,9 155,9 44,9 144,6 44,9 100,8 22 149,1 42,33 133,9 33,8 109,6 16,9 188,9 58,9 128,4 20,8 122,7 20,2 199,4 70,8 119,2 18,2 97,4 16,9 185,7 61,9 133,8 32,8 122,8 33,9 119,4 18,3 122,7 22,7 130,8 29,7

Se pide

a) Indicar el valor de la suma de cuadrados entre tratamientos ajustada. Interpretación

b) Contrastar los efectos del factor y de la covariable sobre la variable respuesta

Page 40: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 38

Departamento de Estadística e I.O. Universidad de Granada

Pruebas de los efectos inter-sujetos

Variable dependiente: PRODUCC

14135,521a 3 4711,840 69,764 ,00010205,154 1 10205,154 151,098 ,000

404,959 2 202,479 2,998 ,0781804,347 1 1804,347 26,715 ,0001080,639 16 67,540

381321,724 2015216,159 19

FuenteModelo corregidoIntersecciónTERRENOABONOErrorTotalTotal corregida

Suma decuadrados

tipo III glMedia

cuadrática F Significación

R cuadrado = ,929 (R cuadrado corregida = ,916)a.

Page 41: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 39

Departamento de Estadística e I.O. Universidad de Granada

Ejercicio 3: Una empresa pretende estudiar la resistencia a la ruptura de la fibra de la que está compuesta una cuerda. Se realiza un estudio para determinar si existe diferencia significativa en la resistencia de los tres tipos de cuerdas disponibles (atendiendo al tipo de fibra disponible). Se cree que la temperatura a la que se realiza el experimento puede influir en la resistencia, por lo que se utiliza un diseño en bloques aleatorizados considerando la temperatura como bloque, con 4 niveles. La resistencia de la cuerda a la ruptura (medida en libras) se ve afectada por su grosor (medido en 310− pulgadas). Los datos se presentan en la siguiente tabla:

Cuerda 1 2 3

Temperatura y x y x y x 1 33 20 44 28 41 23 2 41 25 23 22 39 22 3 35 24 44 33 37 23 4 42 25 37 27 26 21

Se pide

a) Formular el diseño empleado b) Analizar estos datos y extraer las conclusiones apropiadas

Page 42: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 40

Departamento de Estadística e I.O. Universidad de Granada

Pruebas de los efectos inter-sujetos

Variable dependiente: Y

423,966a 6 70,661 4,928 ,05055,091 1 55,091 3,842 ,107

170,503 2 85,251 5,945 ,04891,799 3 30,600 2,134 ,215

358,133 1 358,133 24,974 ,00471,701 5 14,340

16776,000 12495,667 11

FuenteModelo corregidoIntersecciónCUERDATEMPXErrorTotalTotal corregida

Suma decuadrados

tipo III glMedia

cuadrática F Significación

R cuadrado = ,855 (R cuadrado corregida = ,682)a.

Page 43: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 41

Departamento de Estadística e I.O. Universidad de Granada

Ejercicio 4: Se pretende comparar la presión arterial sistólica de un grupo de fumadores según su nivel de estudios. Para ello se realiza un estudio en el que se controla el número de cigarrillos consumidos al día por cada una de estas personas. El nivel de estudios se clasifica en tres niveles: estudios básicos, estudios de Secundaria y estudios universitarios, codificados por 1, 2 y 3 respectivamente. Además se cree que la presión arterial que sufren estos individuos podría relacionarse en forma lineal con la edad de los fumadores. Los datos se muestran en la tabla adjunta:

Nivel de estudios 1 2 3

y X z y x z y x z 153,4 24,2 46 141,3 18,3 22 135,5 20,3 35 157,5 25,6 55 133,9 28 51 137,9 22,9 17 140,5 24,9 49 128,7 12,1 36 140,4 33 40 162,7 57,2 44 144,2 27,4 51 126,9 20,3 39 153,5 46,3 64 137,4 33,5 35 130,1 11,2 29

a) Formular el diseño empleado b) Variación de la presión arterial sistólica que queda sin explicar y suma total de

cuadrados de la respuesta ajustada por la covariable c) Contrastar la igualdad de los efectos del factor, así como la significación de cada

covariable d) Proporción de variación explicada por el modelo propuesto e) Comprobar que se cumple la hipótesis de homocedasticidad

Page 44: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 42

Departamento de Estadística e I.O. Universidad de Granada

Pruebas de los efectos inter-sujetos

Variable dependiente: PRESIÓN

1294,773a 4 323,693 9,629 ,00211452,003 1 11452,003 340,655 ,000

410,072 2 205,036 6,099 ,019203,031 1 203,031 6,039 ,034

24,663 1 24,663 ,734 ,412336,176 10 33,618

302361,030 151630,949 14

FuenteModelo corregidoInterceptESTUDIOSNº_CIGAREDADErrorTotalTotal corregida

Suma decuadrados

tipo III glMedia

cuadrática F Significación

R cuadrado = ,794 (R cuadrado corregida = ,711)a.

Contraste de Levene sobre la igualdad de las varianzas error

Variable dependiente: PRESIÓN

,973 2 12 ,406F gl1 gl2 Significación

Contrasta la hipótesis nula de que la varianza error de lavariable dependiente es igual a lo largo de todos los grupos.

Page 45: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 43

Departamento de Estadística e I.O. Universidad de Granada

ANÁLISIS CLUSTER Ejercicio 1: Se analiza la leche de las hembras de 20 mamíferos, obteniéndose los porcentajes en agua, proteínas, grasa y lactosa siguientes:

Mamífero Agua Proteínas Grasa Lactosa CABALLO 90.1 2.6 1.0 6.9 BURRO 90.3 1.7 1.4 6.2 CEBRA 86.2 3.0 4.8 5.3 HAMSTER 81.9 7.4 7.2 2.7 RATA 72.5 9.2 12.6 3.3 OVEJA 82.0 5.6 6.4 4.7 RENO 64.8 10.7 20.3 2.5 MULA 90.0 2.0 1.8 5.5 CERDO 82.8 7.1 5.1 3.7 CAMELLO 87.7 3.5 3.4 4.8 BÚFALO 82.1 5.9 7.9 4.7 ZORRO 81.6 6.6 5.9 4.9 CONEJO 71.3 12.3 13.1 1.9 LLAMA 86.5 3.9 3.2 5.6 CIERVO 65.9 10.4 19.7 2.6 BISONTE 86.9 4.8 1.7 5.7 GATO 81.6 10.1 6.3 4.4 PERRO 76.3 9.3 9.5 3.0 FOCA 46.4 9.7 42.0 0.0 DELFÍN 44.9 10.6 34.9 0.9

Clasificar estos mamíferos de forma jerárquica atendiendo a dichas variables realizando el estudio de acuerdo a las siguientes opciones de medidas de asociación y métodos de amalgamamiento:

a) Distancia euclídea y linkage simple b) Distancia bloque y linkage simple c) Distancia euclídea y método del centroide d) Distancia bloque y método del centroide

Para cada uno de las anteriores opciones se pide la matriz de distancias, el dendrograma y la clasificación resultante si se toman 2, 3, 4 o 5 grupos diferentes.

Page 46: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 44

Departamento de Estadística e I.O. Universidad de Granada

Page 47: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 45

Departamento de Estadística e I.O. Universidad de Granada

Page 48: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 46

Departamento de Estadística e I.O. Universidad de Granada

Historial de conglomeración

2 8 ,911 0 0 36 12 1,204 0 0 61 2 1,225 0 1 117 15 1,292 0 0 18

10 14 1,510 0 0 76 11 1,533 2 0 9

10 16 1,797 5 0 83 10 1,884 0 7 116 9 1,942 6 0 104 6 2,512 0 9 121 3 3,254 3 8 154 17 3,329 10 0 155 18 3,969 0 0 145 13 4,389 13 0 161 4 5,227 11 12 161 5 6,352 15 14 18

19 20 7,367 0 0 191 7 8,765 16 4 191 19 24,733 18 17 0

Etapa12345678910111213141516171819

Conglomerado 1

Conglomerado 2

Conglomerado que secombina

CoeficientesConglomerado 1

Conglomerado 2

Etapa en la que elconglomerado

aparece por primeravez

Próximaetapa

Page 49: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 47

Departamento de Estadística e I.O. Universidad de Granada

Conglomerado de pertenencia

1 1 1 11 1 1 11 1 1 11 1 1 12 1 1 11 1 1 13 2 2 11 1 1 11 1 1 11 1 1 11 1 1 11 1 1 12 1 1 11 1 1 13 2 2 11 1 1 11 1 1 12 1 1 14 3 3 25 4 3 2

Caso1:caballo2:burro3:cebra4:hamster5:rata6:oveja7:reno8:mula9:cerdo10:camello11:búfalo12:zorro13:conejo14:llama15:ciervo16:bisonte17:gato18:perro19:foca20:delfín

5conglome

rados

4conglome

rados

3conglome

rados

2conglome

rados

Page 50: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 48

Departamento de Estadística e I.O. Universidad de Granada

* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * Dendrogram using Single Linkage Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+ burro 2 òø

mula 8 òôòòòø

caballo 1 ò÷ ó

camello 10 òø ùòòòø

llama 14 òôòø ó ó

bisonte 16 ò÷ ùò÷ ó

cebra 3 òòò÷ ó

oveja 6 òø ùòø

zorro 12 òôòø ó ó

búfalo 11 ò÷ ó ó ó

cerdo 9 òòòôòø ó ùòòòòòø

hamster 4 òòò÷ ùòòò÷ ó ó

gato 17 òòòòò÷ ó ó

rata 5 òòòòòòòø ó ùòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòø

perro 18 òòòòòòòôòòò÷ ó ó

conejo 13 òòòòòòò÷ ó ó

reno 7 òûòòòòòòòòòòòòòòò÷ ó

ciervo 15 ò÷ ó

foca 19 òòòòòòòòòòòòòûòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷

delfín 20 òòòòòòòòòòòòò÷

3 gr

upos

2 gr

upos

4 gr

upos

5

grup

os

Page 51: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 49

Departamento de Estadística e I.O. Universidad de Granada

Page 52: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 50

Departamento de Estadística e I.O. Universidad de Granada

Ejercicio 2: Se pretende clasificar un conjunto de 26 animales mamíferos en 4 grupos homogéneos atendiendo a su configuración dental. La información de la que se dispone es la del número de piezas dentales. Los datos de los que se dispone son los siguientes:

Mamífero

Incisivos Sup.

Incisivos Inf.

Caninos Sup.

Caninos Inf.

Premolares Inf.

Premolares Sup.

Molares Sup.

Molares Inf.

ALCE ANTÍLOPE ARDILLA BISONTE BUEY CABRA CASTOR CIERVO COMADREJA HURÓN JAGUAR LEÓN LINCE LOBO MARTA MOFETA MURCIÉLAGO NUTRIA OCELOTE OSO OVEJA RATÓN RENO TEJÓN VISÓN ZORRO

0 0 1 0 0 0 1 0 3 3 3 3 3 3 3 3 2 3 3 3 0 1 0 3 3 3

4 4 1 4 4 4 1 4 3 3 3 3 3 3 3 3 3 2 3 3 4 1 4 3 3 3

1 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1

0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 1 1 1

3 3 1 3 3 3 2 3 3 3 3 3 2 4 4 3 1 1 3 4 3 0 3 3 3 4

3 3 1 3 3 3 1 3 3 3 2 2 2 4 4 3 2 2 2 4 3 0 3 3 3 4

3 3 3 3 3 3 3 3 1 1 1 1 1 2 1 1 3 3 1 2 3 3 3 1 1 2

3 3 3 3 3 3 3 3 2 2 1 1 1 3 2 2 3 3 1 3 3 3 3 2 2 3

Clasificar estos mamíferos utilizando el método de las k-medias para agrupar a los mamíferos en 4 grupos.

Page 53: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 51

Departamento de Estadística e I.O. Universidad de Granada

Page 54: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 52

Departamento de Estadística e I.O. Universidad de Granada

Centros iniciales de los conglomerados

Conglomerado

1 2 3 4 Incisivos Superiores 3 0 1 3 Incisivos Inferiores 3 4 1 3 Caninos Superiores 1 0 0 1 Caninos Inferiores 1 0 0 1 Premolares Inferiores 2 3 0 4 Premolares Superiores 2 3 0 4 Molares Superiores 1 3 3 2 Molares Inferiores 1 3 3 3

Historial de iteraciones(a)

Iteración

Cambio en los centros de los conglomerados

1 2 3 4 1 1,150 ,250 1,202 ,354 2 ,000 ,000 ,000 ,000

a Se ha logrado la convergencia debido a que los centros de los conglomerados no presentan ningún cambio o éste es pequeño. El cambio máximo de coordenadas absolutas para cualquier centro es de ,000. La iteración actual es 2. La distancia mínima entre los centros iniciales es de 3,606.

Pertenencia a los conglomerados

Número de caso MAMIFERO Conglome

rado Distancia 1 alce 2 ,7502 antílope 2 ,2503 ardilla 3 ,3334 bisonte 2 ,2505 buey 2 ,2506 cabra 2 ,2507 castor 3 1,0548 ciervo 2 ,2509 comadrej 1 ,82810 hurón 1 ,82811 jaguar 1 1,11012 león 1 1,11013 lince 1 1,15014 lobo 4 ,35415 marta 4 1,06116 mofeta 1 ,82817 murciéla 1 2,73918 nutria 1 2,73919 ocelote 1 1,11020 oso 4 ,35421 oveja 2 ,25022 ratón 3 1,20223 reno 2 ,75024 tejón 1 ,82825 visón 1 ,82826 zorro 4 ,354

Page 55: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 53

Departamento de Estadística e I.O. Universidad de Granada

Centros de los conglomerados finales

Conglomerado

1 2 3 4 Incisivos Superiores 3 0 1 3 Incisivos Inferiores 3 4 1 3 Caninos Superiores 1 0 0 1 Caninos Inferiores 1 0 0 1 Premolares Inferiores 3 3 1 4 Premolares Superiores 2 3 1 4 Molares Superiores 1 3 3 2 Molares Inferiores 2 3 3 3

Distancias entre los centros de los conglomerados finales

Conglomerado 1 2 3 4 1 3,974 4,353 2,353 2 3,974 4,417 3,897 3 4,353 4,417 5,633 4 2,353 3,897 5,633

Número de casos en cada conglomerado

Conglomerado 1 11,000 2 8,000 3 3,000 4 4,000Válidos 26,000Perdidos ,000

Page 56: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 54

Departamento de Estadística e I.O. Universidad de Granada

ANÁLISIS DE DATOS CUALITATIVOS Ejercicio 1: Un grupo de biólogos ha opinado acerca del plan de actuación de la Administración sobre el Parque Natural de Doñana clasificando el mismo como Bueno, Aceptable o Malo. Los resultados de opinión teniendo en cuenta la procedencia laboral de los mismos, según trabajen para algún organismo público o pertenezcan a otros organismos no gubernamentales se muestran a continuación:

Opinión Procedencia

Bueno Aceptable Malo

Organismo Público 67 56 35 Organismo no Gubernamental 12 40 50

a) Clasificar las variables contempladas. b) Introducir la información anterior y construir la tabla de contingencia plasmando

los porcentajes por columna. Comentar los resultados. c) ¿La procedencia laboral de los biólogos influye en la opinión que expresan sobre

el plan de actuación?

Page 57: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 55

Departamento de Estadística e I.O. Universidad de Granada

Tabla de contingencia Procedencia * Opinión

67 56 35 15884,8% 58,3% 41,2% 60,8%

12 40 50 10215,2% 41,7% 58,8% 39,2%

79 96 85 260100,0% 100,0% 100,0% 100,0%

Recuento% de OpiniónRecuento% de OpiniónRecuento% de Opinión

Público

No Gubernamental

Procedencia

Total

Bueno Aceptable MaloOpinión

Total

Page 58: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 56

Departamento de Estadística e I.O. Universidad de Granada

Pruebas de chi-cuadrado

33,078a 2 ,00035,395 2 ,000

32,401 1 ,000

260

Chi-cuadrado de PearsonRazón de verosimilitudesAsociación lineal porlinealN de casos válidos

Valor glSig. asintótica

(bilateral)

0 casillas (,0%) tienen una frecuencia esperada inferior a 5.La frecuencia mínima esperada es 30,99.

a.

Medidas simétricas

,357 ,000,357 ,000

,336 ,000

260

PhiV de CramerCoeficiente decontingencia

Nominal pornominal

N de casos válidos

ValorSig.

aproximada

A i d l hi ót i lt tia Medidas direccionales

,135 ,071 1,816 ,069,147 ,083 1,635 ,102,128 ,083 1,445 ,149,127 ,037 ,000c

,060 ,019 ,000c

SimétricaProcedencia dependienteOpinión dependienteProcedencia dependienteOpinión dependiente

Lambda

Tau de Goodmany Kruskal

Nominalpor nominal

ValorError típ.

asint.a T aproximadabSig.

aproximada

Page 59: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 57

Departamento de Estadística e I.O. Universidad de Granada

Ejercicio 2: Se está llevando a cabo un estudio sobre la raza canina Boxer para investigar el grado de agresividad que presentan los perros de dicha raza. Se supone en principio, que los síntomas de agresividad dependen fundamentalmente del nivel de adiestramiento que han tenido estos perros durante los dos primeros años de su vida. Por este motivo, se han investigado a 208 perros Boxer ofreciendo los siguientes resultados:

Nivel de adiestramientoGrado de agresividad

Bajo Medio Alto

Bajo 12 13 28 Medio 28 34 15 Alto 42 31 5

a) ¿Qué tipo de variables son? b) Obtener la distribución condicionada del grado de agresividad al nivel de

adiestramiento. c) ¿Son independientes?.

Page 60: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 58

Departamento de Estadística e I.O. Universidad de Granada

Tabla de contingencia Grado de Agresividad * Grado de Adiestramiento

12 13 28 53

14,6% 16,7% 58,3% 25,5%

28 34 15 77

34,1% 43,6% 31,3% 37,0%

42 31 5 78

51,2% 39,7% 10,4% 37,5%

82 78 48 208

100,0% 100,0% 100,0% 100,0%

Recuento% de Grado deAdiestramientoRecuento% de Grado deAdiestramientoRecuento% de Grado deAdiestramientoRecuento% de Grado deAdiestramiento

Bajo

Medio

Alto

Grado deAgresividad

Total

Bajo Medio AltoGrado de Adiestramiento

Total

Page 61: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 59

Departamento de Estadística e I.O. Universidad de Granada

Pruebas de chi-cuadrado

41,629a 4 ,00040,522 4 ,000

31,093 1 ,000

208

Chi-cuadrado de PearsonRazón de verosimilitudesAsociación lineal porlinealN de casos válidos

Valor glSig. asintótica

(bilateral)

0 casillas (,0%) tienen una frecuencia esperada inferior a 5.La frecuencia mínima esperada es 12,23.

a.

Medidas direccionales

-,336 ,058 -5,668 ,000

-,338 ,058 -5,668 ,000

-,334 ,058 -5,668 ,000

SimétricaGrado de AgresividaddependienteGrado de Adiestramientodependiente

d de SomersOrdinal por ordinalValor

Error típ.asint.a T aproximadab

Sig.aproximada

Asumiendo la hipótesis alternativa.a.

Empleando el error típico asintótico basado en la hipótesis nula.b.

Medidas simétricas

-,336 ,058 -5,668 ,000-,330 ,058 -5,668 ,000-,492 ,078 -5,668 ,000

208

Tau-b de KendallTau-c de KendallGamma

Ordinal por ordinal

N de casos válidos

ValorError típ.

asint.a T aproximadabSig.

aproximada

Asumiendo la hipótesis alternativa.a.

Empleando el error típico asintótico basado en la hipótesis nula.b.

Page 62: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 60

Departamento de Estadística e I.O. Universidad de Granada

Ejercicio 3: En la siguiente tabla se muestra la información de la Unidad de Paritorio de un hospital granadino, donde aparecen las frecuencias observadas de utilización de analgesia epidural y realización de episiotomía a las mujeres cuyo parto es asistido en dicho centro. Los responsables de esta Unidad creen que la utilización de analgesia epidural en el proceso del parto influye en la realización de episiotomía.

Analgesia EpiduralEpisitomía

No Sí

No 405 243Sí 239 235

Se pide la realización de un estudio de asociación que de respuesta a los

responsables de la Unidad de Paritorio.

Tabla de contingencia Realización de Episiotomía * Utilización deanalgesia epidural

405 243 64862,9% 50,8% 57,8%

239 235 47437,1% 49,2% 42,2%

644 478 1122100,0% 100,0% 100,0%

NO

Si

Realización deEpisiotomía

Total

No Sí

Utilización deanalgesia epidural

Total

Page 63: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 61

Departamento de Estadística e I.O. Universidad de Granada

Pruebas de chi-cuadrado

16,332b 1 ,000

15,841 1 ,000

16,316 1 ,000

,000 ,000

1122

Chi-cuadrado de PearsonCorrección porcontinuidad

a

Razón de verosimilitudesEstadístico exacto deFisherN de casos válidos

Valor glSig. asintótica

(bilateral)Sig. exacta(bilateral)

Sig. exacta(unilateral)

Calculado sólo para una tabla de 2x2.a.

0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperadaes 201,94.

b.

Medidas simétricas

,121 ,000,121 ,000

,120 ,000

1122

PhiV de CramerCoeficiente decontingencia

Nominal pornominal

N de casos válidos

ValorSig.

aproximada

Asumiendo la hipótesis alternativa.a.

Empleando el error típico asintótico basado en la hipótesisnula.

b.

Medidas direccionales

,000 ,000 .c .c

,000 ,000 .c

.c

,000 ,000 .c

.c

d

SimétricaRealización deEpisiotomía dependienteUtilización AnalgesiEpidural dependienteRealización de

Lambda

Tau de Goodman

Nominalpor nominal

ValorError típ.

asint.a T aproximadabSig.

aproximada

Page 64: Cuaderno de practicas diseño exp

FBA I Cuaderno de Prácticas de Estadística con SPSS 62

Departamento de Estadística e I.O. Universidad de Granada

Bibliografía Recomendada:

• Aguilera del Pino, A. M. (2001). “Tablas de Contingencia Bidimensionales”. Ed La Muralla, S.A.

• García Leal, J., Lara Porras, A.M., Navarrete Álvarez, E., Rico Castro, N., Román Montoya, Y., Ruiz Castro, E. y Sánchez Borrego, I.R. (2007). “Técnicas Estadísticas aplicadas en Biología con SPSS”. Editorial Proyecto Sur.

• Gutiérrez Jáimez, R., González Carmona, A., Torres Ruiz, F y Gallardo Sansalvador, J.A. (1994). “Técnicas de Análisis de datos Multivariable. Tratamiento computacional”. Universidad de Granada.

• Lara Porras, A.M. (2001) “Diseño Estadístico de Experimentos, Análisis de la Varianza y Temas relacionados. Tratamiento Informático mediante SPSS”. Ed. Proyecto Sur.

• Lara Porras, A.M., Sánchez Borrego, I.R., Ramos Ábalos, E.M.Raya Miranda, R., Tarifa Blanco, J.A. y Alfonso Uxó, A. (2008) “Guía Interactiva de Autoaprendizaje de SPSS. versión 2.1” Ed. Proyecto Sur.

• Visauta Vinacua, B. (1998) “Análisis Estadístico con SPSS para Windows. Volumen II: Estadística multivariante”. McGraw-Hill.

• Visauta Vinacua, B. (2007) “Análisis Estadístico con SPSS 14. Estadística Básica”. McGraw-Hill.

Bibliografía General:

• Box, G.E.P., Hunter W.G. & Hunter J.S. (1988). “Estadística para Investigadores”. Ed. Reverté.

• Canavos, G.C. (1990). “Probabilidad y Estadística. Aplicaciones y Métodos”. Ed. McGraw-Hill.

• Ferrán Aranaz, M. (1996). “SPSS para Windows. Programación y Análisis Estadístico”. Serie McGraw-Hill de informática.

• García Leal, J. y Lara Porras, A.M. (1998). “Diseño Estadístico de Experimentos. Análisis de la Varianza”. Grupo Editorial Universitario.

• Lara Porras, A.M. (2010) “Estadística para Biología y Ciencias Ambientales: Tratamiento Informático mediante SPSS”. Ed. Proyecto Sur.

• Lara Porras, A.M. y Román Montoya, Yolanda (2010) “Aprender Estadística analizando datos: Métodos multimedia”. Ed. Proyecto Sur.

• Lizasoain, L. y Joaristi, L. (1998) “SPSS para Windows”. Ed Paraninfo. • Ludwig, J.A. y Reynolds, J.F. (1988) “Statistical Ecology”. J. Willey & Sons. • Martin Andrés, A., Luna del Castillo, J.D. (2004). “Bioestadística para las

Ciencias de la Salud”. Ed. Capitel. • Mason, R.L., Gunst, R.F. y Hess, J.L. (1989), “Statistical Design and Analysis

of Experiments”. J. Willey & Sons. • Milton, J.S. (2007) “Estadística para Biología y Ciencias de la Salud”. Ed.

McGraw-Hill. • Ollero Hinojosa, J., García Leal, J., Lara Porras. A.M., Martínez Andrés, A.,

Rodríguez, C., Ramos, H. (1997) “Diseño y Análisis Estadístico de Experimentos”. Grupo Editorial Universitario.

• Sharma, S. (1996) “Applied Multivariate Techniques”. Ed. J. Wiley & Sons.