27
26/08/2013 1 Curso: Diseño de Experimentos Ambientales Curso: Diseño de Experimentos Ambientales Ing. Omar Murrieta Pozos Ing. Omar Murrieta Pozos DEPARTAMENTO DE INGENIERIAS DEPARTAMENTO DE INGENIERIAS 1.1.0 Regresión lineal simple. 1.1.1 Estimación de parámetros. 1.1.2 Prueba de significancia. 1.1.3 Medidas de adecuación del modelo(análisis residual, coeficiente de determinación, coeficiente de correlación). 1.1.4. Estimación de intervalo de predicción. 1.1.0 Regresión lineal simple. 1.1.1 Estimación de parámetros. 1.1.2 Prueba de significancia. 1.1.3 Medidas de adecuación del modelo(análisis residual, coeficiente de determinación, coeficiente de correlación). 1.1.4. Estimación de intervalo de predicción. UNIDAD I : Regresión lineal.

DISEÑO DE EXPERIMENTOS AMBIENTALES (UNIDAD I).pdf

Embed Size (px)

Citation preview

Page 1: DISEÑO DE EXPERIMENTOS AMBIENTALES (UNIDAD I).pdf

26/08/2013

1

C u r s o : D i s e ñ o d e E x p e r i m e n t o s A m b i e n t a l e s

C u r s o : D i s e ñ o d e E x p e r i m e n t o s A m b i e n t a l e s

I n g . O m a r M u r r i e t a P o z o s I n g . O m a r M u r r i e t a P o z o s

DEPARTAMENTO DE INGENIERIAS DEPARTAMENTO DE INGENIERIAS

1 . 1 . 0 R e g r e s i ó n l i n e a l s i m p l e .

1 . 1 . 1 E s t i m a c i ó n d e p a r á m e t r o s .

1 . 1 . 2 P r u e b a d e s i g n i f i c a n c i a .

1 . 1 . 3 M e d i d a s d e a d e c u a c i ó n d e l m o d e l o ( a n á l i s i s r e s i d u a l , c o e f i c i e n t e d e

d e t e r m i n a c i ó n , c o e f i c i e n t e d e c o r r e l a c i ó n ) .

1 . 1 . 4 . E s t i m a c i ó n d e i n t e r v a l o d e p r e d i c c i ó n .

1 . 1 . 0 R e g r e s i ó n l i n e a l s i m p l e .

1 . 1 . 1 E s t i m a c i ó n d e p a r á m e t r o s .

1 . 1 . 2 P r u e b a d e s i g n i f i c a n c i a .

1 . 1 . 3 M e d i d a s d e a d e c u a c i ó n d e l m o d e l o ( a n á l i s i s r e s i d u a l , c o e f i c i e n t e d e

d e t e r m i n a c i ó n , c o e f i c i e n t e d e c o r r e l a c i ó n ) .

1 . 1 . 4 . E s t i m a c i ó n d e i n t e r v a l o d e p r e d i c c i ó n .

U N I D A D I : R e g r e s i ó n l i n e a l .

Page 2: DISEÑO DE EXPERIMENTOS AMBIENTALES (UNIDAD I).pdf

26/08/2013

2

1 . 2 . 0 R e g r e s i ó n l i n e a l m ú l t i p l e .

1 . 2 . 1 E s t i m a c i ó n d e p a r á m e t r o s .

1 . 2 . 2 P r u e b a d e s i g n i f i c a n c i a .

1 . 2 . 3 P r u e b a d e c o e f i c i e n t e s i n d i v i d u a l e s .

1 . 2 . 4 M e d i d a s d e a d e c u a c i ó n d e l m o d e l o d e r e g r e s i ó n ( a n á l i s i s r e s i d u a l ,

c o e f i c i e n t e d e d e t e r m i n a c i ó n , c o e f i c i e n t e d e c o r r e l a c i ó n )

1 . 2 . 5 E s t i m a c i ó n d e l i n t e r v a l o d e p r e d i c c i ó n

1 . 3 . 0 P a q u e t e c o m p u t a c i o n a l p a r a l a s o l u c i ó n d e p r o b l e m a s .

1 . 2 . 0 R e g r e s i ó n l i n e a l m ú l t i p l e .

1 . 2 . 1 E s t i m a c i ó n d e p a r á m e t r o s .

1 . 2 . 2 P r u e b a d e s i g n i f i c a n c i a .

1 . 2 . 3 P r u e b a d e c o e f i c i e n t e s i n d i v i d u a l e s .

1 . 2 . 4 M e d i d a s d e a d e c u a c i ó n d e l m o d e l o d e r e g r e s i ó n ( a n á l i s i s r e s i d u a l ,

c o e f i c i e n t e d e d e t e r m i n a c i ó n , c o e f i c i e n t e d e c o r r e l a c i ó n )

1 . 2 . 5 E s t i m a c i ó n d e l i n t e r v a l o d e p r e d i c c i ó n

1 . 3 . 0 P a q u e t e c o m p u t a c i o n a l p a r a l a s o l u c i ó n d e p r o b l e m a s .

U N I D A D I : R e g r e s i ó n l i n e a l .

U N I D A D I : R e g r e s i ó n l i n e a l .

Horario: Lunes (07:00-09:00) E2 Martes (07:00-09:00) LA1

*Nota: El estudiante se apoyara del uso de la calculadora científica y cuaderno individual para apuntes.

Sesiones: 4 horas/semana

Page 3: DISEÑO DE EXPERIMENTOS AMBIENTALES (UNIDAD I).pdf

26/08/2013

3

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

“Analizar, identificar y aplicar métodos estadísticos útiles en la investigación, que permitan abordar fenómenos tecnológicos y ambientales así como facilitar la estimación e interpretación lo cual permitirá dar solución eficaz a problemas relacionados con la Ingeniería Ambiental”.

Competencias especificas (Unidad I: Regresión lineal)

O b j e t i v o G e n e r a l

1. Conocer los métodos para el análisis de regresión. 2. Identificar la variable de respuesta. 3. Identificar la(s) variable(s) de control. 4. Realizar un análisis estadístico de un caso empleando el análisis de regresión.

Instrumentos de evaluación

1. Apuntes 10% 2. Investigación 10% 3. Ejercicios 20% 4. Practicas Computacionales 20% 4. Evaluación 40%

(Martes 03 Sep 2013)

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

I. Hines, W.W. y Montgomery, D.C. (1993). Probabilidad y Estadística para Ingeniería y Administración.

(3ª Ed). México: CECSA. II. 2Kuehl, R.O. (2001). Diseño de experimentos. Principios estadísticos para el diseño y análisis de

investigaciones. (2ª Ed.) México: Thomson III. Levin, R.I. y Rubin, D.S. (1996). Estadística para Administradores. (6a Ed.). México: Prentice Hall

Hispanoamericana. IV. Mason, R.D.; Lind, D.A. y Marchal, W.G. (2001). Estadística para Administración y Economía. (3a Ed.)

México: Mc Graw Hill. V. Mason, R.D.; Lind, D.A. y Marchal, W.G. (2002). Estadística para Administración y Economía. (10a Ed.)

México: Alfaomega. VI. Miller, I.R., Freund, J.E. y Johnson, R. (1992). Probabilidad y Estadística para Ingenieros. (4ª Ed.).

Cuarta Edición. México: Prentice Hall. VII. Montgomery, D.C. y Runger, G.C. (1996). Probabilidad y Estadística aplicadas a la Ingeniería. México:

Mc Graw Hill

B i b l i o g r a f í a

Page 4: DISEÑO DE EXPERIMENTOS AMBIENTALES (UNIDAD I).pdf

26/08/2013

4

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

L a e s t a d í s t i c a a p l i c a d a a l a i n v e s t i g a c i ó n

La estadística y. en particular, el diseño de experimentos. son considerados en la literatura científica como técnicas que deben incorporarse al desarrollo fie I proceso investigativo. Ubicar la estadística en el contexto de la investigación es asunto de In teoría del conocimiento. Sin pretender entrar en el campo filosófico. se enunciaran algunas ideas relacionadas con la adquisición del conocimiento científico.

Por otra parte, según el tipo de interés que se tenga en la búsqueda del conocimiento, la ciencia tiene dos propósitos: incrementar el conocimiento y contribuir al bienestar y al poder de los pueblos. A la primer a se Ie llama ciencia pura y a la segunda ciencia aplicada. Es claro que esta subdivisión no esta delimitada rígidamente: la ciencia es pura solamente en el sentido de que no se preocupa de las aplicaciones. pero sus resultados pueden eventualmente contribuir a la solución de un problema de naturaleza real.

EI método de la ciencia o método científico, es un proceso que da indicaciones para avanzar en la investigación y suministrar medios para evitar algunos errores, pero no reemplaza la inventiva ni la originalidad.

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

Bunge (1983) describe ocho pasos en la aplicación del método científico, ellos son:

1. Enunciar preguntas bien formuladas y verosímilmente fecundas 2. Arbitrar conjeturas fundadas y contrastables con la experiencia para contestar a las preguntas formuladas. 3. Derivar consecuencias lógicas de las conjeturas. 4. Arbitrar técnicas para someter las conjeturas a contrastación 5. Someter, a su vez, a contrastación esas técnicas para comprobar su relevancia 6. Llevar a cabo las contrastación e interpretar los resultados 7. Estimar la pretensión de verdad de las conjeturas y la fidelidad de las técnicas. 8. Determinar los dominios en los cuales son validas las conjeturas y las técnicas, y formular problemas

nuevos originados por la investigación.

Page 5: DISEÑO DE EXPERIMENTOS AMBIENTALES (UNIDAD I).pdf

26/08/2013

5

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

Bunge (1983) describe ocho pasos en la aplicación del método científico, ellos son:

1. Enunciar preguntas bien formuladas y verosímilmente fecundas 2. Arbitrar conjeturas fundadas y contrastables con la experiencia para contestar a las preguntas formuladas. 3. Derivar consecuencias lógicas de las conjeturas. 4. Arbitrar técnicas para someter las conjeturas a contrastación 5. Someter, a su vez, a contrastación esas técnicas para comprobar su relevancia 6. Llevar a cabo las contrastación e interpretar los resultados 7. Estimar la pretensión de verdad de las conjeturas y la fidelidad de las técnicas. 8. Determinar los dominios en los cuales son validas las conjeturas y las técnicas, y formular problemas

nuevos originados por la investigación.

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

La estadística ayuda a responder preguntas, no a formularlas. Para dar los tres primeros pasos en la practica científica, el investigador o requiere la estadística: esta le dice poco acerca de como descubrir hipótesis o derivar consecuencias de ellas. Sin embargo, el conocimiento de sus principios y métodos en el momento de escoger aquellas conjeturas contrastables, que deben traducirse al lenguaje matemático para su verificación.

Por otras parte, mediante la estadística se corrobora o se refuta una hipótesis pero no se demuestra; es decir, esta no puede establecerse con certeza. Aquí se esta poniendo en relieve que los métodos estadísticos no son de naturaleza deductiva sino inductiva.

Aun permanece el concepto, no científico, sobre la posibilidad de falsear ciertas conclusiones utilizando estadística. Disraeli, político y escritor ingles del siglo XIX, decía que había tres clases de mentiras: mentirillas, mentiras execrables y estadísticas. Según Di Trocchio (1998), entre las posibilidades de algunos científicos para engañar a sus lectores esta el conocimiento profundo de los trucos estadísticos, que otorgan la posibilidad de sostener con rigor matemático toda idea surgida de la fantasía. Como ocurre con otras ciencias, la estadística puede utilizarse con fine no siempre plausibles, pero esto no le quita su carácter científico.

Page 6: DISEÑO DE EXPERIMENTOS AMBIENTALES (UNIDAD I).pdf

26/08/2013

6

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

Microsoft Excel Minitab 16

SPSS 19 Statgraphics

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

Minitab 16

Minitab es un programa de computadora diseñado para ejecutar funciones estadísticas básicas y avanzadas. Combina lo amigable del uso de Microsoft Excel con la capacidad de ejecución de análisis estadísticos. En 1972, instructores del programa de análisis estadísticos de la Universidad Estatal de Pennsylvania (Pennsylvania State University) desarrollaron MINITAB como una versión ligera de OMNITAB, un programa de análisis estadístico del Instituto Nacional de Estándares y Tecnología (NIST) de los Estados Unidos.

Page 7: DISEÑO DE EXPERIMENTOS AMBIENTALES (UNIDAD I).pdf

26/08/2013

7

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

Regresión lineal simple y correlación simple

Pronosticar es emitir un enunciado sobre lo que es probable que ocurra en el futuro, basándose en análisis y en consideraciones de juicio.

Objetivo de un Pronóstico:

Obtener conocimiento sobre eventos inciertos que son importantes en la toma de decisiones presentes.

Pronóstico: Este será útil si reduce la incertidumbre que rodea al evento en cuestión y teniéndolo resulta en una decisión cuyo beneficio sea superior al costo incurrido en obtener el pronóstico.

Métodos de Pronósticos

Cualitativos: Se usan cuando los datos son escasos (ejemplo introducción de un producto nuevo al mercado). En estas técnicas se usa el criterio de las personas y ciertas relaciones para transformar información cualitativa en estimados cuantitativos.

Cuantitativos: En ellos se hace uso de información histórica que puede cuantificarse

Page 8: DISEÑO DE EXPERIMENTOS AMBIENTALES (UNIDAD I).pdf

26/08/2013

8

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

Métodos de Pronósticos Cuantitativos

Se utilizan cuando existen estas tres condiciones:

1. Hay información sobre el pasado.

2. Esta información puede cuantificarse en forma de datos.

3. Puede suponerse que el patrón del pasado se repetirá en el futuro (Suposición de consistencia, es más probable que sea correcta a corto plazo más que a largo plazo).

Métodos de Pronósticos Cuantitativos

Se clasifican en: Modelos Causales los cuales asumen que el factor que va a ser pronosticado exhibe una

relación causa-efecto con una o mas variables independientes.

Análisis de Series de Tiempo su objetivo es descubrir el patrón subyacente en la serie de datos históricos y extrapolar ese patrón al futuro.

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

Modelos causales

En este tipo de modelos, el pronóstico se expresará como función de cierto número de factores, los cuales determinan el resultado.

Son mas apropiados para hacer pronósticos para horizontes de 3 meses a 1 año.

Meta: Predecir la variable dependiente descubriendo cómo está relacionada con una o mas variables independientes.

Importante: Considerar que las relaciones encontradas por la regresión son relaciones de asociación , pero no necesariamente relaciones de causa y efecto.

Page 9: DISEÑO DE EXPERIMENTOS AMBIENTALES (UNIDAD I).pdf

26/08/2013

9

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

Regresión lineal simple y correlación simple

El objetivo de estudiar regresión lineal simple es para obtener el modelo de regresión más apropiado, es decir, una ecuación de regresión lineal simple o múltiple para fines de predicción y estimación. Los componentes de esta ecuación de regresión lineal, con solo una variable independiente, también llamado modelo lineal de primer orden, son la variable dependiente Y´ o función de respuesta y, la variable independiente X. El modelo de esta ecuación, que describe la relación de la variable X con la variable Y, se llama la ecuación de regresión de Y sobre X y, la gráfica de esta función, se llama la curva de regresión.

El modelo de regresión lineal poblacional que describe la relación entre la respuesta o variable dependiente Y y, la variable independiente o regresora X es:

Donde: Y = variable dependiente poblacional (también se usa la anotación y) βo = intercepto en la ordenada β1 = pendiente de la línea x1 = variable independiente

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

La ecuación de la línea de regresión muestral que estima a modelo de regresión poblacional anterior se da como:

Donde: Y = valor de la variable dependiente de la muestra a = intercepto en la ordenada b = pendiente de la línea

Page 10: DISEÑO DE EXPERIMENTOS AMBIENTALES (UNIDAD I).pdf

26/08/2013

10

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

Tipos de correlación lineal

1. Correlación simple que consiste de dos variables, una dependiente (Y) y la otra independiente (X). Dentro de esta categoría tenemos:

(a) Correlación directa. Esta correlación consiste en el incremento en una variable la cual es acompañada por el incremento de otra variable (correlación positiva). (b) Correlación inversa. Esta correlación consiste en el incremento de una variable la cual es acompañada por el incremento de otra (correlación negativa). (c) Correlación no lineal. En esta correlación no hay ninguna asociación entre las dos variables.

2. Correlación múltiple. Aquí, hay más de dos variables. Una variable es dependiente (Y), mientras que las otras son independientes X1, X2,…, Xk, etc. Las figuras siguientes representan varios tipos de correlaciones.

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

Diagramas esparcidos con líneas de cuadrados mínimos. La Figura (a) representa una línea recta con X fija; la Figura (b) representa línea no recta con X fija; la Figura (c) representa una distribución adjunta con línea recta; la Figura (d) representa una distribución adjunta con línea no recta; la Figura (e) representa un diagrama donde no hay sociación entre las dos variable y; la Figura (f) representa una relación causal. Las otras dos gráficas representan correlaciones perfectas.

Tipos de curvas más comunes

Page 11: DISEÑO DE EXPERIMENTOS AMBIENTALES (UNIDAD I).pdf

26/08/2013

11

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

Figura 8.2. La figura (a) representa la función exponencial; la figura (b) representa la función de potencia, la figura (c) representa una función recíproca y, la figura (d) representa una función hiperbólica.

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

EL ERROR ESTÁNDAR DEL ESTIMADOR:

El error estándar de la estimación es la desviación estándar condicional de la variable dependiente “

” dado un valor de la variable independiente “

”. Para datos poblacionales, el error estándar del estimador se representa mediante el símbolo

para datos muéstrales, la fórmula es:

La fórmula alternativa para cálculos que no requiere determinar cada uno de los valores ajustados es:

EL COEFICIENTE DE DETERMINACIÓN (

):

(Indica la proporción de la varianza de

, que queda explicada por la acción de la variable

). Para datos muéstrales, puede obtenerse el valor estimado del coeficiente de Determinación mediante la fórmula correspondiente:

Una fórmula alternativa es:

Page 12: DISEÑO DE EXPERIMENTOS AMBIENTALES (UNIDAD I).pdf

26/08/2013

12

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

EL COEFICIENTE DE CORRELACIÓN (

):

Aunque el coeficiente de determinación es relativamente fácil de interpretar, no se prueba muy bien en pruebas estadísticas. Sin embargo, la raíz cuadrada del coeficiente de determinación, que se denomina “coeficiente de correlación

”si se presta para las pruebas estadísticas.

El valor del coeficiente de correlación puede variar de –1.00 a +1.00. El signo aritmético asociado con el coeficiente de correlación, que es siempre igual al signo de

de la ecuación de regresión, indica la dirección de la relación entre “

” y “

” (

,

) para el coeficiente de correlación muestral, la fórmula es:

Como una alternativa a la fórmula para la correlación es la siguiente fórmula que no requiere de cálculo previo de los valores de regresión de

y

:

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

APARIENCIA GENERAL DE LOS DIAGRAMAS DE DISPERSIÓN ASOCIADOS CON DIVERSOS VALORES DE CORRELACIÓN:

Page 13: DISEÑO DE EXPERIMENTOS AMBIENTALES (UNIDAD I).pdf

26/08/2013

13

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

Interpretación de

:

Si

, la correlación es perfecta, es decir entre las variables hay dependencia lineal exacta y además, esta dependencia es positiva. Si

, la correlación es perfecta y negativa Si

, no existe relación lineal entre las variables

La correlación es tanto más fuerte a medida que r se aproxima a –1 ó +1 y es tanto más débil a medida que se aproxima a 0.

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

Correlaciones positivas

30

80

130

180

230

280

330

140 150 160 170 180 190 200

r=0,1

30

50

70

90

110

140 150 160 170 180 190 200

r=0,8

30

50

70

90

110

130

140 150 160 170 180 190 200

r=0,4

30

40

50

60

70

80

90

100

140 150 160 170 180 190 200

r=0,99

Page 14: DISEÑO DE EXPERIMENTOS AMBIENTALES (UNIDAD I).pdf

26/08/2013

14

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

Correlaciones negativas

0

20

40

60

80

140 150 160 170 180 190 200

r=-0,5

0

20

40

60

80

140 150 160 170 180 190 200

r=-0,7

0

10

20

30

40

50

60

70

80

140 150 160 170 180 190 200

r=-0,999

0

20

40

60

80

140 150 160 170 180 190 200

r=-0,95

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

Evolución de r y diagrama de dispersión

Page 15: DISEÑO DE EXPERIMENTOS AMBIENTALES (UNIDAD I).pdf

26/08/2013

15

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

Prueba de hipótesis para regresión

Paso 1) Planteamiento de hipótesis

es la pendiente de la recta y si esta es igual a cero. Significa que es paralela al eje de la

y eso quiere decir que

no hay pendiente (no hay relación entre las variables). Para probar la hipótesis nula: se utiliza la tabla de distribución t de Student con

grados de libertad ya que se desconoce la varianza poblacional: el estimador se define:

Paso 2) Establecimiento de los valores críticos de t Valor critico de t para regresión

Nota: Se trabaja con 2 niveles de significancia

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

Paso 3) Regla de decisión Rechazo

si

calculada es menor que

o mayor que

Paso 4) Calcular

Paso 5) Conclusión

Page 16: DISEÑO DE EXPERIMENTOS AMBIENTALES (UNIDAD I).pdf

26/08/2013

16

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

Prueba de hipótesis para correlación

Paso 1) Planteamiento de hipótesis

Paso 2) Establecimiento de los valores críticos de t Valor critico de t para regresión

Nota: Se trabaja con 2 niveles de significancia

Paso 3) Regla de decisión Rechazo

si

calculada es menor que

o mayor que

Paso 4) Calcular

Paso 5) Conclusión

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

1. El dueño de una casa multifamiliar en un suburbio del noreste de estados unidos desea desarrollar un modelo para predecir el consumo de energía eléctrica en su “casa eléctrica”( luz, ventiladores, calefacción, aparatos, etc.) según la temperatura exterior (en grados Fahrenheit). Dispone de datos de los recibos mensuales y la información de temperatura para un periodo de 24 meses.

• Establezca el diagrama de dispersión. • Suponga una relación lineal y utilice el método de mínimos cuadrados para encontrar los coeficientes de

regresión. • Interprete el significado de la pendiente en este problema. • Pronostique el consumo promedio en kilowatts cuando la temperatura media es de 50°F. • Calcule el coeficiente de determinación r2 e interprete su significado. • Calcule el error estándar de la estimación.

Page 17: DISEÑO DE EXPERIMENTOS AMBIENTALES (UNIDAD I).pdf

26/08/2013

17

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

B) Suponga una relación lineal y utilice el método de mínimos cuadrados para encontrar los coeficientes de regresión.

(Y) (X)

MES CONSUMO EN KILOWATS TEMP PROMEDIO (F) X2 X*Y Y2 Y (ESTIMADA)

1 126 30 900 3780 15876 113.2

2 132 25 625 3300 17424 122.5

3 114 29 841 3306 12996 115.06

4 87 42 1764 3654 7569 90.88

5 67 48 2304 3216 4489 79.72

6 50 61 3721 3050 2500 55.54

7 39 69 4761 2691 1521 40.66

8 45 78 6084 3510 2025 23.92

9 39 72 5184 2808 1521 35.08

10 43 62 3844 2666 1849 53.68

11 61 45 2025 2745 3721 85.3

12 92 36 1296 3312 8464 102.04

13 123 27 729 3321 15129 118.78

14 121 33 1089 3993 14641 107.62

15 138 28 784 3864 19044 116.92

16 99 39 1521 3861 9801 96.46

17 64 47 2209 3008 4096 81.58

18 52 63 3969 3276 2704 51.82

19 49 69 4761 3381 2401 40.66

20 41 73 5329 2993 1681 33.22

21 44 70 4900 3080 1936 38.8

22 53 64 4096 3392 2809 49.96

23 59 53 2809 3127 3481 70.42

24 118 27 729 3186 13924 118.78

SUMA 1856 1190 66274 78520 171602

MEDIA 77.33333333 49.58333333

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

=

=

= -1.857898

= 77.33333-(-1.857898)(49.583333)= 169.45

Ecuación de regresión lineal

(Estimado)

Page 18: DISEÑO DE EXPERIMENTOS AMBIENTALES (UNIDAD I).pdf

26/08/2013

18

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

C) Interprete el significado de la pendiente en este problema. Ecuación de regresión lineal

(Estimado)

Es la pendiente de la recta. Es el valor que disminuye la variable “y” por cada unidad que

aumenta “x”. Es decir por cada grado Fahrenheit promedio que aumente la temperatura el consumo de kilowatts disminuye. Al ser negativo

se tiene una relación inversa entre la temperatura y el consumo en kilowatts.

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

D) Pronostique el consumo promedio en kilowatts cuando la temperatura media es de 50°F. Ecuación de regresión

Estimando

cuando x = 50 F

76.5551 76.5551 Kilowatts

(Estimado)

Page 19: DISEÑO DE EXPERIMENTOS AMBIENTALES (UNIDAD I).pdf

26/08/2013

19

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

E) Calcule el coeficiente de determinación r2 e interprete su significado.

= 0.8936701952

Esto indica que el 89.367019% de la varianza del consumo en kilowatts (variables y), queda explicada por la temperatura promedio (variable x). El 10.6329% se debe a causas no estadísticas o desconocidas.

F) Calcule el error estándar de la estimación.

=

= 11.648158

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

Page 20: DISEÑO DE EXPERIMENTOS AMBIENTALES (UNIDAD I).pdf

26/08/2013

20

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

Error Estándar de la estimación

Coeficiente de determinación

Page 21: DISEÑO DE EXPERIMENTOS AMBIENTALES (UNIDAD I).pdf

26/08/2013

21

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

Los siguientes datos representan el cargo promedio (en dólares por minuto) y la cantidad de minutos gastados (en miles de millones) en todas las llamadas telefónicas hechas desde estados unidos a 20 países diferentes durante 1996.

PAIS CARGO POR

MINUTO

(DOLARES)

MINUTOS (MIL

MILLONES)

PAIS CARGO POR

MINUTO

(DOLARES)

MINUTOS (MIL

MILLONES)

Canadá 0.34 3.049 India 1.38 0.287

México 0.85 2.012 Brasil 0.96 0.284

Gran Bretaña 0.73 1.025 Italia 1.00 0.279

Alemania 0.88 0.622 Taiwán 0.97 0.273

Japón 1.00 0.576 Colombia 1.00 0.257

República

Dominicana

0.84 0.410 China 1.47 0.232

Francia 0.81 0.364 Israel 1.16 0.214

Corea del Sur 1.09 0.319 Australia 1.01 0.201

Hong Kong 0.90 0.317 Jamaica 1.03 0.188

Filipinas 1.29 0.297 Países bajos 0.78 0.167

Calcule el coeficiente de correlación r. Para 0.05 de nivel de significancia, ¿existe una relación entre X y Y? Explique. Se puede esperar que cuanto mas alto sea el cargo por minuto, menor será el número de minutos que se usen. ¿refleja esta relación esperada el coeficiente de correlación? Explique.

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

A) Calcule el coeficiente de correlación r. (X) (Y)

PAIS CARGOS POR MINUTO (DOLARES) MINUTOS (MIL MILLONES) X2 X*Y Y2 Y (ESTIMADA)

Canadá 0.34 3.049 0.1156 1.03666 9.296401 -2.509362

México 0.85 2.012 0.7225 1.7102 4.048144 -2.478405

Gran Bretaña 0.73 1.025 0.5329 0.74825 1.050625 -2.485689

Alemania 0.88 0.622 0.7744 0.54736 0.386884 -2.476584

Japón 1 0.576 1 0.576 0.331776 -2.4693

República Dominicana 0.84 0.41 0.7056 0.3444 0.1681 -2.479012

Francia 0.81 0.364 0.6561 0.29484 0.132496 -2.480833

Corea del Sur 1.09 0.319 1.1881 0.34771 0.101761 -2.463837

Hong Kong 0.9 0.317 0.81 0.2853 0.100489 -2.47537

Filipinas 1.29 0.297 1.6641 0.38313 0.088209 -2.451697

India 1.38 0.287 1.9044 0.39606 0.082369 -2.446234

Brasil 0.96 0.284 0.9216 0.27264 0.080656 -2.471728

Italia 1 0.279 1 0.279 0.077841 -2.4693

Taiwán 0.97 0.273 0.9409 0.26481 0.074529 -2.471121

Colombia 1 0.257 1 0.257 0.066049 -2.4693

China 1.47 0.232 2.1609 0.34104 0.053824 -2.440771

Israel 1.16 0.214 1.3456 0.24824 0.045796 -2.459588

Australia 1.01 0.201 1.0201 0.20301 0.040401 -2.468693

Jamaica 1.03 0.188 1.0609 0.19364 0.035344 -2.467479

Países bajos 0.78 0.167 0.6084 0.13026 0.027889 -2.482654

SUMA 19.49 11.373 20.1321 8.85955 16.289583

MEDIA 0.928095238 0.541571429

2222 * yynxxn

YXXYnr

Page 22: DISEÑO DE EXPERIMENTOS AMBIENTALES (UNIDAD I).pdf

26/08/2013

22

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

=

= -0.664830

B) Para 0.05 de nivel de significancia, ¿existe una relación entre X y Y? Explique. Planteamiento De la hipótesis

Establecimiento de los valores críticos de t

= 0.05 n= 20

)= t(18, 0.025)=

2.101 (de tablas)

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

Calculo de t.

=

=

= 0.01348384257

=

= 144.6175

Como t calculada (144.6175) cae en la zona de rechazo, rechazo

y acepto

como cierta, es decir si hay una relación significativa entre variables (x y y) a un nivel de significancia del 0.05 y el valor p del análisis de varianza en minitab 16 es menor que 0.05.

Page 23: DISEÑO DE EXPERIMENTOS AMBIENTALES (UNIDAD I).pdf

26/08/2013

23

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

C) Se puede esperar que cuanto mas alto sea el cargo por minuto, menor será el número de minutos que se usen. ¿Refleja esta relación esperada el coeficiente de correlación? Explique.

=

= -0.664830

El -0.664830 es un valor próximo a -1 por lo que se considera un grado de asociación entre variables. La correlación es negativa, y el coeficiente de correlación se presta para la prueba estadística.

Aunque el 44.2% de la varianza (coeficiente de determinación) del numero de minutos usados queda explicada por el cargo por minuto. El 55.8% restante se debe a causas no estadísticas o desconocidas.

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

Page 24: DISEÑO DE EXPERIMENTOS AMBIENTALES (UNIDAD I).pdf

26/08/2013

24

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

1.501.251.000.750.50

3.5

3.0

2.5

2.0

1.5

1.0

0.5

0.0

-0.5

CARGOS POR MINUTO

MIN

UTO

S

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

Este problema está relacionado con un estudio acerca de la cantidad de precipitación pluvial y la cantidad de contaminación atmosférica.

Hacer las siguientes estimaciones: (a) Identificar la variable dependiente y la variable independiente. Hacer una gráfica que vaya en función de la variable dependiente Y, y la variable independiente X. (b) Calcular los valores de la estadística descriptiva de los datos. (c) Obtener la ecuación de regresión lineal simple y trazarla en la gráfica. (d) Hacer una gráfica que muestre la prueba de normalidad. Complementar la evaluación del modelo con inferencias estadísticas, como: (e) Cálculo del coeficiente de determinación R2 y el coeficiente de correlación R. (f) Hacer una grafica que muestre los residuales estandarizados versus renglones (g) Hacer una tabla de análisis de varianza (ANOVA).

Page 25: DISEÑO DE EXPERIMENTOS AMBIENTALES (UNIDAD I).pdf

26/08/2013

25

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

En un estudio de microbiología ambiental, en muestras de agua, se dieron los siguientes datos de la tabla de abajo. Estos datos se refieren al crecimiento de una colonia de bacterias en un medio de cultivo.

(a) Calcular la línea de regresión. Que significa

tiene aplicación práctica. Que significa

Calcule el error estándar del estimador

.

(b) Calcular e interpretar el coeficiente de determinación R2 y el coeficiente de correlación R. (c) Con la ecuación de regresión, estimar el número de bacterias después de 20 días Realice una prueba de hipótesis Ho: R=0, utilizando un nivel de significancia del 1%.

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

En un estudio de ingeniería del agua relacionado con las reducciones de los sólidos suspendidos, en función de la demanda química de oxígeno (DQO), se sacó una muestra aleatoria, cuyos datos se dan en la tabla de abajo. Para lo siguiente: (a) Identificar la variable dependiente y la independiente y hacer una gráfica de DQO versus reducción de sólidos.

(b) Calcular la ecuación de la línea de regresión. (c) Hacer una tabla de análisis de varianza que incluya el valor de p. (d) Validar el modelo candidato, a través de estadísticas como R2,

Page 26: DISEÑO DE EXPERIMENTOS AMBIENTALES (UNIDAD I).pdf

26/08/2013

26

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s

Page 27: DISEÑO DE EXPERIMENTOS AMBIENTALES (UNIDAD I).pdf

26/08/2013

27

I n s t i t u t o Te c n o l ó g i c o d e C i u d a d V a l l e s D e p a r t a m e n t o d e I n g e n i e r í a s