Análisis de La Varianza.docx Exposicion

Embed Size (px)

Citation preview

  • 5/21/2018 An lisis de La Varianza.docx Exposicion

    1/27

  • 5/21/2018 An lisis de La Varianza.docx Exposicion

    2/27

    El anlisis de varianza es una tcnica que se puede utilizar para decidir si las

    medias de dos o ms poblaciones son iguales. La prueba se basa en una

    muestra nica, obtenida a partir de cada poblacin.

    El anlisis de varianza puede servir para determinar si las diferencias entre las

    medias mustrales revelan las verdaderas diferencias entre los valores medios

    de cada una de las poblaciones, o si las diferencias entre los valores medios de

    la muestra son ms indicativas de una variabilidad de muestreo.

    Si el valor estadstico de prueba (anlisis de varianza) nos impulsa a aceptar la

    hiptesis nula, se concluira que las diferencias observadas entre las medias de

    las muestras se deben a la variacin casual en el muestreo (y por tanto, que los

    valores medios de poblacin son iguales). Si se rechaza la hiptesis nula, se

    concluira que las diferencias entre los valores medios de la muestra son

    demasiado grandes como para deberse nicamente a la casualidad (y por ello,

    no todas las medias de poblacin son iguales).

    Los datos para el anlisis de varianza se obtienen tomando una muestra de

    cada poblacin y calculando la media muestral y la variancia en el caso de

    cada muestra.

    Existen tres supuestos bsicos que se deben satisfacer antes de que se pueda

    utilizar el anlisis de variancia.

  • 5/21/2018 An lisis de La Varianza.docx Exposicion

    3/27

    1) Las muestras deben ser de tipo aleatorio independiente.

    2) Las muestras deben ser obtenidas a partir de poblaciones normales.

    3) Las poblaciones deben tener variancias iguales (es decir, )

    El anlisis de varianza, como su nombre lo indica, comprende el clculo de

    varianzas. La varianza de una muestra es el promedio de las desviaciones

    elevadas al cuadrado de la media del grupo.

    Simblicamente, esto se representa de la siguiente manera:

    Cabe observar que se debe utilizar n -1, ya que se est trabajando con datos

    mustrales. De ah que, para obtener la varianza muestral, el procedimiento

    sea el siguiente:

    1) Calcular la media muestral

    2) Restar la media de cada valor de la muestra.

    3) Elevar al cuadrado cada una de las diferencias.

    4) Sumar las diferencias elevadas al cuadrado.

    5) Dividir entre n -1

  • 5/21/2018 An lisis de La Varianza.docx Exposicion

    4/27

    LA RAZN F

    A diferencia de otras pruebas de medias que se basan en la diferencia existente

    entre dos valores, el anlisis de varianza emplea la razn de las estimaciones,

    dividiendo la estimacin intermediante entre la estimacin interna

    Esta razn F fue creada por Ronald Fisher (1890-1962), matemtico britnico,

    cuyas teoras estadsticas hicieron mucho ms precisos los experimentos

    cientficos. Sus proyectos estadsticos, primero utilizados en biologa,

    rpidamente cobraron importancia y fueron aplicados a la experimentacin

    agrcola, mdica e industrial. Fisher tambin contribuy a clarificar las

    funciones que desempean la mutacin y la seleccin natural en la gentica,

    particularmente en la poblacin humana.

    El valor estadstico de prueba resultante se debe comparar con un valor

    tabular de F, que indicar el valor mximo del valor estadstico de prueba que

    ocurra si H0 fuera verdadera, a un nivel de significacin seleccionado. Antes

    de proceder a efectuar este clculo, se debe considerar las caractersticas de la

    distribucin F

  • 5/21/2018 An lisis de La Varianza.docx Exposicion

    5/27

    CARACTERSTICAS DE LA DISTRIBUCIN F

    Existe una distribucin F diferente para cada combinacin de tamao de

    muestra y nmero de muestras. Por tanto, existe una distribucin F que se

    aplica cuando se toman cinco muestras de seis observaciones cada una, al

    igual que una distribucin F diferente para cinco muestras de siete

    observaciones cada una. A propsito de esto, el nmero distribuciones de

    muestreo diferentes es tan grande que sera poco prctico hacer una extensa

    tabulacin de distribuciones. Por tanto, como se hizo en el caso de la

    distribucin t, solamente se tabulan los valores que ms comnmente se

    utilizan.

    En el caso de la distribucin F, los valores crticos para los niveles

    0,05 y 0,01

    generalmente se proporcionan para determinadas combinaciones

    de tamaos de muestra y nmero de muestras.

    La distribucin es continua respecto al intervalo de 0 a + . La razn ms

    pequea es 0. La razn no puede ser negativa, ya que ambos trminos de la

    razn F estn elevados al cuadrado. Por otra parte, grandes diferencias entre

    los valores medios de la muestra, acompaadas de pequeas variancias

    mustrales pueden dar como resultado valores extremadamente grandes de la

    razn F.

  • 5/21/2018 An lisis de La Varianza.docx Exposicion

    6/27

    La forma de cada distribucin de muestreo terico F depende del nmero de

    grados de libertad que estn asociados a ella. Tanto el numerador como el

    denominador tienen grados de libertad relacionados.

    DETERMINACIN DE LOS GRADOS DE LIBERTAD

    Los grados de libertad para el numerador y el denominador de la razn F se

    basan en los clculos necesarios para derivar cada estimacin de la variancia

    de la poblacin. La estimacin intermediante de variancia (numerador)

    comprende la divisin de la suma de las diferencias elevadas al cuadrado entre

    el nmero de medias (muestras) menos uno, o bien, k -1. As, k -1es el nmero

    de grados de libertad para el numerador.

    En forma semejante, el calcular cada variancia muestral, la suma de las

    diferencias elevadas al cuadrado entre el valor medio de la muestra y cada

    valor de la misma se divide entre el nmero de observaciones de la muestra

    menos uno, o bien, n -1. Por tanto, el promedio de las variancias mustrales se

    determina dividiendo la suma de las variancias de la muestra entre el nmero

    de muestras, o k. Los grados de libertad para el denominador son entonces,

    k(n -l).

    Uso de la tabla de F del anlisis de variancia (ANOVA)

    En la tabla se ilustra la estructura de una tabla de F para un nivel de

    significacin de 0,01 o 1 y 0,05 o 5 . Se obtiene el valor tabular, localizando

    los grados de libertad del numerador (que se listan en la parte superior de la

  • 5/21/2018 An lisis de La Varianza.docx Exposicion

    7/27

    tabla), as como los del denominador (que se listan en una de las columnas

    laterales de la tabla) que corresponden a una situacin dada. Utilizando el

    nivel de significacin de 0,05 para grados de libertad, el valor de F es 8,89

  • 5/21/2018 An lisis de La Varianza.docx Exposicion

    8/27

    El anlisis de la varianza (o Anova: Analysis of variance) es un mtodo para

    comparar dos o ms medias, que es necesario porque cuando se quiere

    comparar ms de dos medias es incorrecto utilizar repetidamente el contraste

    basado en la t de Student. Por dos motivos:

    En primer lugar, y como se realizaran simultnea e independientemente

    varios contrastes de hiptesis, la probabilidad de encontrar alguno

    significativo por azar aumentara. En cada contraste se rechaza la H0 si la t

    supera el nivel crtico, para lo que, en la hiptesis nula, hay una probabilidad

    a. Si se realizan m contrastes independientes, la probabilidad de que, en la

    hiptesis nula, ningn estadstico supere el valor crtico es (1 - a)m, por lo

    tanto, la probabilidad de que alguno lo supere es 1 - (1 - a)m, que para valores

    de a prximos a 0 es aproximadamente igual a m. Una primera solucin,

    denominada mtodo de Bonferroni, consiste en bajar el valor de a, usando en

    su lugar a/m, aunque resulta un mtodo muy conservador.

    Por otro lado, en cada comparacin la hiptesis nula es que las dos muestras

    provienen de la misma poblacin, por lo tanto, cuando se hayan realizado

    todas las comparaciones, la hiptesis nula es que todas las muestras provienen

    de la misma poblacin y, sin embargo, para cada comparacin, la estimacin

  • 5/21/2018 An lisis de La Varianza.docx Exposicion

    9/27

    de la varianza necesaria para el contraste es distinta, pues se ha hecho en base

    a muestras distintas.

    El mtodo que resuelve ambos problemas es el anova, aunque es algo ms que

    esto: es un mtodo que permite comparar varias medias en diversas

    situaciones; muy ligado, por tanto, al diseo de experimentos y, de alguna

    manera, es la base del anlisis multivariante.

  • 5/21/2018 An lisis de La Varianza.docx Exposicion

    10/27

    EJERCICIO N 1

    Una lista de palabras sin sentido se presenta en la pantalla del ordenador

    con cuatro procedimientos diferentes, asignados al azar a un grupo de

    sujetos. Posteriormente se les realiza una prueba de recuerdo de dichas

    palabras, obtenindose los siguientes resultados:

    PROCEDIMIENTO 1 PROCEDIMIENTO 2 PROCEDIMIENTO 3 PROCEDIMIENTO 4

    5 9 8 1

    7 11 6 36 8 9 4

    3 7 5 5

    9 7 7 1

    7 4 4

    4 4

    2

    TABLA DE REALIZACION DE EJERCICIO

    PROCED. 1 PROCED. 2 PROCED. 3 PROCED.4 TOTAL

    Tc

    43 42 43 18 146

    Nc

    8 5 7 6 26

    Tc2/nc

    231.10 352.8 264.10 54 902

    X2

    269 364 287 68 988

    SST= 902 (146)2/26

    SST= 902- 819.80

    SST= 82.20

    SSE= 988-902SSE= 86

  • 5/21/2018 An lisis de La Varianza.docx Exposicion

    11/27

    FUENTE DE

    VARIACION

    SUMA DE

    CUADRADOS

    GRADOS DE

    LIBERTAD

    CUADRADO MEDIO

    ENTRE LOS GRUPOS

    82.20 4-1= 3 27.40

    EN GRUPO

    86 26-4= 22 3.90

    TOTAL

    7.03

    El valor en la F terica con 3 y 22 grados de libertad a un nivel de confianza

    del 95% es 3.05. Por consiguiente se rechaza la hiptesis nula y se concluye

    que los cuatro procedimientos de presentacin producen diferencias

    significativas.

  • 5/21/2018 An lisis de La Varianza.docx Exposicion

    12/27

    EJERCICIO N 2

    Se quiere evaluar la eficacia de distintas dosis de un frmaco contra la

    hipertensin arterial, comparndola con la de una dieta sin sal. Para ello se

    seleccionan al azar 25 hipertensos y se distribuyen aleatoriamente en 5

    grupos- l primero de ellos no le suministra ningn tratamiento, al

    segundo una dieta con un contenido pobre en sal, al tercero una dieta sin

    sal, al cuarto el frmaco a una dosis determinada y al quinto el mismo

    frmaco a otra dosis. Las presiones arteriales sistlicas de los 25 sujetos al

    finalizar los tratamientos son:

    L T BL DE NOV

    LA TABLA DE ANOVA ES: GL SS MS F

    FUENTE DE VARIACION

    4 2010,64 502,66 11,24

    TRATAMIENTO

    20 894,4 44,72

    ERROR

    24 2905,04

    TOTAL

    GRUPO

    1 2 3 4 5

    180 172 163 158 147173 158 170 146 152

    175 167 158 160 143

    182 160 162 174 155

    181 175 170 155 160

  • 5/21/2018 An lisis de La Varianza.docx Exposicion

    13/27

    Como F=2,87 y 11,25 > 2,87 rechazamos la hiptesis nula y concluimos

    que los resultados de los tratamientos son diferentes

  • 5/21/2018 An lisis de La Varianza.docx Exposicion

    14/27

    EJERCICIO NO. 3

    Se tienen las lecturas de hemoglobina de estudiantes varones de 3 aulas de

    primero de secundarias en un colegio:

    1er Grado 1er Grado B 1er Grado C

    14 16 13

    15 17 15

    16 15 14

    13 14 17

    9 8 13

    15 12 10

    16 14 8

    Media m =

    14 13.71 12.86 40.57

    Tc

    98 96 90 284

    nc

    7 7 7 21

    1408 1370 1212 3990

  • 5/21/2018 An lisis de La Varianza.docx Exposicion

    15/27

    FORMULAS:

    Entre grupos Dentro de los grupos

    Tc

    98 96 90 284

    3845.71

    nc

    7 7 7 21

    1408 1370 1212 3990

    ( ) 2/N ( )

    2/21

    Formato General de la tabla de anlisis de la varianza

    Fuente de variacin Suma de cuadrados Grados de libertad Cuadrado medio

    Entre los gruposSST K-1 SST/K=MSTR

    En los grupos

    SSE N-K SSE/N-K=MSR

    Total

    Fuente de variacin Suma de cuadrados Grados de libertad Cuadrado medio

    Entre los grupos4.95 3-1 4.95/2=2.475

    En los grupos144.29 21-3 144.29/18=8.016

    Total ()

  • 5/21/2018 An lisis de La Varianza.docx Exposicion

    16/27

    INTERPRETACIN:

    = 0.309, es la funcin de prueba

    Con (3-1) y (21-3) grados de libertad = 2 grados de libertad en el

    numerador y 18en el denominador.

    , es el valor critico de la distribucin F

    Se acepta la hiptesis nula.

    Las medias aritmticas son iguales.

  • 5/21/2018 An lisis de La Varianza.docx Exposicion

    17/27

    EJERCICIO N 4

    Un profesor del curso de mercadotecnia pidi a los alumnos de un de sus

    grupos que evaluaran su desempeo como excelente, bueno, regular o

    deficiente. Un estudiante egresado recopilo las evaluaciones y aseguro a los

    estudiantes que el profesor las recibira hasta que las calificaciones del

    curso se hubieran enviado a las oficinas de registro. La evaluacin (es decir,

    el tratamiento) que cada alumno asigno al profesor se compar con las

    calificaciones, que podr ir de 0 a 100 que obtuvo el estudiante en el curso.

    A continuacin se presenta la informacin de la muestra existe diferente

    entre los promedios de las calificaciones de los alumnos en cada uno de las

    cuatro categora de evaluacin? Utilice el nivel de significancia 0.01

    CALIFICACIONES DEL CURSO

    EXCELENTE BUENO REGULAR DEFICIENTE

    94 75 70 68

    90 68 73 70

    85 77 76 72

    80 83 78 65

    88 80 74

    68 65

    65

  • 5/21/2018 An lisis de La Varianza.docx Exposicion

    18/27

    1.

    Plantear la hiptesis nula y la hiptesis alternativa

    2. Seleccionar el nivel de significancia

    Se elige el nivel 0.01

    3.

    Cul es la regla de decisin

    Grados de libertad en el numerador = k-1= 4-1=3

    Grados de libertad en el numerador= n-k=22-4=18

    EXCELENTE BUENO REGULAR DEFICIENTE TOTAL

    X X X X 94 8836 75 5625 70 4900 68 4624

    90 8100 68 4624 73 5329 70 4900

    85 7225 77 5929 76 5776 72 5184

    80 6400 83 6889 78 6084 65 422588 7744 80 6400 74 5476

    68 4624 65 4225

    65 4225

    349 391 510 414 1664

    4 5 7 6 22

    30561 30811 37338 28634 127344

    4.

    Calcule SST, SSE Y SS total

    SUMA DE CUADRADOS; TOTAL SS total =

    127344 -

    = 1485.09

  • 5/21/2018 An lisis de La Varianza.docx Exposicion

    19/27

    SUMA DE CUADRADOS DEBIDOS AL TRATAMIENTO

    SST =

    SUMA DE CUADRADOS DEL ERROR

    SSE = SS total

    SST

    1485.09-890.68 =594.41

    5. elabore una tabla de ANOVA

    TABLA ANOVA

    FUENTE DE

    VARIACION

    SUMA DE

    CUADRADOS

    GRADOS DE

    LIBERTAD

    CUADRADO

    MEDIO

    F

    TRATAMIENTOS SST k-1 SST/(K-1) = MST MST/MSE

    ERROR SSE n-k SSE/(N-K) =MSE

    TOTAL SS total n-1

    TABLA ANOVA

    FUENTE DE VARIACION SUMA DE CUADRADOS GRADOS DE LIBERTAD CUADRADO MEDIO F

    TRATAMIENTOS 890,68 3 296,89 8,99

    ERROR 594,41 18 33,02

    TOTAL 1485,09 21

  • 5/21/2018 An lisis de La Varianza.docx Exposicion

    20/27

    EJERCICIO N 5

    Los miembros de un equipo ciclista se dividen al azar en tres grupos que

    entrenan con mtodos diferentes. El primer grupo realiza largos recorridos

    a ritmo pausado, el segundo grupo realiza series cortas de alta intensidad y

    el tercero trabaja en el gimnasio con pesas y se ejercita en el pedaleo de alta

    frecuencia. Despus de un mes de entrenamiento se realiza un test de

    rendimiento consistente en un recorrido cronometrado de 9 Km. Los

    tiempos empleados fueron los siguientes:

    A un nivel de confianza del 95% Puede considerarse que los tres mtodos

    producen resultados equivalentes? O por el contrario Hay algn mtodo

    superior a los dems?

    METODO I MEDOTO II METODO III

    15 14 13

    16 13 12

    14 15 11

    15 16 14

    17 14 11

  • 5/21/2018 An lisis de La Varianza.docx Exposicion

    21/27

    DESARROLLO

    TC

    77 72 61 210

    NC

    5 5 5 15

    TC / NC

    1185,8 1036,8 744,2 2966,8

    1191 1042 751 2984

    SST=

    TC/NC) -

    ) /N

    SST= 2966, 8 (210) / 15

    SST= 2966, 8 2940= 26, 8

    SSE=

    - TC/NC)

    SSE= 2984

    2966, 8 = 17, 2

    FUENTE DE

    VARIACION

    SUMA DE

    CUADRADOS

    GRADOS DE

    LIBERTAD

    CUADRADO

    MEDIO

    ENTRE GRUPOSSST K-1

    SST/K-1= MSTR

    EN LOS GRUPOSSSE N-K

    SSE/N-K= MSE

    TOTAL F(MSTR/MSE)

  • 5/21/2018 An lisis de La Varianza.docx Exposicion

    22/27

    F= (MSTR/MSE)

    F= 13, 4 / 1, 43

    F= 9, 37

    El valor de la F terica con 2 y 12 grados de libertad, a un nivel de confianza

    del 95% es 3,89. Por consiguiente se rechaza la hiptesis nula y se concluye

    que los tres mtodos de entrenamiento producen diferencias significativas.

    ENTRE GRUPOS26, 8 3-1= 2 13, 4

    EN LOS GRUPOS17, 2 15- 3= 12 1, 43

  • 5/21/2018 An lisis de La Varianza.docx Exposicion

    23/27

  • 5/21/2018 An lisis de La Varianza.docx Exposicion

    24/27

    EJERCICIO 6

    Una compaa ofrece el servicio desde el edificio Toledo hasta el aeropuerto metro

    (Detroit). El representante de la compaa est considerando dos rutas:

    Ruta 1 Us 25

    Ruta 2 Intertatal 75

    Desea estudiar el tiempo necesario para llegar al aeropuerto por cada uno de estos

    caminos y despus comparar resultados. Obtuvo los siguientes datos de muestra de

    minuto. Utilizo el nivel de significativa del 0,005

    Existe alguna diferencia en la variacin de los tiempos de recorrido de ambas rutas?

    US 25 INTERSTATAL 75

    52

    59

    67 60

    56 61

    45 51

    70

    56

    54

    63

    64 57

    65

    408 472

    = 880

  • 5/21/2018 An lisis de La Varianza.docx Exposicion

    25/27

    US 25 INTERSTATAL 75

    2704 3481

    4489 3600

    3136

    3721

    2025 2601

    4900

    3136

    2916

    3969

    4096 3249

    4225

    24266 27982

    = 52,248

    SST = SST =51.628,57 880

    2/ 15

    SST = 51.628,57 51.628,67

    SST = 1,9

    SSE = - SSE = 52248 51.628,57

    SSE = 619,43

  • 5/21/2018 An lisis de La Varianza.docx Exposicion

    26/27

    FUENTE

    VARIACION

    SUMA DE

    CUADRADOS

    GRADOS DE

    LIBERTAD

    CUADRADO

    MEDIO

    Entre los grupos SST 1,90 2 - 1 = 1 1,9

    En los grupos SST 619,43 15 - 2 = 13 47,64F = 0,03

    Valor Critico 4,67: Se rechaza la hiptesis nula debido a que el valor critico

    es mayor al valor F .

  • 5/21/2018 An lisis de La Varianza.docx Exposicion

    27/27

    NGULO CERON DI N

    BERN L CONSUEGR CHRISTI N

    CH VEZ ESTRELL V LERI

    CHOEZ PLU S KERLY

    G LE S VIV NCO M RI

    S NCHEZ P L CIOS M RI FERN ND