7- Pruebas de Rango Multiple

Embed Size (px)

Citation preview

Pruebas de Rango Mltiple

Pruebas de Rango Mltiple

UNIDAD VIIIng. Vctor Hugo Castro TavaresFacultad de Ciencias QumicasUNIDAD VIIPruebas de Rango Mltiple

Las pruebas de rango mltiple tienen el mismo objetivo que los contrastes ortogonales de las comparaciones, es decir, nos sirven parar determinar que tratamientos son los diferentes.Las ventajas de estas pruebas son que es un mtodo ms corto y que las comparaciones se realizan tratamiento por tratamiento. No grupos de tratamiento contra grupos de tratamiento que pueden provocar enmascaramiento en los resultados. Estos son conocidos como Pruebas cualificativas.El anlisis de varianza, y ms propiamente dicho, la prueba de F, nos indicara que algunas medias de tratamientos son diferentes, es decir, medias que difieren significativamente como grupo.

La hiptesis nula que en este caso se aprueba es:

Esta prueba falla al indicar cuales medias de tratamientos diferirn significativamente unas de otras. Es decir, solo descubrir diferencias en un nivel de significancia dado. Frecuentemente, una de las decisiones que se hacen en la investigacin es que una media de tratamiento es diferente de una o ms medias.

El mecanismo para lograr este objetivo se denomina:Mtodo de Comparaciones Mltiples de MediasUn aspecto importante de este problema es que el investigador alcanza su propsito con una probabilidad especfica, de que todas las comparaciones hechas darn respuestas concretas.La ayuda que nos brindan tales procedimientos de comparaciones mltiples consiste en el establecimiento de una declaracin fuertemente confirmada por los datos especficos sujetos a anlisis, esto es, dar una conclusin.Entre los mtodos de comparacin mltiple comnmente se incluyen los siguientes:Para determinar las diferencias entre los tratamientos se aplica solamente una de ellas, siendo la prueba ms estricta la de SCHEFFE y la menos estricta la DMS, donde el sentido de estricto va de DMS a SCHEFFE.

El procedimiento para todas las pruebas consiste en calcular una tabla de diferencia entre medias equivalente al estadstico de pruebas y lo que hace que una prueba sea distinta de otra y es la forma como se calcula el comparador.

Esta prueba, ideada por Fisher, no debe utilizarse a menos que la prueba F sea significativa. En sentido estricto, la mnima diferencia significativa (DMS) solo debe emplearse para comparar medias adyacentes en un arreglo ordenado medias dispuestas por orden de magnitud. Cuando la DMS se usa indiscriminadamente para probar todas las diferencias posibles entre diversas medias, ciertas diferencias sern significativas, pero no en el nivel de significacin que s ha escogido. Para un anlisis de varianza de un solo criterio de clasificacin completamente al azar -. con t tratamientos el numero de comparaciones entre medias de poblaciones tratamientos- independiente ortogonales es (t-1), mientras que el nmero de posibles comparaciones de tales medias, tomadas de dos a la vez, es t(t-1)/2. Todas estas posibles comparaciones pueden no ser independientes, y son necesarios otros mtodos adems de la simple DMS, validos para comparaciones mltiples independientes, que debern ser considerados.No obstante lo anterior, muchos especialistas coinciden en que la DMS es adecuada para comparar un tratamiento estndar con otros tratamientos; tal es el caso de la comparacin de variedades con una variedad testigo o estndar. La ventaja de esta prueba es que resulta fcil de calcular y emplea un estimador nico para efectuar comparaciones.La formula de la DMS se deriva, a su vez, de la formula de la t en la prueba de la significacin estadstica de la diferencia entre dos medias:

En esta expresin, S2 es el cuadrado medio del error, r es el nmero de repeticiones, y t es el valor tabular de t para los grados de libertad del error.7.2.1 Para diferente nmero de Repeticiones por tratamiento

donde ri y rj son las repeticiones de los 2 tratamientos que se van a comparar, lo cual nos genera una tabla de comparadores semejantes a la tabla de diferencias entre medias de tratamientos.

7.2.2 Para igual nmero de Repeticiones por tratamiento

En las estadsticas, Duncan la nueva gama de pruebas mltiples (MRT) es una comparacin mltiple de procedimiento elaborado por David B. Duncan en 1955. Duncan's MRT belongs to the general class of multiple comparison procedures that use the studentized range statistic q r to compare sets of means. Duncan MRT pertenece a la clase general de comparacin mltiple de los procedimientos que utilizan la gama studentized q r estadstica para comparar conjuntos de medios, Duncan's new multiple range test (MRT) is a variant of the Student Newman Keuls method that uses increasing alpha levels to calculate the critical values in each step of the Newman es una variante del Estudiante Newman Keuls mtodo que utiliza el aumento de los niveles de alfa para calcular los valores crticos en cada etapa del procedimiento de Newman Keuls. Duncan's MRT attempts to control family wise error rate (FWE) at ew = 1(1 pc ) k 1 when comparing k, where k is the number of groups. Duncan MRT intentos de controlar la tasa de error sabio familia (FWE) en ew = 1 - (1 - pc) cuando se comparan k -1 k, donde k es el nmero de grupos. This results in higher FWE than unmodified Newman Keuls procedure which has FWE of ew = 1(1 pc ) k /2 . Esto resulta en mayor FWE que sin modificar Newman Keuls procedimiento que ha de FWE ew = 1 - (1 - uds) k / 2.David B. Duncan developed this test as a modification of the Student-Newman-Keuls method that would have greater power.Duncan la MRT es especialmente proteccin contra falsos negativos (tipo II) de error, a expensas de tener un mayor riesgo de falsos positivos (tipo I) errores. Duncan's test is commonly used in agronomy and other agricultural research. La prueba de Duncan se utiliza comnmente en la agronoma y la investigacin agrcola.

Esta prueba es la ms ampliamente utilizada entre las diversas pruebas de rango mltiple disponible.

Su mtodo es de naturaleza secuencial, esto es que utiliza un nuevo valor estudentizado para cada una de las comparaciones de medias adyacentes. Este procedimiento se utiliza con ms amplitud cuando diversos tratamientos no relacionados se incluyen en un experimento (por ejemplo, para efectuar todas las comparaciones posibles entre las capacidades de produccin de diversas variedades).Adems, la prueba incluye el clculo de las diferencias significativas mnimas entre las medias del tratamiento cuando estas se encuentran dispuestas en orden de magnitud. la formula es la siguiente:

donde Ra es el valor extrado de una tabla especial de rangos estudentizados, con los grados de libertad del error y con la disposicin relativa de las medias en el arreglo; es el producto de , donde S2 es el cuadrado medio del error, y r es el nmero de repeticiones.

Duncan's test has been criticised as being too liberal by many statisticians including Henry Scheff , and John W. Tukey . La prueba de Duncan ha sido criticado por ser demasiado liberales por muchos estadsticos incluidos Henry Scheff, y John W. Tukey. Duncan argued that a more liberal procedure was appropriate because in real world practice the global null hypothesis H 0 = "All means are equal" is often false and thus traditional statisticians overprotect a probably false null hypothesis against type I errors. Duncan argument que un procedimiento ms liberal era apropiado, porque en la prctica, el mundo real mundial hiptesis nula H 0 = "Todos los medios son iguales" es a menudo falsa y por lo tanto, los estadsticos tradicionales overprotect probablemente una falsa hiptesis nula contra los errores de tipo I. Duncan later developed the Duncan-Waller test which is based on Bayesian principles. Duncan posteriormente desarroll la prueba de Waller-Duncan, que se basa en principios Bayesiano. It uses the obtained value of F to estimate the prior probability of the null hypothesis being true. Utiliza el valor de F obtenidos para estimar la probabilidad de que antes de la hiptesis nula de ser cierto.The main criticisms raised against Duncan's procedure are: Las principales crticas formuladas contra Duncan el procedimiento son: Duncan's MRT does not control family wise error rate at the nominal alpha level, a problem it inherits from Student-Newman-Keuls metDuncan MRT control de la familia no saba tasa de error en el nivel nominal de alfa, un problema que se hereda de Student-Newman-Keuls mtodo.

The increased power of Duncan's MRT over Newman-Keuls comes from intentionally raising the alpha levels ( Type I error rate) in each step of the Newman Keuls procedure and not from any real improvement on the SNK methodEl aumento de potencia de ms de Duncan MRT Newman-Keuls intencionalmente la recaudacin proviene de los niveles de alfa (tipo I error rate) en cada paso del procedimiento de Newman Keuls, y no de una verdadera mejora en el mtodo de SNK.

Las suposiciones bsicas son, en esencia, las del anlisis de la varianza en una dimensin para tamaos mustrales iguales.

La prueba compara el Rango de Mnima Significancia, Rp, dado por:

aqu es una estimacin de:

y puede calcularse como:

donde MSE es la media de los cuadrados de error en el Anlisis de Varianza. El valor de rp depende del valor deseado de significancia y del nmero de grados de Libertad correspondiente a la MSE, que se obtienen de tablas.7.3.1 Para diferente nmero de Repeticiones por tratamiento

Donde n toma valores de 2 para la primera diagonal, de 3 para la segunda diagonal, de cuatro para la tercera diagonal y de 5 para la cuarta diagonal.El numero de diagonales es t-1 donde n tomara valores desde 2 hasta t.Donde ri y rj son las repeticiones de los tratamientos que irn a comparar lo cual nos tabla de comparadores semejante a la tabla de diferencia de medias de tratamientos.

7.3.2 Para igual nmero de Repeticiones por tratamiento

El mtodo de Student- Newman-Keuls (SNK) no tiene el carcter aproximado del procedimiento de Duncan. Algunos estudios han revelado que el mtodo SNK es menos potente y conservador en el nmero de diferencias significativas que el procedimiento Duncan. Sin embargo, en situaciones donde no es necesario ser tan conservador, se recomienda el uso de esta prueba, la cual tambin es de naturaleza secuencial, es decir, que utiliza un nuevo valor estudentizado para cada una de las comparaciones de medias adyacentes.Para el clculo de esta prueba se requiere determinar la diferencia mnima significativa entre las medias del tratamiento, cuando estas se encuentran dispuestas en orden de magnitud. su frmula es la siguiente:

donde es el valor obtenido de tablas especiales de rangos estudentizados, para los grados de libertad del erro y con la disposicin relativa de las medias en el arreglo; es producto de , donde es igual al cuadrado medio del error, y r es el nmero de repeticiones.7.4.1 Para diferente nmero de Repeticiones por tratamiento

Esta prueba es exactamente igual a la prueba de Duncan. La nica diferencia consiste en los valores de la tabla de R.

n=2, 3,4 ,5

7.4.2 Para igual nmero de Repeticiones por tratamiento

El mtodo de Tukey es un procedimiento basado en el rango estudentizado, pero no es secuencial, pues utiliza un solo valor de q ordinario.Sin embargo, el mtodo Tukey es til en situaciones en que se desea hacer un primer nfasis en el uso del experimento con un total para determinar la significancia de los pares de medias. Esta prueba solo es exacta cuando los grupos tienen igual nmero de elementos y para medias que no han sido ajustadas por covarianza. Esta prueba se define como sigue:

donde qa es el valor obtenido de talbas especiales de rangos estudentizados, para los grados de libertad del error, y con t numero de tratamientos; es el producto de , donde S2 es igual al cuadrado medio del erro, y r es el nmero de repeticiones.

Esta prueba utiliza el mximo comparador de la prueba SNK

Este se considera un mtodo bastante general que utiliza una DnF de Snedecor. El mtodo de Scheffe puede aplicarse para probar la hiptesis general de que una funcin lineal de las medias poblacionales es igual a cero. En contraste con las comparaciones mltiples basadas en rango estudentizado, el de Scheffe es un mtodo exacto para medias provenientes de muestras de igual o desigual tamao (ri rj) y para medias que han sido ajustadas por covarianza. Para el clculo se requiere determinar la mnima diferencia significativa entre las medias del tratamiento cuando estas se encuentran dispuestas en orden de magnitud. Este mtodo se define como sigue:

donde:t es el nmero de tratamientosF es un valor que se obtiene de la DnF de Snedecor con t-1 y los grados de libertad del error.S2 es el cuadrado medio del error, y ri, rj representan el numero de observaciones usadas para calcular cada media muestral xi, xj.

7.6.1 Para diferente nmero de Repeticiones por tratamiento

donde ri y rj son las repeticiones de los 2 tratamientos que se van a comparadores semejantes a la tabla de la de tabla de diferencia de esencia media detratacompi

7.6.2Para igual nmero de Repeticiones por tratamiento

El siguiente ejemplo trata de explicar la mecnica de la comparacin de medias. En este experimento se desea determinar el efecto de la implantacin de una hormona, el Estilbestrol, sobre la capacidad de aumentar el peso de ovejas machos (M) y hembras (H). Los tratamientos fueron un conjunto factorial, teniendo como factores el sexo y el Estilbestrol; cada factor tuvo dos niveles.A continuacin se expresa el aumento de peso de ovejas agrupadas por tratamiento y por bloque (libras por oveja por 100 das):Bloques

TratamientosIIIIIIIVTotal Media

AHo4752625121253

BMo5054675722857

CH35757695723659

DM35454745925263

Fo VglScCMFcF0.05 0.01

Tratamientos320869.38.91 **

Bloques3576192.024.69

Error experimental9707.78

Total15854

53575963

dji(4)NS(2)NS(4)NS

Por lo tanto, si comparamos medias adyacentes ordenadas, concluimos que no hay diferencia; pero el valor F revela que si existen. Si empleamos DMS para comparar todas las medias, llegamos a la conclusin de que el Estilbestrol mejoro la capacidad de aumento de peso tanto en ovejas hembras como en los machos. Las diferencias en la capacidad de aumento de peso asociadas con el sexo no son significativas.

53575963

6310*6*4NS0

596*2NS0

574NS0

530

Los tratamientos con letras iguales son estadsticamente no significativos (P