Cartas Control

Embed Size (px)

Citation preview

Estadstica No Paramtrica. Manuel Pontigo Alvarado. ISBN [email protected] 3-1. Sobre la mediana y el rango.Control de la calidad y el proceso.Prueba de la CorridaIntervalo de confianza.Pruebas de Bondad de Ajuste y G2. Prueba de Kolmogorov-Smirnov Comparacin de dos grupos: Prueba del signo Prueba del Rango con Signo o Prueba de Wilcoxon. Activar el Libro ExcelIntroduccin2Muchos veces, las distribuciones de datos en experimentosplanificados, en estudios de exploracin mediantemuestreos y otros tipos de datos no presentan unadistribucin que pueda aproximarse mediantedistribuciones de densidad como son La Normal, LaNormal Estndar y sus distribuciones asociadas; LaBinomial, LaPoissonysusdistribucionesasociadas. Enestos casos, HACER INFERENCIAS MEDIANTEDISTRIBUCIONES TPICAS ES POCO CONFIABLE.La salida para el experimentador es utilizar laDISTRIBUCINLIBRE.Las Diferencias.3En los captulos anteriores se habl de la media, la varianza yla desviacin estndar para efectuar los reconocimientos,exploracionesyrecomendacionesbasndoseendistribucionesde densidad como la normal y la binomial.En la estadstica no paramtrica el parmetro deposicionamientohaciael centrodeladistribucindemayorutilidad es la Mediana y como medida de dispersin el Rango oalguna variante de ste.Unacaractersticaimportanteesqueladistribucin dedatosdebecorresponderseconel OrdenEstadstico. Estoes, conelnmero que tiene una variable en un conjunto de datosordenados ascendentemente.La Mediana y El Rango4La Mediana es una medida de posicionamiento central que parte ladistribucin ordenada de los datos en dos subconjuntos que tienen la mismacantidad de observaciones (Recordar que la media parte la distribucin endos partes con la misma probabilidad). Se ubica en la posicin:1 2 si ;~1 ! !

k n x xkSi el nmero de observaciones es impar. Yk nx xxk k2 si ;2~ 1!

!

Si el nmero de observaciones es par.El rango es la amplitud o recorrido de los datos. Se obtiene mediante:Nnimo Mximo r!Una Distribucin Bsica.5En la estadstica no paramtrica tambin llamada deDISTRIBUCIN LIBRE, la distribucin ordenada de los datoses fundamental. Si xi es l i-sima observacin de la variable X,la distribucin de estas debe considerarse que el Mnimo = x1, elSiguiente ms pequeocomox2, as sucesivamente hastaelvalor ms alto que se corresponde como Mximo = xn.Esto implica que los datos se consideren asociados a losestadsticos de orden.Ladistribucinde densidadoprobabilidadespecficaparacadaconjuntode datos se obtiene dividiendocadanmeroordinal entre n:nix pi= ) (Ejemplo 3.1.6Una empresa que quiere introducir cojinetes de bolas al pas ofreceprecios mucho ms econmicos. Para convencer a los posiblesrepresentantes nacionales ofreci conferencias sobre la empresa.Siendo los cojinetes de bolas (baleros o roles) artculos de altaprecisin, los fabricantes hacan hincapi en los estrictsimosprocesos del control de la calidad.Entre estos se extrajeron los parmetros de control para generar unconjunto de datos relacionados con el control de la medida interiorde un cojinete especfico. La medida original era en pulgadas.El primer paso en cualquier anlisisdedatos formal es asegurarseque la distribucin de aproximacin se ajusta a la distribucin de losdatos. Para esto, se usa generalmente la tabla de frecuencias y unaprueba de Bondad de Ajuste.Intervalo de Clases 7En el control de la calidad y los procesos y en general en los estudios estadsticos,para tomar decisiones es insoslayable conocer la distribucin de los datos.Para elaborar la tabla de frecuencias debe determinarse la cantidad de clases en lasque se van a asignar los datos por su valor. Para esto, se recomienda que el Intervalode Clase est entre y veces la desviacinestndar.0,000940037 , 0 0,0018;20,00372! ! ! ! ! "ICSICDividiendoel rangoporlos IC, seobtieneunestimadodelnmero de clases.6 10009 , 00148 , 0 8;0,00180,0148! "! ! !"! NCICrNCUsandounIC=0,0012se obtendrnaproximadamente 13clases.Los Lmites de clases.8Es conveniente que la primera y ltima clase estn vacas. Parael lmite inferior de la primera clase use:0,6051 0001 , 0 0012 , 0 0,6064 0001 , 01= = = I Min LIPara obtener el punto medio agregue la Lmite Inferior de laClase la mitad del intervalo de clase:0,605720012 , 06051 , 021 1= + = + =ILI xEl Lmitesuperiordelaclaseseconsiguesumandoel ICallmite inferior de la clase.0,6063 0012 , 60510 , 01 1! !! IC LIC LSCSume a cada cantidad anterior el IC para conseguir los lmitesde clase hasta que el mximo la incluyaEl Cuadro de Frecuencias.9El dimetro de los roles es una variable continua, por tanto ellmite inferior de una clase tendr el mismo valor que el lmitesuperior delaprecedente. Dadoqueel conteolo efectuarlaHEconbaseal lmitesuperiordelas clasesnoes necesariohacer distincin.Para el conteo de la primera clase se usa la siguienteinstruccin:Para el conteo de la segunda clase y subsiguientes:0 ) 0,6063" C629;"+";"-"));La prueba del signo: resultados y conclusin.443.- El nmero n ser el nmero de parejas no rechazadas: 37se signos + y 11 de signos -, por tanto n = 48;4.-Dentese con la letra r, el nmero de veces que se presentel signo menos frecuente. Este es r = 11;5.-Regladedecisin:si el valorobservadodercesigual omenor al valor tabulado para el nivel se significacin elegido,la hiptesis se rechaza. En este caso rc = 11 es menor que rt(0,5)=16, por tanto, la hiptesis deber rechazarse.CONCLUSIN:La Salsa A fue calificada superior a la Salsa B consignificacin del 5%.La Prueba del Signo, material para una prueba de G2.45El estudiantesehabrpercatadoquelapruebadel signoproporcionamaterial para elaborar una prueba de G2.Considerando la hiptesis Ho; PA = PB= 0,5 se espera que la mitad deindividuos elijanlaSalsaAylaotramitadlaSalsaB, portantolafrecuencia esperada ser:242482= = =nfeLas frecuencias observadas son fo1 = 37 y fo2 = 11. Por tanto la pruebaser: ) ) )13,0208481 , 0 24 37245 , 0 24 11245 , 0 24 372 2 221 2= = + =

Que define una probabilidad de:De que las Salsa A y B se elijan por igual. O sea Ho; PA = PB = 0,5 serechaza. ? A ) )0003 , 0 0208 , 30208 , 300208 , 3211 2210 1 - 2 ; 0208 , 13! !

G d e Y FPrueba de Wincoxon o del Rango con Signo.46La prueba del signo, aun acompaada de la prueba deG2noes la mejor alternativa para comparar dos poblaciones,mxime si la distribucin de los datos es binomial,distribucin que requiere muestras grandes.Laalternativaparadistribuciones libres es lapruebadelRango con Signo, desarrollada por Wilcoxon, la pruebaconsisteenordenarel conjuntodedatosporsudiferenciaabsoluta yasignar al rango pesado el signo de la diferenciarelativa. Estapruebaconsideraadems, lamagnituddeladiferencia, entre mayor sea, mayor ser el orden estadsticoque entra en comparacin.Estapruebapuedeconsiderarsecomomuyeficiente, sobretodo en poblaciones con distribucin discreta o inespecficas.Prueba de Wilcoxon: preparacin en la HE..47Los pasos para desarrollar la prueba del signo son:1.- Examine cada una de las parejas( xi, yi);2.- Calculeladiferenciarelativadi=xiyisobrelacolumna4(ColumnaD de la HE);3.-CalculeladiferenciaabsolutaDi=| xiyi | =ABS(B709-C709)sobre la columna 5 (Columna E de la HE);4.- Clasifique ascendentemente con base en la diferencia absolutaDi;5.- Agregue enla columna 6 (Columna Fde la HE) el ordenestadstico para los rangos absolutos, esto es 1,2,..,n;6.-Sobrelacolumna7(ColumnaGdelaHE)calculelosrdenespesados. Esto es; el promedio del orden estadstico para los rangosabsolutos del mismo valor;Prueba de Wilcoxon: orden ponderado.48Por ejemplo, con D = 0 hay m = 12 diferencias y el orden ponderado es:5 , 61212 11 10 9 8 7 6 5 4 3 2 1) 1 (=+ + + + + + + + + + += = {=mnPk nknk iii7.- En la columna 8 (H de la HE) ubicar los rangos ponderados para lasdiferencias relativas positivas;8.- En las columna 9 (I de la HE) ubicar los rangos ponderados con elsigno menos de las diferencias relativas;9.- Ignore las diferencias absolutas o asigne 0 a cualquiera de lascolumnas;10.- Al calce del cuadro, Sume las columnas 8 y 9 en la misma posicin;11.- El valor absoluto menor de ambas sumas se designar como indicadorTc = |-331| = 331.Prueba de Wilcoxo: valoracin.4912.- Compareel valor Tcconel criteriodelaTabladelaPrueba de Rangos con Signo de Wilcoxon. Como n >25, elvalor Ttse distribuye aproximadamente como NormalEstndar con media: ) )91541 60 6041 =+=+=n nY la varianza;El estadstico z: ) ) ) )18.452,50241 60 2 1 60 60241 2 12=+ - +=+ +=n n n-4,299250 , 452 . 18915 331 -) (T!

!

!T tcT abszPrueba de Wilcoxon: conclusin.5013. La probabilidad que determina el valor de calculada es: )

! !2992 , 42992 , 4210,000009 21) (2dz e z PcEvidentemente, se debe rechazar la hiptesis nula Ho; PA= PB = 0,5. O la probabilidad de que los catadores hayanelegido por igual a la Salsa A y a la Salsa B esprcticamente 0.Si se observan las probabilidades de las las tres pruebasquesehanrealizadoparacomparardos poblaciones,esta es la que proporciona la probabilidad para la zonade rechazoms significante.Prueba de Wilcoxon: Recomendacin.51Adems se tiene la ventaja de considerar el signo de lacomparacin.Esto implica, en experimentos en los que participa el humano quetiende a responder tanto por la estimulacin de los sentidos comoporlaexperiencia, puesademsdeladiferenciadeeleccin, seconsidera la posicin.Por ejemplo, unapersonapuedeestaracostumbradaacalificaralto, si le pone un diez a la salsa A y un nueve a la B la diferenciaser +1. Si otra persona muy exigente califica bajo y a la salsa A leda 1 y a la salsa B le da 0, la diferencia ser de +1. Situacionescomo estas no son consideradas en otras pruebas cuyo punto deapoyo es el promedio entrando a engrosar el error experimental.Por esto, en ciertas condiciones la prueba del Rango con Signo esmuy eficiente.Resumen.52Como se ha visto, la Estadstica no Paramtrica es unaalternativa de anlisis de datos y no una salida parasituaciones anormales de las poblaciones.En algunos casos, el uso de Estadsticas no Paramtricas esventajoso al anlisis de datos mediante las tcnicastradicionales anlisis mediante Estadsticas Paramtricas.Por estas razones, es preferible que se entienda el mtodocomo Estadsticas de Distribucin Libre en las cuales ladistribucin de orden estadstico asociado a la magnitud delos datos proporcionan las bases para el desarrollo de estaimportante y poco utilizada parte del anlisis estadstico delas poblaciones.Manuel Pontigo A. 2005, [email protected]