18
UNIVERSIDAD CENTRAL DEL ECUADOR Facultad De Ingeniería ciencias Físicas Y Matemática Carrera “Ingeniería Informática” Investigación Aplicada y diseño De experimentos Pruebas no-paramétricas Integrantes: Angel Calero Jorge Flores Lenin Villagrán

No Parametricas Final

Embed Size (px)

DESCRIPTION

experimentos

Citation preview

UNIVERSIDAD CENTRAL DEL ECUADORFacultad De Ingeniera ciencias Fsicas Y MatemticaCarrera Ingeniera Informtica

Investigacin Aplicada y diseo De experimentos

Pruebas no-paramtricas

Integrantes:Angel CaleroJorge FloresLenin Villagrn

Pruebas no-paramtricas

Laestadstica no paramtricaes una rama de laestadsticaque estudia las pruebas y modelos estadsticos cuya distribucin subyacente no se ajusta a los llamados criterios paramtricos. Su distribucin no puede ser definidaa priori, pues son los datos observados los que la determinan. La utilizacin de estos mtodos se hace recomendable cuando no se puede asumir que los datos se ajusten a una distribucin conocida, cuando el nivel demedidaempleado no sea, como mnimo, de intervalo.Una Muestra

Nominal

NombreDescripcinComando REjemplo

Prueba Chi-Cuadrado para una muestraAnalizar en el nmero de sujetos, objetos o respuestas que se clasifican en diferentes categoras. (Se clasifican segn las respuestas que de cada sujeto).Esta prueba nos indica si existe o no relacin entre las variables, pero no indica el grado o el tipo de relacin: es decir, no indica el porcentaje de influencia de una variable sobre la otra o la variable que causa la influencia.Chisq.test()

Anexo1:Ejemplo1

Ordinal

NombreDescripcinComando REjemplo

Prueba de Kolmogorov-Smirnov para una muestra

Esta prueba de bondad de ajuste contrasta si las observaciones podran razonablemente proceder de la distribucin especificada.

ks.test()

Anexo1:Ejemplo2

Dos muestrasRelacionadas

Nominal

NombreDescripcinComando REjemplo

Prueba de McNemar para cambios significantesLa prueba de McNemar se utiliza para decidir si puede o no aceptarse que determinado ''tratamiento'' induce un cambio en la respuesta dicotmica o dicotomizada de los elementos sometidos al mismo, y es aplicable a los diseos del tipo ''antes-despus'' en los que cada elemento acta como su propio control.

mcnemar.test()

Anexo1:Ejemplo3

Intervalo

NombreDescripcinComando REjemplo

Prueba de WalshUtilidad: estimar si el tamao de la diferencia entre pares de puntuaciones es significativa. Es til cuando se tienen menos de 15 puntuaciones. Con ms de 15 se puede aplicar una prueba t (paramtrica). Se usa si es posible presuponer que los puntajes diferentes de dos muestras relacionadas provienen de poblaciones simtricas. No se requiere sin embargo, que vengan de poblaciones normales ni de la misma poblacin.Anexo1:Ejemplo4

Independientes

Nominal

NombreDescripcinComando REjemplo

Test exacto de FisherEltest exacto de Fisheraunque se denomina test es ms bien un mtodo de clculo de las probabilidades de la2cuando el tamao maestral es pequeo. Hiptesis nula de que las variables no estn relacionadas.

fisher.test()

Anexo1:Ejemplo5

prueba chi-cuadrado para muestras independientesDeterminar la diferencia entre dos muestras. Es una prueba sensible a cualquier diferencia. Es til cuando se tienen bastantes puntuaciones y las observaciones estn representadas en una tabla 2 x n. Las puntuaciones son frecuencias en una tabla 2 x n (p. ej., 2x3)Chisq.test()

Anexo1:Ejemplo6

Ordinal

NombreDescripcinComando REjemplo

Prueba de la medianaMediante esta prueba se contrasta la hiptesis nula de que k muestras independientes de tamaos n1, n2 ... nk proceden de la misma poblacin o de poblaciones con medianas iguales. Para este contraste se requiere que la variable sea medible por lo menos en una escala ordinal y es particularmente til cuando por alguna razn (como, por ejemplo, por haberse establecido puntos de corte durante el proceso de obtencin de los datos) se sabe que las muestras no pueden contener observaciones extremas.

Anexo1:Ejemplo7

Prueba U de Mann-WhitneyLa hiptesis nula del contraste es que las dos muestras, de tamao n1 y n2, respectivamente, proceden de poblaciones continuas idnticas: . La hiptesis alternativa puede ser unilateral o bilateral y nicamente supone que la tendencia central de una poblacin difiere de la otra, pero no una diferencia de forma o de dispersin. Por esta razn esta prueba es el equivalente no paramtrico de la prueba t para la diferencia de dos medias cuando las muestras son independientes pero no puede suponerse la normalidad de las poblaciones de origen.

mcnemar.test()

Anexo1:Ejemplo8

Prueba de Kolmogorov-Smirnov para dos muestras

Esta prueba se utiliza para contrastar la hiptesis nula de que dos muestras independientes de tamaos n1 y n2 proceden de la misma poblacin. El contraste se basa en las diferencias entre las frecuencias relativas acumuladas hasta los mismos puntos de corte correspondientes a las dos muestras. Si H0 es cierta es de esperar que dichas diferencias sean pequeas. Cuando la hiptesis alternativa no es direccional el contraste es sensible a cualquier diferencia existente entre las dos poblaciones, no slo en cuanto a tendencia central, sino tambin en cuanto a forma, asimetra, etc.

Ks.test()

Anexo1:Ejemplo9

K muestrasRelacionadas

Nominal

NombreDescripcinComando REjemplo

Q de CochranCuando sobre n elementos se observa la serie de respuestas de cada uno de ellos a k ''tratamientos'' esta prueba permite contrastar la hiptesis nula de que no existe diferencia significativa entre los k ''tratamientos''. Tambin es posible utilizarla si cada tratamiento se aplica a uno de los elementos de n grupos de k elementos elegidos de forma que los elementos de cada grupo se asemejen lo ms posible entre ellos.

cochran.qtest()

Anexo1:Ejemplo10

Ordinal

NombreDescripcinComando REjemplo

Anlisis de varianza de Friedman de dos vasLaprueba de Friedman(tambin conocida comoANOVA de Friedman) es la alternativa no paramtrica al modelo ANOVA de un va con medidas repetidas para comparar ms de dos grupos dependientes. Igual que en la prueba de Kruskal-Wallis para saber qu grupos difieren (en el caso de resultados significativos del test) tambin se utilizan pruebas post-hoc.

friedman.test()

Anexo1:Ejemplo11

Independientes

Nominal

NombreDescripcinComando REjemplo

Chi-cuadrado para k muestras independientesLaprueba2(pronunciadaji-cuadradoy a veces comochi-cuadrado) nos permite contrastar si existe relacin entre dos variables categricas mediante la tabla de contingencia cuando tenemos datos no pareados.

chisq.test()

Anexo1:Ejemplo12

Ordinal

NombreDescripcinComando REjemplo

Anlisis de varianza de una va de Kruskal-WallisEste contraste permite decidir si puede aceptarse la hiptesis de que k muestras independientes proceden de la misma poblacin o de poblaciones idnticas con la misma mediana. El nico supuesto necesario es que las distribuciones subyacentes de las variables sean continuas y que stas hayan sido medidas por lo menos en una escala ordinal.

kruskal.test()

Anexo1:Ejemplo13

Correlacin no paramtrica

Ordinal

NombreDescripcinComando REjemplo

Correlacin de rangos de Spearman

El coeficiente de correlacin de Spearman permite identificar si dos variables se relacionan en una funcin montona (es decir, cuando un nmero aumenta, el otro tambin o viceversa).

cor()

Anexo1:Ejemplo14

Anexo 1: Ejemplos:Ejemplo 1:Suponemos que los compradores en los shoppings pertenecen a las clases altas de la sociedad. Para eso tomamos una muestra de 50 casos, de manera aleatoria, a quienes indagamos sobre su pertenencia social (para ello debemos tener un instrumento que nos permita inferir a qu clase social pertenecen). Los resultados nos arrojan lo siguiente:ClaseBajaMedia-BajaMediaMedia-AltaAlta

Fo89101112

http://www.geocities.ws/nievas_ies/psicoestadistica2/chi_cuadrado.pdf

Ejemplo 2:El entrenador de salto de ungrupode atletas, desea conocer con vistas al procesamiento de los datos por el obtenidos sobre salto de una muestra aleatoria de atletas de esa especialidad en un CVD, si las mediciones realizadas por l estn distribuidas normalmente. Los datos son los siguientes:

Salto Largo1 1.60

2 1.65

3 1 .55

4 1.62

5 1.64

6 1.70

7 1.71

8 1.68

9 1.66

10 1.67

11 1.65

12 1.68

13 1.69

14 1.70

Ho: Los datos estn distribuidos normalmenteH1: Los datos no estn distribuidos normalmente.http://www.monografias.com/trabajos11/docima/docima.shtml#DOSEjemplo 3:Un investigador en medicina preventiva observa que los empleados en una fbrica padecen frecuentemente un cuadro diarreico, motivo de gran ausencia. Todos los empleados comen en el comedor de la fbrica como goce de una prestacin laboral. El investigador supone que el comn denominador de la causa de la diarrea es el sitio de ingestin de alimentos, es decir, existe una higiene inadecuada en la preparacin de la comida; sin embargo, la higiene personal de los empleados no es suficiente para atribuir toda la culpa al personal de la cocina. Por lo tanto, elige una muestra al azar de 50 individuos, de los cuales resulta que 34 de ellos presentan un cuadro diarreico frecuente y 16 no lo padecen. As, sugiere que, bajo vigilancia, se apliquen medidas de higiene personal, consistentes en exhaustivo lavado de manos antes de ingerir alimentos, en un perodo de dos semanas.Al finalizar el tratamiento, obtiene los resultados siguientes: de los 34 sujetos con un cuadro diarreico frecuente, despus del tratamiento de lavado de manos, 16 lograron hacer desaparecer el proceso intestinal y 18 persistieron con evacuaciones diarreicas; a su vez, el grupo de 16 personas asintomticas, cuatro de ellas presentaron diarrea a pesar del lavado de manos y 12 se mantuvieron en las mismas condiciones.Eleccin de la prueba estadstica. El modelo experimental tiene dos muestras dependientesPlanteamiento de la hiptesis. Hiptesis alterna (Ha). El lavado de manos, como medida preventiva y factor de higiene personal, presenta cambios significativos de enfermedad diarreica en los empleados que asisten al comedor de la fbrica en estudio. Hiptesis nula (Ho). Las diferencias que se observan en las frecuencias de cambio por el lavado de manos se deben al azar.Nivel de significacin.Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho.Zona de rechazo.Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.Resultado de la contingencia 2 X 2.

Ejemplo 4:Estimar si el tamao de la diferencia entre pares de puntuaciones es significativa. Es til cuando se tienen menos de 15 puntuaciones. Con ms de 15 se puede aplicar una prueba t (paramtrica)Ejemplo 5:Consideramos un ejemplo clasico de Fisher. Un colega suyo armaba que era capaz de distinguir en una taza de te con leche, que se habia echado primero, si la leche o el te. Para comprobarlo diseo un experimento donde se probaban 8 tazas de te. De ellas, en 4 se habia echado primero la leche, y en las otras 4, primero el te. Se trataba de adivinar en que orden se habia echado la leche y el te. Las tazas se resentaron de manera aleatoria, y se obtuvo:

Prediccin

Primer ServicioLecheTeTotal

Leche314

te134

Total44

Ejemplo 6:Suponemos que la ideologa poltica influye en la eleccin de los medios de prensa que se leen. En razn de ello, suponemos que la gente de derecha escoge La Prensa, que los de centro derecha leen La Nacin, lo de centro leen Clarn, los de centro izquierda leen Pgina/12 y los de izquierda Le Monde Diplomatique. Para ello construimos un instrumento que nos permite establecer la ideologa, y tomamos una muestra al azar, obteniendo el siguiente resultado.

http://www.geocities.ws/nievas_ies/psicoestadistica2/chi_cuadrado.pdf

Ejemplo 8:La Tabla muestra el nmero de horas semanales que los estudiantes afirman que dedican a estudiar las asignaturas de introduccin a la economa financiera y a la contabilidad. Los datos proceden de muestras aleatorias de 10 estudiantes de economa financiera y 12 de contabilidad. Indican los datos la existencia de una diferencia en el numero mediano de horas semanales que dedican los estudiantes a estudiar las asignaturas de introduccin a la economa financiera y a la contabilidad?Economa financiera1068101213119511

Contabilidad13171412109151611897

Solucin: Nuestra hiptesis nula es que las posiciones centrales (medianas) de las dos distribuciones poblacionales son idnticas. Ho: Mediana (1) = Mediana (2) Los estudiantes dedican la misma cantidad de tiempo a estudiar las asignaturas de economa financiera y de contabilidad.Ejemplo 9:Supongamos que disponemos de dos muestras, ambas sobre el intervalo [0,1]:

Muestra 1:Muestra 2:

0,650,15

0,310,94

0,420,81

0,810,72

0,120,21

0,910,35

0,720,18

0,410,74

0,940,73

0,610,62

0,520,85

0,210,91

0,160,18

0,740,23

0,650,65

0,83

0,44

0,42

0,56

0,73

a partir de las cuales obtenemos las siguientes distribuciones empricas sobre intervalos de longitud 0,20:

La mxima diferencia entre ambas funciones de distribucin se produce en el segundo intervalo, y es de: 0, 20 - 0,40 = -0,20. El valor crtico de las tablas del estadstico de Kolmogorov-Smirnov para estos tamaos mustrales es de 13/30 = 0,433, por lo que no rechazamos la hiptesis nula de igualdad de distribuciones de probabilidad.

https://www.ucm.es/data/cont/docs/518-2013-11-13-noparam.pdf

Ejemplo 10:Imaginemos que deseamos averiguar si 4 preguntas de una prueba de rendimiento poseen o no la misma dificultad.para ello, hacemos que una muestra aleatoria de 10 sujetos responda a las 4 preguntas y registramos las respuestas dadas. 1= ACIERTO,2=ERROR.Resultados obtenidosSujetosPregunta 1Pregunta 2Pregunta 3Pregunta 4

101.110000001.0010001.01100001.0000000

Si consideramos la proporcin de aciertos de cada pregunta como un iondicador de su grado de dificultad, podemos afirmar q las preguntas difieren en dificultad, puesto que los diez sujetos responden las 4 preguntas.1) Seleccionar las variables correspondientes a la pregunta 1,2,3,4 y trasladarles a la lista de variables.

Tabla de frecuencias.

Prueba de cochran

N= Numero de casos validosQ de Cochran= El estadstico de CochranGl= Grados de libertad Sig.asintot= Su nivel critico asinttico. Puesto que el nivel critico(0.09) es menor que (0.05)

http://pendientedemigracion.ucm.es/info/socivmyt/paginas/D_departamento/materiales/analisis_datosyMultivariable/19nparam_SPSS.pdf

Ejemplo 11:Un psiclogo est interesado en comprobar si las puntuaciones en una prueba de razonamientoabstracto se modifican o se mantienen constantes entre los 7, 8 y 9 aos de edad. Con este fin,selecciona una muestra aleatoria de 10 nios y mide su razonamiento abstracto cuando tienen7 aos y vuelve a realizar el registro con estos nios cuando tienen 8 y 9 aos. Las puntuaciones obtenidas han sido las siguientes:

De acuerdo con estos datos, qu se puede concluir a un nivel de significacin del 0,05?http://www4.ujaen.es/~arortega/descargar/noparametricasSalumnos.pdf

Ejemplo 12:En un estudio para determinar la preferencia por determinados sabores de helados en diferentes regiones del pas, se recopilaron los siguientes datos.

Determine si la preferencia por cierto sabor es independiente de la regin (es la misma en cada regin), utilizando el nivel de significacin 0,05.http://www.monografias.com/trabajos97/prueba-hipotesis-chi-cuadrado-empleando-excel-y-winstats/prueba-hipotesis-chi-cuadrado-empleando-excel-y-winstats.shtmlEjemplo 13

Se tienen los siguientes datos experimentales, correspondientes a 22 individuos de los que se ha recogido informacin de dos variables: una variable explicativa Exp nominal y otra variable respuesta Rta cuantitativa. Los datos se presentan de forma que en las filas hay varios individuos para facilitar la lectura:

Calcular la prueba de Kruskal-Wallis de comparacin de medianas para los datos anteriores.http://www.uclm.es/profesorado/mdsalvador/58109/teoria/anova_un_factor-lectura.pdfEjemplo 14Un estudio de mercadeo televisivo se program la realizacin de un determinado nmero de repeticiones de un spot referido al consumo y las bondades de un tipo de bebida energizante. Luego de este perodo de 30 das, se les pregunt a un grupo de televidentes que dijeran cuntas veces vieron el spot y cuntas bebidas de ese tipo haban consumido. Los datos de la misma se encuentran en la hoja CxRSpearman01 del archivo Estad. No paramtrica. A un nivel de significacin del 5% se puede afirmar que el spot televisivo no influy en el consumo de la bebida?NFrec SpotNro bebidas

1412

2914

337

406

513

665

726

8510

http://www.aulaclic.es/estadistica-excel/t_9_11.htm