Estadistica Analitica Gui 2011

Embed Size (px)

Citation preview

  • 8/7/2019 Estadistica Analitica Gui 2011

    1/100

  • 8/7/2019 Estadistica Analitica Gui 2011

    2/100

    Facultad de Ciencias

    Veterinarias

    U.B.A.

    rea Bioestadstica 2011 1er. Cuatrimestre

    Estadstica Analtica

    Gua de Trabajos Prcticos Gua de Trabajos Prcticos Gua de Trabajos Prcticos Gua de Trabajos Prcticos

  • 8/7/2019 Estadistica Analitica Gui 2011

    3/100

    II

    Cronograma 2011Se lunes1 Mir 9/3 Jue: Revisin de conceptos relativos a inferencia. Intervalos de confian-

    za y pruebas de hiptesis para la media de las diferencias y para la di-

    ferencia de medias de dos poblaciones.2 14/3 Mar: Revisin de conceptos relativos a inferencia. Intervalos de confian-

    za y pruebas de hiptesis para la media de las diferencias y para la di-ferencia de medias de dos poblaciones. Jue: Intervalos de confianza ypruebas de hiptesis para la diferencia de proporciones de dos pobla-ciones y para el cociente de varianzas de dos poblaciones.

    3 21/3FeriadoJue 24

    Mar: Intervalos de confianza y pruebas de hiptesis para la diferencia deproporciones de dos poblaciones y para el cociente de varianzas de dospoblaciones.

    4 28/3FeriadoSb 2/4

    Prueba de hiptesis y estimacin para dos poblaciones (integracin)Diseo de experimentos Anlisis de Varianza -

    5 4/4 Diseo Completamente Aleatorizado. Modelo paramtrico.

    6 11/4 Diseo Completamente Aleatorizado no paramtrico. Ejercitacin

    7 18/4F SSan-

    ta21 22 23

    Mar : ejercitacin y consulta.En esta clase no se controlara la asistencia.

    8 25/4 Integracin ( sbado 30-4-11 parcial )

    9 2/5 Estadstico de Chi cuadrado para pruebas de bondad de ajuste. Pruebasde Pruebas de Independencia.10 9/5 Estadstico de Chi cuadrado para Pruebas de Homogeneidad

    Ejercitacin.

    11 16/5 Regresin Lineal Simple. Supuestos del Modelo y Estimadores. Dcimade hiptesis utilizando la t de Student

    12 23/5FeriadoMi 25/5

    Regresin Lineal Simple. Intervalos de confianza y prediccin. Coefi-ciente de Determinacin- ANOVA en la regresin.

    13 30/5 Ejercitacin. Regresin Lineal Mltiple.14 6/6 Correlacin Simple Paramtrica y no paramtrica

    15 13/6 Integracin. Revisin y consultas. ( sbado 18-6-11 parcial )

    16 20/6FeriadoLu 20/6

    17 27/6 Recuperatorio martes 28/6 a las 18 hs

  • 8/7/2019 Estadistica Analitica Gui 2011

    4/100

    III

    NOTA IMPORTANTE:

    La ctedra publica solamente laGUIA DE TRABAJOS PRACTICOS

    y la GUIA DE FORMULAS Y TABLAS para la cursada de esta materia.

    Cualquier otra publicacin NO CUENTACON LA APROBACION DE LA CATEDRA.

    Bibliografa

    Cantatore de Frank, Norma M.: Manual de Estadstica Aplicada. Ed.

    Hemisferio Sur. 1ra. Edicin. Buenos Aires. Captulos: 4, 5, 6, 7, 8, 12 y13.

    Cappelletti, Carlos A.: Elementos de estadstica. Cesarini Hnos. Editores.2da. Edicin. Bs. As. Captulos 8, 9, 10, 11, 13 y 14.

    Daniel, Wayne W.: Bioestadstica. Base para el anlisis de las ciencias dela salud. 3ra. Edicin. Uteha, Noriega Editores. Mxico. Captulos: 5, 6, 8,y 10.

  • 8/7/2019 Estadistica Analitica Gui 2011

    5/100

    IV

    Sistema de Evaluacin de Elementos de Estadstica

    Se tomarn dos parciales, que sern calificados en una escala de 0 a 10, enforma global.

    La condicin de LIBRE se obtiene si en ambos parciales la calificacin obteni-da es inferior a 4 (cuatro), o cuando no se cumpla el requisito del 75% deconcurrencia a las clases terico-prcticas.

    La condicin de ASISTENCIA CUMPLIDA se obtiene al cumplir el requisito depresentismo, correspondiente al 75% de concurrencia a las clases terico-prcticas, o sea, como mximo 4 ausentes; y obtener como calificacin:

    en ambos parciales, mayor o igual a 4 (cuatro) y menor de 6(seis) en un parcial, mayor o igual a 4 (cuatro) y menor de 6 (seis); y en el

    otro, menos de 4 (cuatro).No se recuperarn parciales para quedar en condicin de ASISTENCIA CUM-PLIDA.

    La condicin de REGULAR se obtiene al cumplir el requisito de presentismo,correspondiente al 75% de concurrencia a las clases terico-prcticas, o sea,como mximo 4 ausentes; y obtener como calificacin:

    en ambos parciales, 6(seis), sin uso del examen recuperatorio. en un parcial 6 (seis) y en el otro, nota 7 (siete), sin uso del examen

    recuperatorio. en un parcial, inferior a 6 (seis); y en el otro, 6 (seis) o ms. En este

    caso, deber recuperar el parcial correspondiente a una calificacin inferior a 6(seis) y aprobarlo. La nota de aprobacin del recuperatorio es 6 (seis).

    La condicin de PROMOCIN se obtiene al cumplir el requisito de presentis-mo, correspondiente al 80% de concurrencia a las clases terico-prcticas, osea, como mximo 3 ausentes; y obtener como calificacin:

    de al menos 7(siete) en ambos parciales, de tal forma que la suma deambos puntajes sea mayor o igual a 14.

    en un parcial, de al menos 7 (siete), y en el otro, un puntaje desde 4(cuatro) hasta menos de 6 (seis); pero que la suma de ambos sea de al me-nos 14 puntos. En este caso, se tomar un coloquio oral de los contenidos queinvolucra el parcial de menor puntaje para definir su situacin, dependiendosta de la aprobacin del mismo.

  • 8/7/2019 Estadistica Analitica Gui 2011

    6/100

    Estadst ica Anal t i ca 2010 Fac. Cs. Veterinarias (U.B.A)

    1

    Unidad 1: INFERENCIA para DOS POBLACIONES

    Objetivos especficos:

    Comprender la importancia de disear experimentos. Analizar la adecuacin de cada diseo en funcin del contexto de la investigacin.

    Aplicar los conceptos de inferencia estadstica a la comparacin de dos poblaciones, utilizando comoprocedimientos la estimacin y la prueba de hiptesis. Seleccionar el procedimiento de inferencia adecuado en funcin del objetivo y del cumplimiento de los

    supuestos. Resolver problemas e interpretar conclusiones aplicando los mtodos de anlisis sobre dos

    poblaciones.

    Contenidos temticos: Diseo de experimentos: necesidad, ventajas, propsitos, definiciones previas. Tipos de diseos y

    alcances.Revisin de conceptos relativos a la estimacin puntual y por intervalos. Intervalos de confianza

    para la diferencia de medias y para la media de las diferencias. Estimaciones para la diferencia de dosproporciones, para el cociente de varianzas, y para el cociente de desvos estndar.

    Revisin de conceptos relacionados con las pruebas de hiptesis. Prueba de hiptesis para:diferencia de medias en base a dos muestras independientes: diferencia de medias, cociente devarianzas, diferencias de proporciones. Muestras apareadas: media de las diferencias.

    Relacin entre intervalo de confianza y prueba de hiptesis bilateral. Aplicaciones.

    Glosario:Diseo de experimentos : experimento, unidad experimental, tratamiento, factor, niveles de un factor,observacin, efecto. Repeticin, aleatorizacin, control local. Estudios observacionales, pre-experimentales, cuasiexperimentales y experimentales.Inferencia para dos poblaciones : Poblacin, muestra. Parmetro. Estimador. Estimacin. Estimadorpuntual. Intervalo. Intervalo de confianza. Nivel de confianza. Hiptesis de trabajo. Hiptesis estadstica.Hiptesis nula y alternativa. Error tipo I y tipo II. Nivel de significacin. Regin crtica. Regla de decisin.

    Distribucin F de Snedecor. Diferencia de medias y de proporciones, cociente de varianzas para muestrasindependientes. Muestras apareadas: media de las diferencias.

    El diseo de experimentosLa ciencia, tiene como objetivo la explicacin y la prediccin de los hechos. Un requisito fundamental entoda ciencia fctica es el contraste de las hiptesis planteadas, poniendo a prueba las mismas medianteuna confrontacin con la experiencia.El diseo experimental crea las condiciones para el contraste de la hiptesis y brinda la metodologa esta-dstica correspondiente para el anlisis de los datos.Es el proceso de planear un experimento para obtener datos apropiados que puedan ser analizadosmediante mtodos estadsticos, con objeto de producir conclusiones vlidas y objetivas. La metodolo-ga estadstica es el nico enfoque objetivo para analizar un problema que involucre datos sujetos a

    errores experimentales. As es que hay dos aspectos en cualquier problema experimental: el diseo delexperimento y el anlisis estadstico de los datos.

    El propsito del diseo experimental es proporcionar la mxima cantidad de informacin pertinente alproblema bajo investigacin. Sin embargo tambin es importante que el diseo o plan sea tan simplecomo sea posible, a fin de ahorrar tiempo, dinero, personal y material experimental.Para que la metodologa de diseo de experimentos sea eficaz es fundamental que el diseo sea el ade-cuado. Un experimento puede realizarse por alguno de los siguientes motivos:

    Determinar los factores principales que influyen sobre la variable respuesta.Encontrar las condiciones experimentales con las que se consigue un valor extremo en la variable

    de inters o respuesta.Comparar las respuestas en diferentes niveles de observacin de variables controladas.Obtener un modelo estadstico-matemtico que permita hacer predicciones de respuestas futuras.

  • 8/7/2019 Estadistica Analitica Gui 2011

    7/100

    Estadst ica Anal t i ca 2010 Fac. Cs. Veterinarias (U.B.A)

    2

    Para poder realizar un buen diseo experimental, es necesario previamente comprender el problemaque se desea estudiar, plantendose un conjunto de preguntas clsicas:

    1- Cules son las caractersticas que se van a analizar?2- Qu variables afectan a las caractersticas que se van a analizar?3- Cuntas veces debera repetirse el experimento?4- A partir de qu valor se considerar que existe un efecto?

    Lo cual conduce a elegir las variables ms apropiadas y sus niveles de medicin, elegir la o las res-puestas a evaluar y el modelo de diseo.

    Para poder responder las preguntas anteriores es necesario que definamos claramente algunos trmi-nos fundamentales:

    Experimento : es un ensayo o una observacin especial realizada para confirmar o descartar unahiptesis especialmente bajo condiciones establecidas por el experimentador.

    Variable de inters o respuesta : es la variable que se desea estudiar. Unidad experimental : es la parte ms pequea de material experimental, entidad fsica o sujeto,

    en la que se aplica un tratamiento una sola vez. Tambin puede entenderse como cada una de lasreproducciones del experimento.

    Tamao del Experimento : es el nmero total de observaciones recogidas en la ejecucin del ex-perimento. Ejemplo: si se asignan 10 gallinas a cada una de tres dietas el tamao del experimento es30.

    Factor : es una variable que se sospecha que puede ejercer influencia sobre la variable respuestade inters.

    Factor controlado : se denomina as a una variable manipulada por el investigador o variable in-dependiente, a fin de estudiar su influencia sobre la variable de inters o dependiente. Algunos autoresla denominan variable de entrada al proceso. Ejemplo: si pensamos que la temperatura o la humedadpueden afectar a la conservacin de cierta propiedad de un alimento o medicamento, se puede contro-lar manteniendo dicho producto con tres valores distintos de temperatura.

    Niveles del factor : son cada una de las categoras, o valores, o formas especficas que adopta lavariable independiente o controlada. Ejemplo: en el caso de las tres dietas, el factor dieta tiene tres

    niveles; en el caso del rodeo, el factor tiene dos niveles. Tipos de factores : existen factores cuantitativos, cuyos niveles son cantidades numricas, y cuali-tativas, cuyos niveles son procedimientos o cualidades. Ejemplo de factor cuantitativo puede ser lacantidad de fertilizante adicionado a las parcelas de cultivo por hectrea con niveles: 10kg/ha 20kg/ha -30 kg/ha de fertilizante. Ejemplo de factor cualitativo puede ser el tipo de nutriente adicionado auna dieta con niveles: potasio, magnesio y calcio.

    Tratamiento : conjunto de condiciones experimentales o procedimientos creados para el experi-mento en funcin de la hiptesis de investigacin a las que se someter a las unidades experimentalesen un diseo elegido. Es una combinacin especfica de los niveles de los factores de estudio en undiseo con varios factores, y son los distintos niveles del factor en el caso de un diseo unifactorial. Porejemplo: si se asignan tres dietas distintas a las gallinas de un criadero, cada una de las dietas es untratamiento. Si en un tambo se combinan tres raciones de alimentacin dos rodeos con vacas en orde-

    e (uno con vacas de alta produccin y el otro con las de baja produccin). Cada combinacin de ro-deo y racin constituye un tratamiento (6 tratamientos). Observacin : valor que asume una variable, tambin denominada variable respuesta, en una de-

    terminada realizacin del experimento, es decir cada registro realizado en el contexto del experimentode la variable respuesta.

    Efecto : diferencia entre los valores medios de la variable respuesta en presencia y ausencia de unnivel del factor. Si la variable respuesta de inters es el engorde semanal medido en gramos de unagallina con cierta dieta enriquecida, el efecto es la diferencia entre el engorde medio con la dieta enri-quecida y el engorde medio con la dieta tradicional, ambos medidos en gramos.

    Diseo equilibrado o balanceado : es el diseo en el que todos los tratamientos son asignados aun nmero igual de unidades experimentales, en el cual se obtiene la misma cantidad de repeticionespor tratamiento. Por ejemplo hay cuatro vacas en cada combinacin de rodeo y nutriente para el agua.

    Principios Bsicos del diseo experimentalLos tres principios bsicos que caracterizan a un diseo experimental:

  • 8/7/2019 Estadistica Analitica Gui 2011

    8/100

    Estadst ica Anal t i ca 2010 Fac. Cs. Veterinarias (U.B.A)

    3

    Repeticin: cuando un tratamiento es aplicado a ms de una unidad experimental. Las observacio-nes repetidas con las mismas condiciones experimentales en el contexto de un experimento no coinci-den necesariamente, y por lo tanto una de las cuestiones fundamentales a la hora de disear un expe-rimento es la seleccin del tamao de muestra o nmero de repeticiones adecuado en cada contexto.

    Las razones por las cuales es deseable realizarrepeticiones del experimento son:a- Proporcionar una estimacin del error experimental (error generado por causas no controladas porel experimentador), que acta como unidad bsica de medida para indicar el significado de las di-ferencias.

    b- Obtener mayor precisin en la estimacin.c- Permitirnos extender el alcance de la inferencia relativa al experimento.

    El error experimental segn el contexto puede reflejar: errores de experimentacin errores de observacin errores de medicin variacin del material experimental

    El error experimental puede reducirse generalmente adoptando una o ms de las tcnicas siguientes: usando material experimental tan homogneo como sea posible. utilizando informacin proporcionada por otras variables aleatorias teniendo cuidado al dirigir el experimento usando un diseo experimental ms eficiente.

    Aleatorizacin: Todo procedimiento de prueba se basa en un conjunto de supuestos que debensatisfacerse para que la prueba resulte vlida. Una de las suposiciones ms frecuentes es que lasobservaciones, o los errores en ellas, estn distribuidos independientemente. Dicho en otras palabrasla aleatorizacin hace vlida la prueba.

    Control local: Se denomina de esta manera al conjunto de acciones que implementa el investiga-dor con el fin de reducir al mximo posible el error experimental mantenindolo en un rango de varia-

    cin manejable. Por ejemplo: seleccin de unidades experimentales homogneas, divisin en bloques, calibracin deinstrumentos, etc.

    Tipos de estudios de investigacinLos estudios observacionales son un conjunto de estudios en los que no hay intervencin por partedel investigador y este se limita a medir las variables que define en el estudio. Por ejemplo, los estu-dios epidemiolgicos.

    Ventajas de los estudios observacionales 1. Son ms prcticos y factibles de realizar, ya que la cooperacin de los sujetos es menos necesa-

    ria.2. Sus resultados son ms generalizables a poblaciones, geogrfica o demogrficamente definidas.

    Inconvenientes de los estudios observacionales1. Escaso control de las influencias de los factores de confusin sobre los resultados del estudio.

    (Los factores de confusin son factores no tenidos en cuenta que pueden llegar a modificar los re-sultados de un anlisis).

    2. Debido a la falta de control por parte del investigador, cada estudio observacional tiende a ser ni-co, siendo muy difcil reproducir los resultados por otro investigador.

    Los estudios pre-experimentales se caracterizan por analizar una nica variable y prcticamente noexiste ningn tipo de control. No existe manipulacin de la variable independiente ni se utiliza el grupode control; por consiguiente son escasas las posibilidades de que este grupo sea representativo de losdems. Este tipo de diseo consiste en administrar un tratamiento o estmulo en la modalidad de solopre-prueba / posprueba.

  • 8/7/2019 Estadistica Analitica Gui 2011

    9/100

    Estadst ica Anal t i ca 2010 Fac. Cs. Veterinarias (U.B.A)

    4

    Un estudio de intervencin , tambin llamadoestudio experimental , es un estudio caracterizado porla manipulacin artificial del factor de estudio por el investigador y por la aleatorizacin de los casos osujetos en dos grupos, llamados control y tratado.

    Cuando la caracterstica de la aleatorizacin en el estudio no se cumple, se dice que el estudio escua-siexperimental . La falta de aleatorizacin de los estudios cuasiexperimentales indica que no existemanera de asegurar la equivalencia inicial de los grupos denominados experimental y de control.Tambin es usual que, en un experimento, se utilicencontroles histricos. El problema que presentaeste tipo de diseo es que el grupo actualmente en tratamiento puede presentar importantes diferen-cias relativas al tratamiento respecto al grupo de control histrico. Los trabajos con controles histricosestn generalmente sesgados a favor del tratamiento, mientras que los experimentos aleatorios evitaneste tipo de sesgo.

    PROBLEMA RESUELTO

    1) Gracias a la tcnica de la ecografa, los bebs pueden actualmente ser observados mientras estnen el seno materno. Sin embargo, gran cantidad de experimentos desarrollados en animales de labora-torio dieron como resultado que la aplicacin de ultrasonidos poda ser la causa de que el peso al na-cer fuese inferior al normal.

    Ante el temor de que esta conclusin fuese aplicable a los humanos, un grupo de especialistas delHospital John Hopkins de Baltimore puso en marcha un estudio para investigar el tema. En el mismose observ el peso al nacimiento de los bebs que estuvieron expuestos a controles ecogrficos (ultra-sonido) y de los que no estuvieron expuestos.

    Tambin en este caso los bebs expuestos al ultrasonido durante el embarazo pesaban en su mayo-ra al nacer menos que aquellos que no lo haban estado, pero un dato a tener en cuenta es que losobstetras recomendaban el ultrasonido cuando sospechaban que el embarazo no se desarrollaba connormalidad.

    a) Se trata de un estudio observacional o experimental? Por qu?b) Puede concluirse que el ultrasonido influye sobre el peso del nacimiento?

    Solucin:a) Se trata de un estudio observacional, porque no hay intervencin del investigador.b) Los bebs expuestos al ultrasonido y los no expuestos presentaban diferencias que no tenan nadaque ver con el hecho de ser tratados o no. De modo tal que los investigadores tuvieron un conjunto defactores de confusin con el cual enfrentarse. La conclusin del estudio fue, por lo tanto, que las eco-grafas y el menor peso de los bebs tenan una causa comn: problemas durante el embarazo.

  • 8/7/2019 Estadistica Analitica Gui 2011

    10/100

    Estadst ica Anal t i ca 2010 Fac. Cs. Veterinarias (U.B.A)

    5

    PROBLEMAS RESUELTOS

    1) Mediante la siguiente experiencia se quiere determinar si una droga reduce el nivel promedio de gluco-sa en sangre (glucemia) en una lnea de ratas diabticas.

    Se tomaron al azar 40 ratas de esta lnea y se les suministr la droga (grupo tratado). Al mismotiempo se tomaron otras 30 ratas de la misma lnea y se les suministr un placebo (grupo control).

    Los niveles sanguneos de glucosa (mg/ml) en las ratas fueron:Tratadas con droga Tratadas con placebo

    1,82 1,89 1,39 1,79 1,27 1,73 2,01 1,74 1,91 1,521,41 1,88 1,88 1,66 1,93 1,56 1,93 1,70 1,74 2,161,60 1,70 1,69 1,94 1,62 1,44 1,68 1,99 1,82 1,401,68 1,57 1,91 1,83 1,60 1,58 2,12 1,61 1,91 1,70

    2,15 1,91 1,93 2,22 2,18 1,75 1,93 2,032,37 1,65 2,09 1,75 2,00 2,23 2,10 1,952,18 1,95 1,92 2,01 2,48 1,67 2,23 1,961,87 2,06 2,00 2,26 1,94 1,89

    a) Es la droga efectiva para reducir el nivel promedio de glucosa en sangre, al 5%? Asuma que ladroga no modifica la varianza poblacional del nivel de glucosa en sangre, y que sta es conocida, sim-blicamente2droga=2placebo =0,04 mg2/ml2

    b) Construya un intervalo de confianza del 95% para la diferencia entre la media poblacional de laglucemia de las ratas tratadas con droga y la media poblacional de la glucemia de las ratas tratadas conplacebo.Datos del problema: Variables en estudio

    X1: nivel de glucosa de una rata diabtica de la lnea, tratada condroga , en mg/mlX2: nivel de glucosa de una rata diabtica de la lnea, tratada conplacebo , en mg/ml

    Tamaos de las muestras: n1= 40 y n2= 30

    Varianzas poblacionales: Conocidas e iguales. (21=22 =0,04 mg2/ml2)

    Nivel de significacin:=0,05

    Nivel de confianza: 1-=0,95Solucin:a) La hiptesis de trabajo que se desea poner a prueba es:El empleo de la droga disminuye el nivel medio de glucosa en sangre de ratas diabticas de la lnea

    Verificacin de supuestos: Para poder plantear las hiptesis estadsticas y poder llevar a cabo laprueba, hay que verificar los supuestos tericos necesarios. En este caso, los supuestos son que am-bas variables (X1 y X2) sean independientes y se distribuyan normalmente. El supuesto de indepen-dencia se cumple por la forma en que se realiz el experimento: a un grupo de ratas se le suministr ladroga y a otro grupo, tambin tomado al azar, se lo trat con placebo.

    Para X1: se realiz un grfico de cuantil-cuantil (qqplot) para visualizar el comportamiento distribucional de

    la variable.

    Nota: En este grfico se comparan dos distribuciones, la de los datos muestrales y la de una normal. Para descri-bir el hecho de que los datos se distribuyen de manera normal, hay que observar que los puntos estn alineadossobre la recta.

  • 8/7/2019 Estadistica Analitica Gui 2011

    11/100

    Estadst ica Anal t i ca 2010 Fac. Cs. Veterinarias (U.B.A)

    6

    1.62 1.84 2.05 2.27 2.48Cuantiles de una Normal(2.022,0.038086)

    1.62

    1.84

    2.05

    2.27

    2.48

    Cuantiles observados(X2)

    Qqplot

    Observando el grfico se puede ver que los puntos no sealejan notoriamente de la recta, sin embargo, por ser ungrfico, no se puede hacer inferencia sobre elcomportamiento distribucional de la variable a nivelpoblacional. Para poder concluir a nivel poblacional esnecesario un test de normalidad. En Elementos de

    Estadstica se estudi la prueba Shapiro-Wilks, paraverificar normalidad, y cuyas hiptesis son:

    0 1

    1 1

    : se distribuye normal

    : no se distribuye normal

    H X

    H X

    Al realizar el test, utilizando InfoStat, se obtuvieron los siguientes resultados:

    Shapiro-Wilks (modificado)Variable n Media D.E. W* p (una cola)X1 40 1.73 0.20 0.97 0.7731

    Como p-valor= 0,7731 y es mayor que=0.05, no se rechaza la hiptesis nula, por lo tanto, con unnivel de significacin del 5% se puede decir que la variable X1 (nivel de glucosa en sangre de una ratatratada con droga, en mg/ml) se distribuye normalmente.

    Anlogamente se estudia la normalidad de la variableX2:

    0 2

    1 2

    : se distribuye normal

    : no se distribuye normal

    H X

    H X

    Shapiro-Wilks (modificado)Variable n Media D.E. W* p (una cola)X2 30 2.02 0.20 0.97 0.7739

    Como p-valor= 0,7739 y es mayor que=0,05, no se rechaza la hiptesis nula, por lo tanto, con unnivel de significacin del 5% se puede decir que la variable X2 (nivel de glucosa en sangre de una ratatratada con placebo, en mg/ml) se distribuye normalmente.

    Una vez verificado el supuesto terico se puede seguir adelante con la prueba.

    Nota : si, por experiencias previas o por informacin previa, se sabe que se verifican los supuestos,este tem no es necesario.

    Hiptesis estadsticas.El inters del investigador es probar si la droga disminuye el nivel medio de glucosa en sangre,

    por lo tanto quiere saber si la media del nivel de glucosa en sangre de ratas tratadas con droga esmenor que la media del nivel de glucosa en sangre de las ratas tratadas con placebo.

    Simblicamente: 1 2 < , esta expresin no lleva el signo igual, por lo tanto debe corresponder ala hiptesis alternativa. Es decir que las hiptesis estadsticas son:

    0 1 2

    1 1 2

    :

    :

    H

    H

    , porlo tanto esta corresponde a la hiptesis alternativa, ya que no contiene la igualdad.

    0

    1

    :

    :B A

    B A

    H

    H

    >

    como en el ejercicio anterior, existen muchas forma diferentes de plantear la misma

    hiptesis, como por ejemplo: 01

    : 0: 0

    B A

    B A

    H H

    >

    y otras ms. En este caso, se trabajar con la segunda

    expresin y se concluir para esta expresin: 01

    : 0

    : 0B A

    B A

    H

    H

    >

    Nivel de significacin:=0,05 Variable pivotal: En este caso, como en el ejercicio anterior, se est realizando un test para ladiferencia de medias poblacionales, por lo tanto hay dos opciones para la variable pivotal (Z o t-Student).Como las varianzas poblacionales son desconocidas no se puede utilizar la variable Z, por lo tanto se

    utilizar la variable pivotal t de Student, cuya frmula es:( ) ( )

    ( 2)~1 1

    A B

    B A B An n

    aA B

    X X t t

    S n n

    +

    =

    +. Donde

    Sa es la raz cuadrada positiva de la varianza amalgamada, es decir que es un promedio ponderado entrela varianza muestral de la variable XA y la varianza muestral de la variable XB y estima a la nica varianzapoblacional que se desconoce,2. Regin crtica: Observando la hiptesis alternativa planteada se deduce que la regin crtica esunilateral derecha (es decir que se rechaza la hiptesis nula a valores grandes de la variable pivotal). Elvalor crtico que se utiliza es 2;1 10 11 2;0,95 19;0,95 1,729A Bn nt t t + + = = = , por lo tanto la regin crtica es:

    1,729t . Grficamente:

    Regla de decisin: Rechazo H0 si0

    1,729H t y no rechazo H0 si 0 1,729H t <

    Clculo: Para obtener el valor calculado del estadstico de prueba, hay que realizar ciertos clcu-los auxiliares ( 2A B aX ; X y S ) utilizando las frmulas habituales para las medias y las varianzas muestra-les, y la siguiente frmula para la varianza amalgamada:

    2 22 2( 1) ( 1)

    2

    A A Ba

    A B

    n S n S S

    n n

    + =

    +

    Se obtuvo: 2 226,3 ; 27,91 ; 4,90 ; 3,69A B A BX X S S = = = = y

    2 (9)4,90 (10)3,69 44,1 36,9 4,2610 11-2

    aS + +

    = =+ =

    19

    por lo tanto 2,06aS =

    Reemplazando estos valores en la frmula de la variable pivotal queda:( ) ( ) ( )

    0

    27,91 26,3 0 1,61 1,61 1,611,78

    2,06*0,44 0,9061 1 1 1 212,06 2,06

    10 11 110

    B A B AH

    aA B

    X X t

    S n n

    = = = = = =

    + +

  • 8/7/2019 Estadistica Analitica Gui 2011

    15/100

    Estadst ica Anal t i ca 2010 Fac. Cs. Veterinarias (U.B.A)

    10

    Como0

    1,78H t = y utilizando la regla de decisin serechaza la hiptesis nula ya que 1,78 es mayorque 1.729. Conclusin: Con un nivel de significacin del 5% tengo evidencia suficiente para rechazar la hip-tesis nula (Ho: B - A 0), por lo tanto, la diferencia entre la media poblacional de la ganancia de pesode los cerdos alimentados con la racin B y la media poblacional de la ganancia de peso de los cerdos

    alimentados con la racin A es mayor a cero, en estas poblaciones de cerdos de 3 meses de razaYorkshire del norte de la provincia de Buenos Aires. Respuesta: Se puede suponer, al 5%, que la ganancia media poblacional del peso de los cerdosalimentados con la racin B supera significativamente a la media poblacional del peso de los cerdosalimentados con la racin A.Para este problema, la salida de InfoStat correspondiente es:Prueba T para muestras IndependientesGr(1) Gr(2) n(1) n(2) media(1) media(2) p(Var.Hom.) T p prueba{A} {B} 10 11 26,30 27,91 0,6623 -1,78 0,0452 UnilatI

    Nota: InfoStat compara grupos en orden alfabtico, por lo cual la prueba es unilateral izquierda, o seaque utiliza H1: A-B

  • 8/7/2019 Estadistica Analitica Gui 2011

    16/100

    Estadst ica Anal t i ca 2010 Fac. Cs. Veterinarias (U.B.A)

    11

    -3,20 -2,48 -1,75 -1,02 -0,30Cuantiles de una No rmal(-1,79,0,70989)

    -3,20

    -2,48

    -1,75

    -1,02

    -0,30

    Cuantiles observados(D)

    Qqplot

    Nota: En este caso el p valor < nivel de significacin, y sin embargo el 0 (cero) pertenece al IC. Recordar que la pruebaes unilateral derecha, mientras que el IC es bilateral.

    3) En un experimento referido al uso de la vitamina B12 en casos de anemia perniciosa durante el perodode remisin, se administr, por va intramuscular, 30g de B12 a un total de 10 pacientes tomado al azar.En ellos se midi la concentracin de hemoglobina en sangre (mg%) en dos momentos, al inicio deltratamiento y luego de tres meses. Los valores observados se muestran en la siguiente tabla:

    Paciente 1 2 3 4 5 6 7 8 9 10 Inicial (I) 12,2 11,3 14,7 11,4 11,5 12,7 12,3 13,0 12,7 13,0

    Hemoglobina(mg%) Despus de 3

    meses (F, o final) 13,0 13,4 16,0 13,6 14,0 13,0 14,2 15,1 15,9 14,5

    Hay aumento significativo de hemoglobina despus del tratamiento al nivel del 5%?Datos del problema: Variable en estudio:

    D: diferencia entre la concentracin de hemoglobina en sangre (en mg%) alinicio del tratamientocon vitamina B12 y la concentracin de hemoglobina en sangre (en mg%)despus de tres meses del

    tratamiento con vitamina B12, de un paciente con anemia perniciosa.En smbolos: di = ii - fi

    En la siguiente tabla estn calculados los valores correspondientes a la diferencia planteada:d i -0,8 -2,1 -1,3 -2,2 -2,5 -0,3 -1,9 -2,1 -3,2 -1,5

    Nota: En este caso se utilizar: di = ii - fi, pero tambin se podra haber definido la variable como di = fi -ii . La definicin de esta variable debe quedar clara al comienzo de la resolucin del ejercicio y debemantenerse a lo largo del mismo.

    Nivel de significacin:=0,05Solucin:

    Hiptesis de trabajo:Hay aumento significativo del nivel de hemoglobina despus del tratamiento Antes de plantear las hiptesis estadsticas hay que analizar la situacin planteada, ya que no es

    igual a las anteriores, dado que no hay independencia entre las mediciones realizadas, ya que se realiza-ron en cada individuo, al inicio y al finalizar los 3 meses de aplicado el tratamiento con vitamina B12. Poresta razn no se van a comparar las medias en los diferentes tiempos, sino que se va estudiar la variablediferencia. Verificacin de supuestos: En este caso, solamente hay que probar la normalidad de la variable Di. Elotro supuesto terico corresponde a la no independencia entre las mediciones, o sea, X1 y X2 no son inde-pendientes.

    0

    1

    : se distribuye normal

    : no se distribuye normal

    H D

    H D

    Shapiro-Wilks (modificado)Variable n Media D.E. W* p (una cola)D 10 -1,79 0,84 0,97 0,9425

  • 8/7/2019 Estadistica Analitica Gui 2011

    17/100

    Estadst ica Anal t i ca 2010 Fac. Cs. Veterinarias (U.B.A)

    12

    Como 0,9425 es mayor que 0,05, no se rechaza la hiptesis nula. Entonces, con un nivel de significa-cin del 5% se puede concluir que la diferencia entre la concentracin de hemoglobina en sangre (mg%) alinicio del tratamiento con vitamina B12 y la concentracin de hemoglobina en sangre (mg%) luego de 3meses de tratamiento con vitamina B12 en pacientes con anemia perniciosa se distribuye normalmente.Simblicamente 2D~ ( , )D N Hiptesis estadsticas: si el tratamiento produce un aumento en el nivel de hemoglobina ensangre, los niveles de hemoglobina medidos a los 3 meses deberan ser mayores que los medidos alinicio del tratamiento, es decir que la variable D = I F, tendra una media negativa. Simblicamente

    0D < . La orientacin de esta hiptesis depende exclusivamente de la definicin de la variable enestudio, por esta razn debe quedar clara la forma en que se realiza la diferencia entre Ii y Fi. Estaexpresin no contiene al signo igual, por lo tanto corresponde a la hiptesis alternativa, es decir que las

    hiptesis estadsticas son: 01

    : 0

    : 0D

    D

    H

    H

    Clculo: Para obtener el valor calculado del estadstico de prueba hay que realizar ciertos clculosauxiliares ( 2Dd y s ), utilizando las frmulas habituales para la media muestral y la varianza muestral,sobre las 10 diferencias.Utilizando los valores calculados para di (ver la tabla correspondiente al plantear la forma de realizar lamisma), se obtuvo 21,79 0,71Dd y s= = , reemplazando en la frmula de la variable pivotal:

    0

    1, 79 1, 796,7

    0,84 0,2610

    H t

    = = = .

    Como 6,7 es menor que 1,83 serechaza la hiptesis nula.

    Conclusin: Con un nivel de significacin del 5% tengo evidencia suficiente para rechazar lahiptesis nula ( 0D ), por lo tanto la media poblacional de las diferencias entre la concentracin dehemoglobina en sangre (mg%) de pacientes con anemia perniciosa alinicio del tratamiento y laconcentracin de hemoglobina en sangre (mg%) de pacientes con anemia perniciosadespus de tresmeses de iniciado el tratamiento con vitamina B12 es menor que cero, en la poblacin de pacientes conanemia perniciosa. Por lo cual la hemoglobina aumenta significativamente luego del tratamiento convitamina B12. A continuacin se da la salida del programa InfoStat para este problema, en donde aplicaremosel concepto del valor p, explicado en la pgina anterior:

  • 8/7/2019 Estadistica Analitica Gui 2011

    18/100

    Estadst ica Anal t i ca 2010 Fac. Cs. Veterinarias (U.B.A)

    13

    Prueba T para un parmetroValor del parmetro probado: 0Variable n Media DE T p(Unilateral I)D 10 -1,79 0,84 -6,72

  • 8/7/2019 Estadistica Analitica Gui 2011

    19/100

    Estadst ica Anal t i ca 2010 Fac. Cs. Veterinarias (U.B.A)

    14

    1

    cantidad de adultos que ven el programa los sbados a la noche y les gusta 100 0,25cantidad total de adultos 400

    p = = =

    2

    cantidad de adolescentes que ven el programa los sbados a la noche y les gusta 300 0,5cantidad total de adolescentes 600

    p = = =

    Por lo tanto la estimacin puntual es: 1 2 0, 25 0, 5 0, 25p p = =

    Intervalo de confianza: La frmula del intervalo de confianza para la diferencia de proporciones sededuce de la nica variable pivotal posible, cuya frmula es:

    1 2 1 2 1 21 2

    1 21 1 2 2

    1 2

    ( ) (0, 1) donde y (1 ) (1 )

    d p p p p x xZ N p pn np p p p

    n n

    = = =

    +

    Por lo tanto la frmula del intervalo es:

    ( ) ( ) ( ) ( ) ( ) ( )1 1 2 2 1 1 2 21 2 1 21 12 21 2 1 2

    1 1 1 1 ;

    p p p p p p p pp p Z p p Z

    n n n n

    + + +

    Reemplazando:

    ( ) ( ) ( ) ( ) ( ) ( )

    [ ]

    0,25 1 0, 25 0,5 1 0,5 0,25 1 0, 25 0,5 1 0,50,25 0,5 1,96 ; 0, 25 0,5 1,96

    400 600 400 600

    0,1875 0, 25 0,1875 0, 250, 25 1,96 ; 0, 25 1,96

    400 600 400 600

    0,25 1,96*0,03; 0,25 1,96*0,03 0,25 0,0588; 0,25 0

    + + + =

    = + + + =

    = + = +[ ] [ ],0588 0,31; 0,19=

    Conclusin: Con un nivel de confianza del 95% se espera que el intervalo [-0,31;-0,19] cubra ocontenga a la diferencia entre la proporcin poblacional de adultos que ven el programa los sbados ala noche y les gusta y la proporcin poblacional de adolescentes que ven el programa los sbados a lanoche y les gusta.b) Las hiptesis estadsticas son: H0: p1-p2=0 versus H1: p1-p20

    El nivel de significacin es 5%, siendo el estadstico de contraste:

    1 2 1 2 1 2 1 21 2

    1 2 1 2

    1 2

    ( ) (0, 1) donde , y1 1 (1 )

    d p p p p x x x xZ N p p pn n n n

    p pn n

    += = = =

    + +

    La regin crtica es bilateral, y est formada por los valores de Z mayores o iguales a 1,96, y los meno-

    res o iguales a -1,96.La regla de decisin es: RECHAZO H0 si Zobs 1,96 o Zobs -1,96

    NO RECHAZO H0 si -1,96 < Zobs < 1,96

    1 2

    1 2

    100 300 0,4

    400 600x x

    pn n

    + += = =

    + +

    ( )

    ( )

    0, 25 0,5 0 0, 25 0, 257,81

    0,03211 1 0,24*0,4 1 0,4240400 600

    obsZ

    = = = =

    +

    Como Zobs = -7,81 la decisin es

    ................................................................................................................................En esta situacin (regin crtica bilateral) el p valor se grafica y se calcula de la siguiente forma:

  • 8/7/2019 Estadistica Analitica Gui 2011

    20/100

    Estadst ica Anal t i ca 2010 Fac. Cs. Veterinarias (U.B.A)

    15

    p valor= P(Z V.Calc2) + P(Z V.Calc1)= 2* P(Z -8,33)

    Con un nivel de significacin del 5%,hay / no hay (tache lo que no corresponda) evidencias suficientespara rechazar H0, por lo tanto ...........................................................................................................

    .....................................................................................................................................................................

    .........................................................................................................................................

    5) Basndose en el mismo texto y los mismos datos del problema02 , responda los siguientes tems:a.- Estimar el cociente entre las varianzas, puntualmente y con un nivel de confianza del 95%. b.- Los nutricionistas que desarrollaron la nueva racin (B) temen que esta generemenor uniformidad en el crecimiento. Probar la hiptesis sugerida con un nivel de significacin del 5%.(Nota : Menor uniformidad hace referencia a la obtencin de ganancias de peso desparejas dentro dellote, con alta dispersin, siendo esta una caracterstica no deseada por los productores.)Solucin: Los datos son los mismos que los del problema3 y los supuestos tericos tambina) Estimacin puntual: se pide estimar puntualmente el cociente entre las varianzas, por ejemplo, sim-

    blicamente2

    2A

    B

    , cuyo estimador puntual es el cociente de las varianzas muestrales, es decir

    2

    2A

    B

    S S

    Utilizando la frmula de la varianza muestral se obtiene:

    ( ) ( ) [ ]2 2

    12 21

    1

    2631 1 1 44,16961 6961 6916,9 4,9

    1 9 10 9 9i

    A i

    xS x

    n n

    = = = = =

    ( ) ( ) [ ]2 2

    22 22

    2

    3071 1 1 36,918605 8605 8568,09 3,69

    1 10 11 10 10i

    B i

    xS x

    n n

    = = = = =

    Por lo tanto el estimador puntual del cociente entre SA2 y SB2 es:2

    2

    4,91,3279

    3,69A

    B

    S S

    = =

    (Nota : En este caso se estima el cociente entre la varianza poblacional de A sobre la varianza pobla-cional de B, pero tambin podramos resolver este ejercicio haciendo el cociente inverso, dado que enel enunciado no hay ninguna orientacin en especial para realizarlo.) Intervalo de confianza: La frmula del intervalo de confianza para el cociente de varianzas se de-duce de la variable pivotal que se utiliza para estudiar el cociente de varianzas, cuya frmula es:

    2 2

    2 2

    ( 1),( 1) ( 1),( 1)2 2

    2 2

    ~ o ~A B A B

    A A

    A Bn n n n

    B A

    B B

    S S S

    F F F F S

    = =

    La distribucin se grafica de la siguiente manera:

    Donde: 1( 1),( 1);

    2A Bn n

    F F =y 2

    ( 1),( 1);12

    A Bn nF F =

    .

  • 8/7/2019 Estadistica Analitica Gui 2011

    21/100

    Estadst ica Anal t i ca 2010 Fac. Cs. Veterinarias (U.B.A)

    16

    Como en la tabla de F de Snedecor que se usa en el presente curso el valor deF1 no est tabulado,para conocerlo es necesario hacer uso de la siguiente igualdad:

    ( 1),( 1);2 ( 1),( 1);1

    2

    1A B

    B A

    n nn n

    F F

    =

    Por ejemplo, en el problema que estamos resolviendo:

    9,10;0,975 9,10;0,025 9,10;0,02510,9;0,975

    1 13,78; ; 0, 25.

    3,96F F F

    F = = = =

    El intervalo se construye basndose en las siguientes igualdades:

    2

    2

    2( 1),( 1); ( 1),( 1);12 2

    2

    1A B A B

    A

    B

    n n n nA

    B

    S S

    P F F

    =

    2

    2

    2

    ( 1),( 1); ( 1),( 1);122 2

    1 11

    A B A B

    A

    B

    An n n n

    B

    P S F F S

    =

    2

    2

    2

    ( 1),( 1);1 ( 1),( 1);22 2

    1 11

    A B A B

    A

    B

    An n n n

    B

    P S F F S

    =

    2 2

    2 2 2

    2

    ( 1),( 1);1 ( 1),( 1);2 2

    1

    A B A B

    A A

    B A B

    Bn n n n

    S S S S

    P F F

    =

    Entonces, en nuestro problema:2

    2

    1, 3279 1, 32793,78 0, 25

    A

    B

    2

    20, 3513 5, 3116A

    B

    Conclusin: Con una confianza del 95% se espera que el intervalo [0,35136; 5,3116] cubra, ocontenga, al cociente entre la varianza poblacional de la ganancia de peso de los cerdos Yorkshire de 3meses de edad del norte de la provincia de Buenos Aires alimentados con laracin A durante 30 das, yla varianza poblacional de la ganancia de peso de los cerdos Yorkshire de 3 meses de edad del norte de laprovincia de Buenos Aires alimentados con laracin B durante 30 das.

    b) Hiptesis de trabajo:la nueva racin genera menor uniformidad en el crecimiento . Supuestos tericos: Ya fueron verificados en el ejercicio3 Hiptesis estadsticas: Si se quiere probar que la nueva formulacin es menos uniforme, se quiereprobar que la nueva formulacin es ms variable que la racin A, simblicamente:2 2

    A B < , esta

    expresin no contiene el signo igual por lo que corresponde a la hiptesis alternativa. Entonces las

  • 8/7/2019 Estadistica Analitica Gui 2011

    22/100

    Estadst ica Anal t i ca 2010 Fac. Cs. Veterinarias (U.B.A)

    17

    hiptesis quedan:2 2

    0

    2 21

    :

    :A B

    A B

    H

    H

    1,96Puesto que -1,97 < -1,96, la decisin es rechazar Ho.

    Al nivel del 5%, existen evidencias suficientes para rechazar H0, por lo que la mediana poblacional delrendimiento acadmico de los individuos que han realizado estudios secundarios en establecimientosestatales es distinta a la mediana poblacional de los que han realizado sus estudios secundarios en esta-blecimientos privados.Como respuesta a la pregunta, podemos decir, que, al 5%, los rendimientos acadmicos difieren significa-tivamente entre los individuos que han realizado sus estudios secundarios, al comparar establecimientosestatales y privados.

    Utilizando InfoStat, tenemos que aplicar el test de Wilcoxon para muestras independientes, y obtenemos lasiguiente salida, en la que figuran medidas resumen, el estadstico correspondiente, y el p-valor de laprueba.Prueba de Wilcoxon para muestras independientes (Mann Whitney)

    Grupos Media Desvo estndar Mediana Media del rango Estadstico(T) p-valorEstatal 4,80 1,52 4,00 12,33Privado 6,00 1,73 5,00 18,67 185,00 0,0433

    7) Los datos que se presentan a continuacin provienen de los pesos, en g, de 22 ratas hembras, de entre28 y 84 das de vida. Doce de ellas fueron alimentadas con una dieta alta en protenas, y 10 con una dietabaja en protenas.

    Datos Secundario Orden Rango3 Estatal 1 1,53 Estatal 2 1,54 Estatal 3 74 Estatal 4 74 Estatal 5 74 Estatal 6 74 Estatal 7 74 Estatal 8 74 Privado 9 74 Privado 10 74 Privado 11 75 Estatal 12 15,55 Estatal 13 15,55 Estatal 14 15,55 Privado 15 15,55 Privado 16 15,55 Privado 17 15,55 Privado 18 15,55 Privado 19 15,56 Estatal 20 21,56 Estatal 21 21,56 Estatal 22 21,56 Privado 23 21,57 Privado 24 257 Privado 25 257 Privado 26 258 Privado 27 279 Estatal 28 29

    9 Privado 29 299 Privado 30 29

  • 8/7/2019 Estadistica Analitica Gui 2011

    25/100

    Estadst ica Anal t i ca 2010 Fac. Cs. Veterinarias (U.B.A)

    20

    Alta en protena 120,2 120,57 119,78 120,29 118,62 120,69 120,27 119,13 118,04 120,29 117,46 119,7

    Baja en protena 102,13 105,3 103,39 104,73 98,00 95,89 98,65 98,73 95,2 102,47

    a) Se puede suponer, al 5%, que el peso medio las ratas alimentadas con la dieta alta en protenases mayor que el peso medio las ratas alimentadas con la dieta baja en protenas?

    b) Construir un intervalo para la diferencia de medias al 95%. Qu puede concluir?Datos del problema: Variables en estudio

    X1: peso de una rata de entre 28 y 84 das de vida alimentada con una dieta alta en protenas. Medidaen g.

    X2: peso de una rata de entre 28 y 84 das de vida alimentada con una dieta baja en protenas.Medida en g.

    Tamaos de las muestras: n1= 12 y n2= 10

    Varianzas poblacionales: Desconocidas

    Nivel de significacin:=0,05 Nivel de confianza: 1-=0,95

    Solucin:a) La hiptesis de trabajo que se desea poner a prueba es:

    La dieta alta en protenas produce un peso medio mayor que la dieta baja en protenas

    Verificacin de supuestos: Para poder plantear las hiptesis estadsticas y poder llevar a cabo laprueba, hay que verificar los supuestos tericos necesarios. En este caso, los supuestos son que am-bas variables (X1 y X2) sean independientes y se distribuyan normalmente. El supuesto de indepen-dencia se cumple por la forma en que se realiz el experimento: a un grupo de ratas seleccionadoaleatoriamente se le suministr la dieta alta en protenas y a otro grupo, tambin tomado al azar, se lesuministro una dieta baja en protenas.

    Para X 1: se realiz un test de Shapiro Wilks cuyas hiptesis son:0 1

    1 1

    : se distribuye normalmente

    : no se distribuye normalmente

    H X

    H X

    Al realizar el test, utilizando InfoStat, se obtuvieron los siguientes resultados:Shapiro-Wilks (modificado)Variable n Media D.E. W* p (una cola)X1 12 119.58 1.049 0.8715 0.0683

    Como p-valor= 0,0683 y es mayor que=0,05, no se rechaza la hiptesis nula. por lo tanto, con un nivelde significacin del 5% se puede decir que la variable X1 (peso de una rata de entre 28 y 84 das de vidaalimentada con una dieta alta en protenas medido en g) se distribuye normalmente.Anlogamente se estudia la normalidad de la variableX2:

    0 2

    1 2

    : se distribuye normalmente

    : no se distribuye normalmente

    H X

    H X

    Shapiro-Wilks (modificado)Variable n Media D.E. W* p (una cola)X2 10 100.45 3.62 0.9282 0.4305

  • 8/7/2019 Estadistica Analitica Gui 2011

    26/100

    Estadst ica Anal t i ca 2010 Fac. Cs. Veterinarias (U.B.A)

    21

    Como p-valor= 0,4305 y es mayor que=0,05, no se rechaza la hiptesis nula. Por lo tanto, con un nivelde significacin del 5%, se puede decir que la variable X2 (peso de una rata de entre 28 y 84 das de vidaalimentada con una dieta baja en protenas medida en g) se distribuye normalmente.

    En este caso, no hay informacin de las varianzas poblacionales, por lo tanto son desconocidas, y hay queprobar si son iguales. Para esto hay que realizar un test de homogeneidad de varianzas, cuyas hiptesis

    son:

    =22

    211

    22

    210

    :

    :

    H

    H

    Prueba F para igualdad de varianzasVariable Grupo(1) Grupo(2) n(1) n(2) Var(1) Var(2) F p pruebaPeso {Alta} {Baja} 12 10 1,10 13,10 0,08 0,0009 Bilateral

    El resultado del estadstico es F= 0,08 y un p-valor de 0,0009, por lo tanto se rechaza la hiptesis dehomogeneidad de varianzas.Es decir que ambas variables se distribuyen normalmente con varianzas desconocidas y diferentes.

    Hiptesis estadsticas.Como el inters del investigador es probar si al alimentar a las ratas con una dieta con alta con-centracin de protenas produce un peso medio superior, simblicamente: 21 > . Por lo que lashiptesis estadsticas son:

    >

    211

    210

    :

    :

    H

    H

    Nivel de significacin:=0,05 Estadstico de prueba (o variable pivotal)

    Se est realizando un test de hiptesis para la diferencia de medias poblacionales de variablescon distribucin normal, por lo cual se cuenta con dos opciones al elegir la variable pivotal: Z o t deStudent, dependiendo del hecho de conocer o no las varianzas poblacionales. En este caso, las va-

    rianzas poblacionales son desconocidas y desiguales, por lo tanto se utiliza una t, con la siguiente ex-

    presin:wt

    ns

    ns

    X X

    +

    =

    2

    22

    1

    21

    21 0)( T con

    22 21 2

    1 22 22 2

    1 2

    1 2

    1 21 1

    s sn n

    ws sn n

    n n

    +

    = +

    Regin crtica:Es unilateral derecha, dado que H1: 1-2>0 , por lo tanto el valor crtico es: 95,0,wt , siendo w

    ( )( ) ( )

    ( )

    2 22 21 2

    2 21 22 2 2 2 2 22 2

    1 2

    1 2

    1 2

    1,10 13,10,091 1,31 1, 40112 10

    0,008280, 091 1, 311,10 13,112 10 11 9

    12 1 10 11 1

    s sn n

    ws sn n

    n n

    + + + = = = = + + +

    1 1,716111 9

    1,9628 1,962810,28 10

    0,00075 0,19 0,19075

    = +

    = = = = +

    El valor crtico es 812,195,0,10 =t y la regin crtica queda determinada por: 812,1t

  • 8/7/2019 Estadistica Analitica Gui 2011

    27/100

    Estadst ica Anal t i ca 2010 Fac. Cs. Veterinarias (U.B.A)

    22

    Regla de decisin:Rechazo H0 si 812,1

    0H t

    No rechazo H0 si 812,10

  • 8/7/2019 Estadistica Analitica Gui 2011

    28/100

    Estadst ica Anal t i ca 2010 Fac. Cs. Veterinarias (U.B.A)

    23

    d- El objetivo del trabajo es ..................................................................................................................................................................................................................................................................

    2) Para estudiar el efecto de un nuevo fertilizante sobre el rendimiento de un cultivo de oleaginosas, sesembraron 12 ha del cultivo con fertilizante y 10 ha sin fertilizante. Una vez levantada la cosecha result:

    1X =1089 kg/ha y 2X = 877 kg/ha, respectivamente. Suponiendo que1 = 2 = 105 kg/ha, y que ambas

    variables tienen distribucin normal:a .- Es la diferencia entre los rendimientos medios con y sin fertilizante, significativa al 5%?b .- Considera conveniente construir un intervalo de confianza para la diferencia entre las medias?Justifique.

    3) Las personas que tienen el sndrome de Raynaud sufren un sbito deterioro en la circulacin sanguneade los dedos de las manos y de los pies. Para estudiar esta enfermedad, en un experimento se midi lageneracin de calor, mediante calorimetra, en cal/cm2/min, de un dedo ndice luego de haberlo sumergidoen agua a 19C. En este estudio, se cont con una m uestra tomada al azar de 10 individuos con elsndrome y una muestra de 10 individuos sanos.Sanos (S) 2,43 1,83 2,43 2,70 1,88 1,96 1,53 2,08 1,85 2,44Sndrome de Raynaud (E) 0,81 0,70 0,74 0,36 0,75 0,56 0,65 0,87 0,40 0,31

    Asuma que las distribuciones de ambas variables son normales, y queE2 = S2.a .- Definir:

    Variables en estudio: ..................................................................................................................................................................................................................................................................................................................................................................................................................................................

    Parmetros: ...............................................................................................................................................................................................................................................................................................................................................................................................................................................................

    Poblaciones: ..............................................................................................................................................................................................................................................................................................................................................................................................................................................................

    b .- Estimar puntualmente y por intervalo de confianza la diferencia entre la generacin de calor media delos individuos enfermos (E) y la generacin de calor media de los individuos sanos (S) (1- = 0,95).

    c .- Se cree que la generacin de calor por parte de los afectados por este sndrome es ms homognea.Probarlo con un nivel de significacin del 5%.

    4) De una poblacin de individuos afectados por una enfermedad, se tomaron dos muestras aleatorias eindependientes de 100 individuos cada una. A una de las mismas (que llamaremos grupo A), se leadministr un suero, al otro grupo (B, control) se le administr un placebo; en todo lo dems, los dosgrupos fueron tratados idnticamente. Se encontr que en los grupos A y B, 75 y 55 individuos,respectivamente, se haban recuperado luego de un mes de observacin. Probar la hiptesis de que elsuero ayuda a curar la enfermedad con un nivel de significacin del 5%.a) La hiptesis de trabajo es: ...................................................................................................................................................................................................................................................................................................................................................................................................................

    b) La regin crtica es .....................................................

    c) El valor calculado del estadstico de prueba es:

  • 8/7/2019 Estadistica Analitica Gui 2011

    29/100

    Estadst ica Anal t i ca 2010 Fac. Cs. Veterinarias (U.B.A)

    24

    Frmula empleada Reemplazo numrico Resultado

    d) Conclusin a la que llega luego de la prueba: ...................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................5) Un estudio llevado a cabo para probar si la aspirina afecta el tiempo de coagulacin, se tom unamuestra de 12 adultos varones. El tiempo de protrombina, que mide el tiempo en segundos entre elinicio de la reaccin de coagulacin y la formacin del cogulo, fue medido en cada uno de losindividuosantes y despus de 3 hs de haber ingerido dos tabletas de aspirina (500mg cada una).Antes 12,3 12,0 12,0 13,0 13,0 12,5 11,3 11,8 11,5 11,0 11,0 11,3Despus 12,0 12,3 12,5 12,0 13,0 12,5 10,3 11,3 11,5 11,5 11,0 11,5a) Probar si existe alguna diferencia en el tiempo de protrombina con un nivel de significacin del 5%,tener en cuenta la verificacin de supuestos, sin hacer clculos y utilizando la informacin que leproporciona alguna de las salidas de InfoStat que abajo se detallan. Comente brevemente por qu eligiesa salida y a qu decisin llega a partir de la informacin.Shapiro-Wilks (modificado)Variable n Media D.E. W* p (una cola)antes 12 11.89 0.71 0.89 0.2210despus 12 11.79 0.75 0.97 0.9213

    Shapiro-Wilks (modificado)Variable n Media D.E. W* p (una cola)Dif_AD 12 0,11 0,51 0,86 0,0972

    Prueba T para muestras IndependientesGrupo1 Grupo2 n1 n2 med1 med2 LI(95%) LS(95%) T p pruebaAntes Despus 12 12 11,89 11,78 -0,51 0,72 0,37 0,7186 Bilat

    Prueba T para un parmetroValor del parmetro probado: 0Variable n Media DE LI(95) LS(95) T p(Bilateral)Dif_AD 12 0,11 0,51 -0,21 0,43 0,74 0,4748..............................................................................................................................................................................................................................................................................................................b) El intervalo de confianza correspondiente tiene como lmites: .........................................................c) La conclusin para el intervalo de confianza es: ..........................................................................................................................................................................................................................................................................................................................................................................................

    .......................................................................................................................................................6) Las empresas que comercializan agua para beber, realizan controles de calidad diariamente. Una delas variables de inters es el pH, que mide el grado de acidez del agua contenida en los envases listapara su distribucin. Un pH menor a 7 es considerado cido, un pH mayor a 7 es considerado alcalinoy un pH igual a 7 es considerado neutro. Un investigador sospecha que el material de los nuevos en-vases modifica el pH del agua. Para estimar la diferencia entre los pH medios, extrae 20 muestras deagua con el envase viejo y 15 muestras de agua con el envase nuevo. Algunos datos obtenidos son:

    Media Desvo Shapiro-Wilks (p-valor)Envase viejo 8,366 0,54 0,6413 Envase nuevo 6,318 3,73 0,9609

    Al hacer la prueba de homogeneidad de varianzas, result:F = 0,0209, p-value = 0 Construir un intervalo para la diferencia de medias al 95%. Qu puede concluir?

  • 8/7/2019 Estadistica Analitica Gui 2011

    30/100

    Estadst ica Anal t i ca 2010 Fac. Cs. Veterinarias (U.B.A)

    25

    7) Alle y Bowen (1932) estudiaron el tiempo de supervivencia de la carpa dorada, en minutos, cuando secoloca en suspensiones de plata. Los investigadores realizaron varios experimentos, entre ellos el siguien-te: se asignan aleatoriamente 10 carpas a cada grupo. En uno de ellos se exponen a las carpas a unaconcentracin baja de nitrato de plata disuelto en el agua (Conc1, 50 g/l), y el otro grupo, a una concentra-cin mayor (Conc2, 80g/l). Al nivel del 5%, difieren los tiempos de supervivencia?

    Conc1 Conc2210 81180 75240 15660 18055 10275 20078 13582 85125 7883 87

    Shapiro-Wilks (modificado)Concentracin Variable n Media D.E. W* p (una cola)1 Sobrevida 10 118,80 67,11 0,81 0,02472 Sobrevida 10 117,90 46,46 0,82 0,0307

    Prueba de Wilcoxon para muestras independientes (Mann Whitney)

    Grupos Media Desvo estndar Mediana Media del rangoEstadsticoT p-valorConc1 118,80 67,11 82,50 9,75Conc2 117,90 46,46 94,50 11,25 97,50 0,5703

    CUESTIONARIO

    1.- Cul es el objeto de un diseo experimental? Qu beneficios trae?.......................................................................................................................................................2.- De qu manera puede controlarse la confusin de factores en el estudio experimental?.......................................................................................................................................................3.- Cul/es de las siguientes preguntas corresponde hacerse en un estudio observacional? Tache loque no corresponda.a) se aleatorizaron las asignaciones a tratamiento y control? S NO b) qu caracterstica determin la separacin entre los grupos? S NOc) existen factores que pueden confundirse con los tratamientos? S NO d) si existe posibilidad de confusin, puede controlarse? S NO

    4.- En los estudios observacionales pueden establecerse asociaciones, es decir poner de manifiestoque una cosa est relacionada con otra. Pueden estos estudios establecer causalidad?..............................................................................................................................................................................................................................................................................................................5.- Cmo diseara un experimento para estudiar si la hipertensin durante el embarazo provoca be-bs nacidos con menor peso? Qu factor podra confundirse y cmo lo controlara?.....................................................................................................................................................................................................................................................................................................................................................................................................................................................................

    1 2

    Concentracin

    50

    100

    150

    200

    250

    Sobrevida

    Boxplot

  • 8/7/2019 Estadistica Analitica Gui 2011

    31/100

    Estadst ica Anal t i ca 2010 Fac. Cs. Veterinarias (U.B.A)

    26

    6.- Segn un estudio observacional realizado en el Kaiser Permanente de Walmut Creek, California, sedaba un ndice ms elevado de cncer de cuello de matriz entre mujeres que usaban anticonceptivos ora-les que entre las que no usaban, independientemente de su edad, educacin, estado civil, religin y hbitode fumar. Los investigadores llegaron a la conclusin de que la pldora causaba el cncer del cuello dematriz. Es correcta esta afirmacin? Por qu?..............................................................................................................................................................................

    ................................................................................................................................................7.- Identifique en el ejemplo anterior los trminos: unidad experimental, tratamiento, factor, niveles delfactor...............................................................................................................................................................................................................................................................................................................................

    ...............................................................................................................................................................

    8.- En qu casos debe aplicarse el test de Welch? .....................................................................................................................................................................................................................................

    9.- Un estimador puntual es ........................................................................................................... y seutiliza para ...............................................................................................................................10 .- Qu entiende por confianza en la estimacin de un intervalo?..............................................................................................................................................................................................................................................................................................................................11 .- Establezca las diferencias entre ambos tipos de estimacin...............................................................................................................................................................................................................................................................................................................................12 .- Qu ocurre con la amplitud de un intervalo de confianza para la diferencia de medias

    poblacionales con varianzas desconocidas pero iguales si:a .- aumenta el tamao de las muestras (mantenindose la varianza muestral constante)b .- disminuye el nivel de confianza.c .- disminuye la variabilidad de las muestras.

    13 .- Es la diferencia de medias poblacionales la que flucta en el intervalo es el intervalo el que fluctaalrededor de la diferencia de medias poblacionales? Explique su respuesta.14 .- Puede resultar negativo algn lmite de un intervalo de confianza para la diferencia de dosproporciones? Justifique su respuesta.

    15 - En qu casos es recomendable aplicar un test de Mann Whitney? Explicite los supuestos y lashiptesis que se corresponden con los mismos.

    16 .- Si al realizar una prueba de hiptesis, donde H0: 1 2 0p p versus H1: 1 2 0p p < , se rechazaH0 al nivel 5%; se puede estar:

    a.- actuando correctamente con probabilidad igual a 0,95.b.- actuando correctamente con probabilidad igual a (1 -).c.- cometiendo un error tipo I con probabilidad igual a 0,05.d.- cometiendo un error tipo II con probabilidad igual a .

    Indicar cul o cules de las situaciones son correctas justificando claramente la respuesta.17 .- Qu elementos necesita para definir la regin crtica? Detalle cmo interviene cada uno de ellos.18 .- Cundo le parece conveniente utilizar una prueba para la media de las diferencias apareadas?Cuntas son las variables en estudio?19 .- Se tiene la sospecha de que la proporcin de individuos que no tienen enfermedades cardiovascu-lares en la poblacin A es mayor que en la poblacin B. Para poner a prueba esta hiptesis se tom

  • 8/7/2019 Estadistica Analitica Gui 2011

    32/100

    Estadst ica Anal t i ca 2010 Fac. Cs. Veterinarias (U.B.A)

    27

    una muestra aleatoria de individuos de la poblacin A y otra de la poblacin B y se observ el nmerode individuos sin esta afeccin en cada grupo.a .- La hiptesis de trabajo es: ........................................................................................................................................................................................................................................................................................................................................................................................................................b .- Interpretacin biolgica de parmetro/s en estudio: ....................................................................................................................................................................................................................................................................................................................................................................................c .- Las hiptesis estadsticas son: ......................................................................................................d .- Los supuestos necesarios para la validez de la prueba estadstica son: .........................................................................................................................................................................................................................................................................................................................................................

    20 .- Se realiz una dcima a un nivel del 5%, con las hiptesis H0: 2 21 2 = versus H1: 2 2

    1 2 yresult no significativa (es decir, no se rechaz H0). En qu situacin de las cuatro que quedanplanteadas en una dcima de hiptesis se ubica este ejemplo si supiramos que para estaspoblaciones 2 21 2 > ? Cul es la probabilidad asociada a esta situacin?

    21 .- En una poblacin con1 > 2 se realiz la dcima H0: 1 = 2 contra H1: 1 2 y resultsignificativa al 1%, es decir se rechaz H0. En qu situacin de las cuatro posibles ubica esteejemplo? Cul es la probabilidad asociada a esta situacin?22 .- Dentro del marco de la dcima de hiptesis definir en forma clara y concisa los siguientes concep-tos:

    Hiptesis estadstica Nivel de significacin 1 -

  • 8/7/2019 Estadistica Analitica Gui 2011

    33/100

    28

    Unidad 2: CONTRASTES de CHI-CUADRADO

    Objetivos especficos Elegir las hiptesis adecuadas a cada problema planteado con datos categricos y seleccionar la

    prueba correspondiente. Aplicar correctamente los contrastes Chi Cuadrado para los ensayos de independencia, homogeneidad

    y bondad de ajuste.Contenidos temticosBondad de ajuste. Tablas de contingencia: Ensayos de Independencia. Contrastes Ji-cuadrado parahomogeneidad con varias poblaciones. Alcance de los ensayos.

    GlosarioDatos categorizados (cualitativos o atributos). Respuestas categricas y dicotmicas. Categorasmutuamente excluyentes. Categoras independientes. Frecuencia observada. Frecuencia esperada oterica. Frecuencia total o marginal. Tablas o criterios de clasificacin. Bondad de ajuste entre frecuenciasobservadas y frecuencias tericas. Hiptesis de independencia. Asociacin entre atributos. Hiptesis dehomogeneidad.

    PROBLEMAS RESUELTOS01.- Se realiz un estudio para saber si el grado de eficacia de un medicamento contra mastitis a partir delnivel de mejora est relacionado con el nivel de gravedad del cuadro clnico. Se tom una muestra de 642vacas Holando con mastitis y se registr el nivel de gravedad. A todas se las trat con la misma dosis delmedicamento y luego de 10 das se las clasific en funcin del nivel de mejora. Los resultados seobservan en la siguiente tabla:

    Nivel de mejora

    Ninguna Ligera NotableLeve 8 7 12

    Intermedio 6 37 36Niveles deInfestacin

    Grave 37 148 351

    Es sustentable la hiptesis de que existe relacin entre la eficacia del medicamento y el nivel de mastitisdel animal al 5%? Justifique.

    Datos del problema: Variables en estudio:X1: Nivel de infestacin de un paciente, categorizada en leve, intermedio y graveX2: Nivel de mejora de un paciente, categorizada en ninguna, ligera y notable Cantidad y tamao de muestras: hay una nica poblacin de pacientes de la cual se extrajo una nicamuestra de tamao 642

    Nivel de significacin: = 0,05 Se completa la tabla de frecuencias observadas (O ij) con los totales de filas y columnas (O i y O j ,respectivamente) y el total general (O = n)

    Nivel de mejoraNinguna Ligera Notable Total

    Leve 8 7 12 27

    Intermedio 6 37 36 79

    Grave 37 148 351 536Niveles deInfestacin

    Total 51 192 399 642=n

  • 8/7/2019 Estadistica Analitica Gui 2011

    34/100

    29

    Solucin: Existen dos variables en estudio X 1 y X2 ambas con tres categoras y una nica poblacin de

    vacas. Se quiere probar si las variables, o criterios de clasificacin, nivel de infestacin y nivel de mejora,son independientes en la poblacin. Entonces nuestras hiptesis estadsticas son:

    cumplesenoanterioresigualdadeslasdeunaa

    jiparai

    lg:H

    3,2,1;3,2,1p*pp:H

    1

    jij0 ===

    En este caso H 0 est expresando la independencia de las variables para todos los pares de sucesos ocategoras que las componen y H 1 la falta de independencia o no independencia entre ellas.

    Donde:p ij: es la probabilidad conjunta esperada de la interseccin de la fila i-sima y la columna j-sima de latabla.p i.: es la probabilidad total esperada de elementos de la fila i-sima.p .j: es la probabilidad total esperada de los elementos de la columna j-sima.

    El nivel de significacin, es la probabilidad de cometer error de tipo I, es del 5%.

    El estadstico de prueba a utilizar es:

    siendo f = N de filas y c = N de columnas.

    La regin crtica es unilateral derecha , debido a que grandes discrepancias entre los valoresobservados y sus correspondientes valores esperados nos harn sospechar de la veracidad de lahiptesis planteada.El valor crtico es 24;0,95 = 9,48, quedando como regin crtica :

    2 9,48.

    Recordemos que la regin crtica est formada por los valores del estadstico de prueba para los cualesse va a rechazar la hiptesis nula. Y la determinamos a partir de la distribucin del estadstico de prueba,el nivel de significacin, la hiptesis alternativa y, a veces, del tamao de la muestra.Grficamente:

    RECHAZO H0 si0

    2H 9,48

    La regla de decisin esNO RECHAZO H0 si

    0

    2H < 9,48

    Por ser un caso de independencia, multiplicando las probabilidades esperadas ( . .ij i jp p p= ) por n

    (tamao de la nica muestra), se obtienen las frecuencias esperadas ( . .* * *ij ij i jE n p n p p= = ).Debido a que no tenemos las probabilidades esperadas las estimamos a partir de la muestra, es decir:

    * * jiij i jOO

    p p pO O

    = =

    y luego obtenemos los valores esperados estimados como:

    . . * * *ij ij i jE n p n p p= =

    222( -1)( -1)

    1 1

    ( - )

    f cij ij

    ci j ij

    O E E

    = =

    =

  • 8/7/2019 Estadistica Analitica Gui 2011

    35/100

    30

    ( ) ( ) ( ) ( ) ( )

    ( ) ( ) ( ) ( )=

    +

    +

    +

    +

    +

    +

    +

    +

    +

    =

    122333

    2122333351

    09849

    20984936

    7816

    2781612

    299160

    2299160148

    62623

    26262337

    0758

    207587

    57942

    25794237

    2766

    227666

    1452

    2145282

    ,

    ,

    ,

    ,

    ,

    ,

    ,

    ,

    ,

    ,

    ,

    ,

    ,

    ,

    ,

    ,

    ,

    ,

    Ho

    Por ejemplo, para el elemento ubicado en la fila 1 y la columna 1 tenemos:

    27 51642* * = 2,1448

    11 642 642E =

    Si efectuamos la misma operacin para todos los elementos de la tabla de contingencia, obtenemos la

    tabla de frecuencias esperadas estimadas:Nivel de mejora

    Ninguna Ligera Notable TotalLeve 2,145 8,075 16,780 27

    Intermedio 6,276 23,626 49,098 79

    Grave 42,579 160,299 333,122 536Nivel deinfestacin

    Total 51 192 399 642 = n

    El valor del estadstico calculado se obtiene reemplazando estos valores (

    ijE ) en lugar de los (

    ijE ) sinmodificar la distribucin y los correspondientes valores observados llegando a:

    Por lo tanto, el valor es

    0

    2 15,982 + 0,012 + 0,731 + 0,143 + 7,571 ++0,944 + 1,36 + 3,494 + 0,959 = 31,198=H

    Nota: Suele aportar informacin observar si las mayores magnitudes que forman este valor calculado (ej.: 15,982; 7,571 y 3,494 ) provienen de una misma fila o de una misma columna.

    Conclusin : Al nivel de significacin del 5%, hay evidencias suficientes para rechazar la hiptesis nula(donde se plantea la independencia), es decir que las variables nivel de infestacin de mastitis,categorizada en Leve, Intermedio y Grave; y nivel de mejora, con niveles Ninguna, Ligera y Notable, noson independientes, por lo tanto, a este nivel de significacin es sustentable la hiptesis de que en estapoblacin existe relacin entre la eficacia del medicamento y el nivel de gravedad de mastitis en vacasHolando.

    02.- Se espera que una determinada droga sea efectiva para la curacin del catarro comn en personas.En un experimento con 164 personas con catarro, la mitad de ellas recibi la droga y la otra mitad recibipldoras azucaradas (grupo control). En la siguiente tabla se encuentran los resultados obtenidos luego de

    aplicar los tratamientos. ResultadoMejorados Efecto nulo Empeorados

    Droga 50 22 10Tratamiento Pldoras azucaradas 40 28 14Probar la hiptesis de que la droga no produce efectos, con un nivel de significacin del 1%

    Datos del problema: Variable en estudio:X: Resultado de un paciente luego del tratamiento, categorizado en: mejorado, efecto nulo, empeorado.

    Cantidad y tamao de muestras: hay dos muestras, una de 82 de pacientes que tomaron droga y otrade 82 pacientes que tomaron pldora azucarada

    Nivel de significacin: = 0,01

  • 8/7/2019 Estadistica Analitica Gui 2011

    36/100

    31

    Se completa la tabla de frecuencias observadas con los totales de las muestras y los totales de cadacategora:

    Solucin:Se cuenta con dos muestras de igual tamao, proveniente de dos poblaciones, y una variable ordinal con3 categoras.La hiptesis que interesa docimar es que "la probabilidad de mejorar es la misma en las dos poblacionesde personas con catarro: la poblacin de personas con catarro tratados con droga y la poblacin depersonas con catarro tratados con las pldoras azucaradas. Es decir, que hay homogeneidad en losresultados del tratamiento con droga y pldoras. Entonces las hiptesis estadsticas son:

    H0: / pob : d orga / pob : azucm m mp p p= = (probabilidad de mejorar en la poblacin que recibe droga = probabili-dad de mejorar en la poblacin que recibe pldora azucarada)

    / pob: d org a / pob: azucn n np p p= = (probabilidad de efecto nulo en la poblacin que recibe droga = probabili-dad de efecto nulo en la poblacin que recibe pldora azucarada)

    / pob: dorga / p ob : azuce e ep p p= = (probabilidad de empeorar en la poblacin que recibe droga = probabilidadde empeorar en la poblacin que recibe pldora azucarada)

    H1 : alguna igualdad de las anteriores no se cumple.

    Nivel de significacin = 0,01

    El estadstico de prueba a utilizar es:

    El valor crtico es

    Por lo tanto la regin crtica es 2 9,21

    RECHAZO H0 si0

    2H 9,21

    La regla de decisin es:NO RECHAZO H0 si

    0

    2H < 9,21

    Informacin muestral: para calcular el valor del estadstico de prueba es necesario estimar las frecuenciasesperadas, considerando que la hiptesis nula es verdadera. Previamente estimamos mp ; np y ep .

    ResultadosMejorados

    (m)Efecto

    nulo (n)Empeorados

    (e) Total

    Droga (d) 50 22 10 82Pldoras azucaradas (a) 40 28 14 82TratamientoTotal 90 50 24 164

    222( -1)( -1)

    1 1

    ( - )

    f cij ij

    f ci j ij

    f nmero de filas

    c nmero de columnas

    O E E

    = =

    =

    ==

    2(3-1)(2-1);0,99 9, 21 =

  • 8/7/2019 Estadistica Analitica Gui 2011

    37/100

    32

    En este caso las muestras estn representadas en las filas de la tabla y se estiman las proporciones

    correspondientes a las categoras de la variable resultados como 31 2 ; ;m n ep p pOO O

    O O O

    = = =

    obteniendo:90 24 50

    164 164 164 ; ;m n ep p p= = =

    A partir de aqu se calculan las frecuencias esperadas estimadas en cada clase o categora:24

    82 * 12164

    *de d eee n p == = (donde n d es el tamao de la muestra de las personas tratadas con la

    droga).Efectuando la operacin equivalente en todas las celdas del cuerpo de la tabla de frecuencias observadas,se obtiene la tabla de frecuencias esperadas estimadas:

    Resultado

    Mejorados(m)

    Efecto nulo(n)

    Empeorados(e)

    Total

    Droga (d) 45 25 12 82Tratamiento

    Pldoras (a) 45 25 12 82

    Total 90 50 24 164

    Por lo tanto el estadstico de prueba resulta

    0

    2 2 2 2 2 22 (50 - 45 (40 - 45 (10 -12 (14 -12 (22 - 25 (28 - 25) ) ) ) ) )

    45 45 12 12 25 25H = + + + + +

    0

    2 25 25 4 4 9 9 1,111 0,667 0, 720 2, 49845 45 12 12 25 25

    H = + + + + + = + + =

    y como 2,498 < 9,21 se decide no rechazar H 0

    Conclusin : A un nivel de significacin del 1%, no hay evidencias suficientes para rechazar la hiptesisnula ( /pob: dorga /pob: azucm m mp p p= = ; /pob: dorga /pob: azucn n np p p= = ; /pob: dorga /pob: azuce e ep p p= = ) entonces la pro-babilidad poblacional de personas con catarro comn mejorados sera la misma para los tratados condroga y los tratados con pldoras azucaradas. Lo mismo ocurre con las probabilidades poblacionales deempeorados y de los que tuvieron efecto nulo, o sea que la droga y la pldora azucarada produciranreacciones similares en cuanto a las probabilidades poblacionales de mejorados, empeorados y de efectonulo, con respecto a la curacin del catarro comn en personas. Por lo tanto, al 1% se puede decir que ladroga no es efectiva para la curacin del catarro comn.

    03.- Supongamos que cuando las palomas son desorientadas no demuestran preferencia por ningunadireccin de vuelo, de manera que la direccin debera estar distribuida uniformemente en el intervalo(0;360]. Para probar esta suposicin se desorient a 60 palomas y se estudi la direccin de vuelo decada una de ellas dividindola en 4 categoras (como se indica en la tabla siguiente), obtenindose lossiguientes resultados:

    Direccin (0;90] (90;180] (180;270] (270;360]Frecuencia 12 16 17 15

    Son compatibles estos resultados con la suposicin planteada? ( =0,05).

    Datos del problema

    Variable en estudio:X: Direccin de vuelo de una paloma, categorizada en (0 ;90 ],(90 ;180 ];(180 ;270 ] y (270 ;360 ]

    Cantidad y tamao de muestras: hay una nica muestra de palomas de tamao 60, obtenida de lapoblacin de palomas desorientadas.

  • 8/7/2019 Estadistica Analitica Gui 2011

    38/100

    33

    Nivel de significacin: = 0,05

    SolucinAqu tenemos una nica muestra (como en el primer ejemplo) pero slo se registra una variable de 4categoras, que es la direccin de vuelo. Es de inters ver si dicha variable tiene en la poblacin unadistribucin determinada. De esto, se puede deducir que la hiptesis que nos interesa docimar es que lavariable responde a una distribucin terica y por lo tanto se trata de un caso de bondad de ajuste.

    Las hiptesis estadsticas son:H0 : p 1 = p 2 = p 3 = p 4 = 1/4H1 : alguna igualdad de las anteriores no se cumple.

    Donde: p1: probabilidad esperada de elegir la direccin (0; 90]p2: probabilidad esperada de elegir la direccin (90;180]p3: probabilidad esperada de elegir la direccin (180;270]p4: probabilidad esperada de elegir la direccin (270;360]

    El nivel de significacin es del 5%

    El estadstico de prueba a utilizar es:2

    1

    22( -1)

    ( - )k

    k

    iik

    i

    E k N clases

    E

    O

    =

    = =

    La regin crtica es unilateral derecha , siendo el valor crtico :2(4-1);0,95 7,81 = , resultando como regin

    crtica los valores de 2 7,81

    Grficamente:

    RECHAZO H0 si0

    2

    H 7,81

    La regla de decisin es:NO RECHAZO H0 si

    0

    2H < 7,81

    Informacin:Dado que p i = 1/4 para i = 1, 2, 3, 4; resulta que e i= n*p i = 60*1/4 = 15 para i = 1, 2, 3, 4.

    Por lo tanto el clculo del estadstico es:

    ( ) ( ) ( ) ( )0

    2 2 2 2

    2 12 15 16 15 17 15 15 15 9 1 4 140 0,9315 15 15 15 1515 15 15

    H

    = + + + = + + + = =

    Conclusin: Con un nivel de significacin del 5%, no existen evidencias suficientes para rechazar H 0 (p1 =p2 = p 3 = p 4 = 0,25), o sea que en la poblacin se puede decir que se cumple el modelo terico de que lascuatro direcciones de vuelo (0; 90]; (90; 180]; (180; 270] y (270;360] son igualmente probables . Porlo tanto, la direccin de vuelo de las palomas estara distribuida uniformemente en la poblacin de palomasque han sido desorientadas.

    PROBLEMAS PROPUESTOS01.- En la localidad A se realiz una colecta de la especie S. Un examen de los 167 machos adultosrecogidos revel que 35 de ellos tienen bandas color plido alrededor del cuello. De la localidad B, situadaa 90 Km, se obtiene una muestra de 27 machos adultos de la misma especie, de los que 6 tienen bandasy en la localidad C, situada a 150 Km, en una muestra de 79 machos adultos de la misma especie, 17tienen bandas. Pertenecen las muestras a la misma poblacin? Justifique estadsticamente su respuesta( =0,01).

    02.- En un estudio anatmico de ulceraciones gstricas benignas y malignas, se analizaron losantecedentes de todos los pacientes con tales ulceraciones que fueron autopsiados entre 1975 y 1985.

  • 8/7/2019 Estadistica Analitica Gui 2011

    39/100

    34

    Solamente se examinaron pacientes con 50 aos o ms de edad, pues es en estos individuos en quienesel diagnstico diferencial ofrece mayores dificultades, resultando:

    Clasificacin de pacientes con ulceracin gstricade acuerdo con el lugar de la lcera y el estado de malignidad.

    ESTADO DE MALIGNIDAD

    LUGAR DE LA LCERA Benigna Maligna TotalPrepilrica 87 34 121Cuerpo 52 19 71Cardias 11 8 19Total 150 61 211

    Realizar con estos datos la prueba de asociacin entre el lugar de la lcera y el estado de malignidad, a unnivel de significacin del 5%.

    03.- Se desea analizar si el tenor de la fosfatasa alcalina en casos de hepatitis humana vara segn laedad. Se tomaron enfermos de distintas edades que se agruparon en tres clases, y se midi el tenor defosfatasa alcalina. Los resultados fueron:

    Niveles de FosfatasaEdad Menos de 20 UI 20 UI o msMenos de 20 aos 11 4920 a 40 aos 15 45Ms de 40 aos 20 40

    Influye la edad sobre el tenor de fosfatasa alcalina? Concluir al nivel del 5%

    04.- Se realiza un experimento entre dos cobayos heterocigotas (AaBb) en los cuales A determina elpelaje negro y a determina el pelaje blanco, mientras que B determina el pelo corto y b el pelo largo. Seobtuvieron las siguientes frecuencias fenotpicas:

    Pelaje negro y corto 85Pelaje negro y largo 28Pelaje blanco y corto 35Pelaje blanco y largo 12

    Puede considerarse que la segregacin de la descendencia est en una proporcin de 9:3:3:1, a un niveldel 5%?

    05.- Se arroja 48 veces un dado con los siguientes resultados:Resultado 1 2 3 4 5 6Frecuencia 11 5 8 15 1 8

    Puede considerarse el dado equilibrado con un nivel de significacin del 5%?

    06.- Para investigar si el dosaje de transaminasa en casos de hepatitis de tipo A est asociado con laedad, se tomaron sesenta historias clnicas de pacientes registrados en un hospital en un perododeterminado y se las clasific por grupo de edad y por dosaje de transaminasa, obtenindose la siguientetabla:

    DOSAJE DE TRANSAMINASAEDAD (AOS) 15 - 30 30 45 ms de 45Menos de 18 10 6 518 a 35 aos 8 7 5Ms de 35 aos 9 7 5

    a) Plantear las hiptesis nula y alternativab) Indicar la zona crtica (Use =0,05)c) Detallar los pasos a seguir para calcular el valor esperado de la celda (2;3) bajo la hiptesisnula.

  • 8/7/2019 Estadistica Analitica Gui 2011

    40/100

  • 8/7/2019 Estadistica Analitica Gui 2011

    41/100

    36

    a.1.- ambas cuantitativas continuasa.2.- ambas cuantitativas discretasa.3.- ambas cualitativasa.4.- al menos una cualitativaa.5.- ninguna de las situaciones anteriores

    b.- La regin crtica es:b.1.- unilateral derechab.2.- unilateral izquierdab.3.- bilateral

    c.- El valor esperado de la celda que se encuentra en la interseccin de la primera fila con la segundacolumna se calcula como:c.1. - = 1212 * npe

    c.2. - 2112 * = npe

    c.3. - = nppe ** 2112 c.4. - Ninguna de las situaciones anteriores

    En una prueba de HOMOGENEIDAD El valor esperado de la celda que se encuentra en la interseccin de la primera fila con la segunda colum-na se calcula, si las poblaciones estn ordenadas por columnas, como:

    a.1. - = 1212 * npe

    a.2. - 2112 * = npe

    a.3. - = nppe ** 2112 a.4. - Ninguna de las situaciones anteriores

    6.- Para una dcima de bondad de ajuste se concluy de la siguiente forma: Con un nivel de significa-cin del 1% se tiene evidencia suficiente para rechazar H 0, por lo tanto la poblacin de vacas Shorthornse