Upload
freddy-quispe-supo
View
255
Download
0
Embed Size (px)
Citation preview
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
1/163
1
XLStatisticsANLISIS ESTADSTICO CON EXCEL
La informacin independientemente de lo costosa que haya sido crearla, puede ser replicada ycompartida a un costo mnimo o nulo. -- Thomas Jefferson
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
2/163
i
Contenido
Qu es estadstica? ...................................................................................................................... 1Exactitud y precisin ....................................................................................................................... 1Variables: medicin y clasificacin .................................................................................................. 2
Variables cualitativas ................................................................................................................ 2Variables cuantitativas ............................................................................................................. 3
El proceso de investigacin ............................................................................................................. 4Terminologa ................................................................................................................................... 5Prueba de hiptesis: Error tipo I y II ............................................................................................... 12Sugerencias para el anlisis de datos ........................................................................................... 13Estadstica: Software gratuito ........................................................................................................ 13Qu es XLSTatistics? .................................................................................................................. 16Instalacin ..................................................................................................................................... 17Desinstalacin ............................................................................................................................... 17XLStatistics: interfaz grafica y funciones ....................................................................................... 17Otros complementos gratuitos para anlisis estadstico en Excel .................................................. 23Complementos comerciales para Excel ......................................................................................... 23Programas gratuitos y en lnea para anlisis estadstico ............................................................... 24Sitios de inters ............................................................................................................................. 25
Anlisis de una variable numrica (variable cuantitativa discreta continua) ................................ 28Data and Description: Datos y su descripcin ........................................................................ 29Summaries: Sntesis de datos (Tabla de frecuencia y grficos).............................................. 30
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
3/163
ii
Summaries: Tabla de frecuencia y grficos ............................................................................ 39Tests: Intervalo de confianza y prueba de hiptesis para proporciones (N grande) ................ 39
Anlisis de poder y determinacin de tamao de muestra ...................................................... 40
Anlisis de error marginal para IC de proporciones ................................................................ 40Intervalo de confianza y prueba de hiptesis para proporciones (muestras pequeas) .......... 40 Prueba de Bondad de ajuste (ji-cuadrado) ............................................................................. 41Prueba de corridas o de WaldWolfowitz ............................................................................... 41
Anlisis de dos variables numricas (continuas discretas): Correlacin y regresin simple ........ 43Conceptos bsicos sobre regresin lineal simple ................................................................... 44Data and Description: Datos y su descripcin ........................................................................ 45
Anlisis de correlacin y regresin lineal ................................................................................ 45Prueba de hiptesis (intercepto, pendiente) ........................................................................... 45
Anlisis de varianza: significancia del modelo ........................................................................ 46Anlisis de residuos: Evaluacin de los supuestos del modelo............................................... 46Intervalo de prediccin y banda de prediccin ........................................................................ 50Herramientas adicionales ....................................................................................................... 50
Ajuste de funciones ................................................................................................................ 51Transformaciones lineales ...................................................................................................... 51Ecuacin polinomial ............................................................................................................... 51Regresin no lineal ................................................................................................................. 51Cambio de pendiente (tendencia) en el set de datos .............................................................. 52Media mvil ............................................................................................................................ 52Media con barras bandas de error ....................................................................................... 53Regresin lineal localmente ponderada 53
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
4/163
iii
Supuestos del ANOVA ........................................................................................................... 69Prueba sobre intercepto en modelo ........................................................................................ 71
Anlisis de residuos ............................................................................................................... 71
Anlisis de varianza no paramtrico de 1 va (Kruskal-Wallis) ................................................ 72Prueba de Hartley (comparacin de varianzas) ...................................................................... 72
Anlisis de varianza de una va en lnea con StatGraphics .................................................... 73Comparacin de dos grupos (2 muestras independientes) ..................................................... 79Prueba F de igualdad de varianzas (Nio Vs Nia) ................................................................ 79
Anlisis de residuos ............................................................................................................... 80Anlisis de poder de la prueba t ............................................................................................. 81Anlisis de poder marginal de la prueba t ............................................................................... 81Prueba de Mann-Witney (diferencia entre medianas de 2 muestras independientes) ............. 81 Prueba de hiptesis entre dos medias utilizando el mtodo de aleatorizacin........................ 82Prueba de hiptesis entre dos medianas utilizando el mtodo de aleatorizacin .................... 82Ejercicio ................................................................................................................................. 84
Anlisis de dos variables nominales (variables cualitativas) .......................................................... 85Datos y estadsticos descriptivos ............................................................................................ 85Tabla y grafico de frecuencia ................................................................................................. 86Prueba de Ji-cuadrado (de Pearson): Prueba de independencia............................................ 86Chi Square for R by C Table .................................................................................................. 87Prueba de diferencia entre dos proporciones (muestras grandes) .......................................... 87
Anlisis de poder de la prueba (diferencia entre dos proporciones) ....................................... 88Anlisis de poder marginal de la prueba (diferencia entre dos proporciones) ......................... 88Diferencia entre dos proporciones (muestras pequeas) 88
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
5/163
iv
Anlisis de residuos ............................................................................................................. 102Estadsticos descriptivos por variable ................................................................................... 103Grfico de medias ................................................................................................................ 104
Ajuste de funciones .............................................................................................................. 104Suavizado ............................................................................................................................ 104Grfico de media para grupos .............................................................................................. 105Regresin localmente ponderada ......................................................................................... 105
Anlisis de tres o ms variables numricas ................................................................................. 106Datos .................................................................................................................................... 1071: Estadsticos y grafica por variable .................................................................................... 107Estadsticos descriptivos por variable ................................................................................... 107Resumen grafico por variable ............................................................................................... 1072: Anlisis de correlacin y regresin lineal .......................................................................... 108Matriz de correlacin grfica ................................................................................................ 108Matriz de correlacin lineal (Coef. Pearson) ......................................................................... 109Diagrama de dispersin multivariable ................................................................................... 109Regresin lineal multiple ...................................................................................................... 109
Anlisis de residuos ............................................................................................................. 110Correccin por correlacin serial (resago 1) ......................................................................... 111
Anlisis de varianza (significancia de modelo de regresin) ................................................. 112Comparacin de modelos ..................................................................................................... 113Prediccin o estimacin........................................................................................................ 113Mediciones repetidas ........................................................................................................... 114Regresin no lineal 115
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
6/163
v
Anexo 3: Prueba de hiptesis: una muestra, dos muestras, tres o ms muestras ....................... 129Anexo 4: Eleccin de una prueba estadstica .............................................................................. 138Anexo 5: Comparacin de paquetes estadsticos ........................................................................ 144
Anexo 6: Software gratuito .......................................................................................................... 156
Visite http://smestorage.com/users/jfallas56 para descargar otros documentos sobreGeotecnologas, ambiente y recursos naturales.
http://smestorage.com/users/jfallas56http://smestorage.com/users/jfallas567/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
7/163
1
Qu es estadstica?La estadstica es el arte-ciencia de tomar decisiones ante situaciones concretas y a la luz de
informacin o datos parciales. En otras palabras, es tomar decisiones bajo condiciones deincertidumbre. La estadstica naci en las sociedades antiguas para resolver un problema muyconcreto: colectar datos y crear informacin sobre aspectos tales como produccin, poblacin, eimpuestos; elementos esenciales para gobernar una nacin o un imperio. Este primer aspecto de laestadstica todava persiste y es lo que se conoce como estadstica descriptiva.
Desde el punto de vista de su aplicacin a trabajos cientfico-matemticos, la estadstica se originalrededor de 1925 con la publicacin de Fisher "Mtodos estadsticos para investigadores". Estapublicacin marc el inicio de la estadstica inferencial. Gracias a esta publicacin y a posteriorestrabajos de otros cientficos la estadstica juega un papel esencial en las ciencias naturales y socialesdonde las leyes de causa y efecto no pueden deducirse a partir de observaciones individuales.
Formalmente, la estadstica puede definirse como una ciencia con un componente terico y otroaplicado que consiste en crear, desarrollar, y aplicar tcnicas o instrumentos que nos permitan evaluarel grado de incertidumbre o error de nuestras generalizaciones. Por ejemplo, si deseamos conocer eldimetro medio a la altura del pecho (dap) de una plantacin de roble de 10 hectreas, ubicada en SanJos de la Montaa, debemos decidir acerca del tamao de la muestra y el mtodo de seleccin; y una
vez colectados los datos hay que seleccionar los estadsticos y tablas a utilizar para generalizar losresultados a la plantacin (inferencia). Finalmente, debemos indicar el grado de confiabilidad denuestros resultados o en otras palabras que tan seguros estamos de nuestra estimacin.
No existe ninguna medida perfecta y por tanto, todas las mediciones contienen algn grado deerror; de donde se desprende que para extraer la informacin de las mediciones es necesario analizarlos errores. Los errores se agrupan en dos grandes categoras: el sesgo o error sistemtico que puedemodelarse utilizando una ecuacin que describe las mediciones, lo que permite eliminar o reducirsignificativamente su efecto; y el ruido o error aleatorio, el cual no se puede modelar, pero cuyaspropiedades estadsticas se pueden utilizar para optimizar los resultados del anlisis.
Exactitud y precisinComo se mencion previamente toda medicin tiene un error; sin embargo con frecuencia se
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
8/163
2
Figura 1: Conceptos de exactitud y precisin. Observe que una medicin puede tener una altaprecisin y un bajo sesgo o error; sin embargo tambin puede tener una alta precisin y un alto sesgoo error. Lo deseable es una alta precisin y un error mnimo.
Variables: medicin y clasificacinPara utilizar la estadstica (descriptiva e inferencial) el investigador(a) debe medir la variable que
desea analizar. La medicin es el procedimiento utilizado para asignar valores a la variable de talforma que satisfaga las condiciones necesarias para su posterior anlisis. La Real Academia Espaola(http://www.rae.es/rae.html ) define el verbo medir como comparar una cantidad con su respectivaunidad, con el fin de averiguar cuntas veces la segunda est contenida en la primera . La escala demedicin es el contexto o marco de referencia bajo el cual se realizan las mediciones; todo medicin
pertenece a una de las siguientes cuatro escalas: nomina l , ordinal , in tervalo y razn. Para decidircul prueba estadstica puede aplicarse a un set de datos es necesario conocer su escala de medicin(Error! No se encuentra el origen de la referencia.). A su vez, las variables pueden agruparsen cualitativas y cuantitativas.
http://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.html7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
9/163
3
Sin embargo, el valor numrico no indica la precedencia de un tipo de vegetacin sobre el siguiente;por ejemplo, el bosque hmedo no es mayor que el bosque seco.
Escala ordinalEn el nivel de medicin ordinal las variables se miden de acuerdo a su tamao, valor relativo u
orden natural. Esta escala de medicin no permite determinar la magnitud de la desigualdad entrecategoras contiguas. Por ejemplo, las especies forestales de Costa Rica pueden clasificarse deacuerdo a la densidad de su madera en muy pesadas, pesadas, livianas y muy livianas; sin embargoesta clasificacin no indica cunto ms densa es la madera de la primera clase comparada con lasegunda o la ltima. Las variables numricas o cuantitativas puedes expresarse como variableordinales utilizando cuantiles, percentiles u otro criterio definido por el usuario(a). Por ejemplo, losdatos de la variable densidad de la madera pueden dividirse en 5 catego ras utilizando quintiles y deesta manera saber cunto ms densa o menos densa es una madera de una categora con respecto acualquier otra.
La escala de actitud de Likert es un caso especial de una escala de medicin ordinal que confrecuencia es analizada como una variable cuantitativa. La escala, formada por cinco clases ocategoras, fue diseada con el fin de que las valoraciones sigan una progresin aritmtica como semuestra a continuacin:
Cuadro 1: Escala de actitud de Likert.
Valores de la escala Valores de la escala Valores de la escala-2 Totalmente en desacuerdo 5 Totalmente en desacuerdo A Totalmente en desacuerdo-1 En desacuerdo 4 En desacuerdo B En desacuerdo0 Indiferente, indeciso oneutro
3 Indiferente, indeciso oneutro
C Indiferente, indeciso oneutro
1 De acuerdo 2 De acuerdo D De acuerdo2 Totalmente de acuerdo 1 Totalmente de acuerdo E Totalmente de acuerdo
Observe que a diferencia de las variables numricas o cuantitativas, en la cual los nmeros tienenun orden natural en la escala de Likert los nmeros o letras asignados a cada categora son solo
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
10/163
4
El cociente de una razn para observaciones a un nivel de medicin de intervalo no tienen sentido oexplicacin lgica. Por ejemplo, una temperatura de 30oC no es dos veces ms caliente que una de
15
o
C, en tanto que un rbol de 30 metros s es dos veces ms alto que uno de 15 metros. En amboscasos, el cociente es 2 (30/15=2); sin embargo el cero (0) en la escala de grados centgrados es ficticioo sea un punto arbitrario en tanto que en la escala lineal es verdadero. Cualquier operacinmatemtica puede utilizarse e interpretarse en observaciones a un nivel de medicin de razn. Paraobservaciones a un nivel de intervalo slo tienen sentido la suma, la resta y la multiplicacin (cuadro2).
Cuadro 2: Escalas de medicin y operaciones matemticas que las caracterizan.
Escala de medicin Operaciones matemticas permitidasRazn 1. Equivalencia (=)
2. Desigualdad ()3. Razn de dos intervalos tiene sentido. (a_b/c_d= e)4. Razn de dos valores tiene sentido ( a/b= c)
Intervalo 1. Equivalencia (=)2. Desigualdad ()3. Razn de dos intervalos tiene sentido. (a_b/c_d =e)
Ordinal 1. Equivalencia (=)2. Desigualdad ()Nominal 1. Equivalencia (=)
Variables circularesLas variables circulares son un tipo especial de variables cuantitativas que representan ciclos. En
estas variables, el valor ms grande y el ms pequeo se encuentra uno al lado del otro y el puntocero es arbitrario. Algunos ejemplos de variables circulares son: hora del da (0-24), meses del ao(enero a diciembre) y la direccin de la brjula (0o-360o). Si se utiliza solo parte del ciclo, una variablecircular se convierte en una variable lineal. Por ejemplo, cuando usted utiliza la variable tiempo y lamide como el nmero das entre dos eventos.
Si su variable es realmente circular (e g distancia y direccin de vuelo de las aves) existen pruebas
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
11/163
5
someter a prueba sus hiptesis. En el proceso de investigacin se pueden reconocer los siguienteselementos (ver figura 2):
A. Mundo real: La real que se estudia.B. Preguntas. Lo que deseamos responder mediante el proceso de investigacin. Involucra la
revisin de estudios previos (revisin del estado del conocimiento). Formulacin de preguntas ehiptesis de trabajo.
C. Poblaciones/muestras/variables : Transformacin del mundo real en elementos estadsticos quepuedan ser medidos.
D. Medicin: Proceso e instrumentos utilizados para recabar datos del objeto de inters.E. Anlisis de datos: Mtodos y procedimientos utilizados para transformar los datos en
informacin. Someter a prueba hiptesis (diseo experimental/Observacional).A. Decisin: Posicin del investigador(ara) frente a los resultados de su estudio y reformulacin de
hiptesis.B. Aplicacin: Accin sobre el mundo real
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
12/163
6
Variables externas responden a la pregunta "Cules variables no consideradas en el anlisispueden mediar en el efecto de la variable independiente en la variable dependiente? "
Dado que la mayora de las variables presentan algn grado de correlacin es preferible utilizar lostrminos variable respuestay variable explicativa.
Mediciones repetidas: Las mediciones repetidas se obtienen en un grupo de sujetos o muestras que semiden antes y despus de aplicar un tratamiento (e.g. se mide variable respuesta en el sujeto antesde un tratamiento y luego despus de aplicar el tratamiento). Por lo tanto, cada sujeto o muestra actacomo su propio control y por esta razn las dos mediciones no son independientes.
Los grupos son establecidos por el emparejamiento de sujetos o muestras utilizando comoreferencia algn tipo de relacin natural entre los sujetos o muestras de cada par. Por ejemplo, lascompetencias de cada trabajador en el rea social podran compararse con las de su padre/madre.Cada persona podra ser emparejada con su padre/madre en este diseo y debido a esta relacinnatural, las mediciones no son independientes.
Un diseo emparejado de participantes se emplea cuando los participantes se emparejan basadosen resultados similares en una prueba previa. Una persona de cada pareja es asignada al grupo
experimental (por ejemplo, el grupo que recibi algn tratamiento) y el otro es asignado al grupocontrol (que no recibe el tratamiento). El objetivo del diseo es controlar por diferencias en losindividuaos. Por ejemplo, podramos querer controlar la variable inteligencia en la evaluacin de losefectos de una droga sobre la memoria. En primer lugar, se podra medir el IQ de los participantes yluego compararlas en base a su ndice de inteligencia antes de asignar aleatoriamente a uno a ladroga y el otro a la condicin sin la droga.
Poblacin: Es el total o universo al cual se desea aplicar la inferencia o conclusin del estudio.
Muestra: Es una parte o porcin de la realidad bajo estudio.
Deduccin: A partir del todo (poblacin) se deriva una afirmacin que aplica a una condicin particular(muestra).
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
13/163
7
Variable respuesta: Es aquella propiedad o cualidad de la unidad experimental que se mide. Para
mayor detalle sobre el tema ver pg.6.Repeticin: Rplica estadsticamente independiente de un tratamiento. Cuando el tratamiento esaplicado a varias unidades experimentales independientes; cada aplicacin brinda una estimacinindependiente de la respuesta del sujeto experimental al tratamiento. Cuantas ms rplicas se tengamejor ser la estimacin del error experimental. En la mayora de los casos se recomienda un mnimode tres observaciones independientes por tratamiento. La seudo replicacin es el resultado demuestrear dos o ms veces la misma condicin (muestras no independientes). Por ejemplo, al evaluarla densidad de peces en dos ros; uno contaminado y otro no, si se muestrean 5 sitios al azar en cada
uno de ellos, dichas muestras no representan rplicas ya que se est muestreando el mismo ro. En elsentido estadstico para que se consideren rplicas debera de elegirse al azar dos o ms ros porcondicin (contaminado-no contaminado) y luego obtener muestras independientes de cada uno deellos. Esto permitira estimar la variabilidad natural de cada uno de los sistemas acuticos en loscuales viven los peces que se muestrean. Aun cuando el anlisis de los datos presupone la existenciade rplicas independientes, en la mayora de los estudios en el rea de recursos naturales no esposible cumplir con este supuesto.
Cuasi o seudo experimento: Estudio en el cual se utilizan los principios propuestos por Fisher para eldiseo de experimentos; sin embargo, por diversas razones prcticas, no es posible asignar lostratamientos en forma aleatoria. Este tipo de estudios es comn en el rea de ecologa y en general enestudios de tipo observacional.
Significancia estadstica: Esta es una regla que permite afirmar que la diferencia observada entre doso ms tratamientos es el resultado del efecto del tratamiento y no del azar. Con frecuencia se declarancomo significativas aquellas diferencias que tienen una probabilidad inferior a 0.05 (o sea 5%) deocurrir en forma aleatoria. En algunos textos de estadstica se recomienda utilizar un asterisco (*) para
designar las diferencias significativas a un 5% (P
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
14/163
8
La accin y el efecto de separar un todo en los elementos que lo componen con el objeto de estudiarsu naturaleza, funcin o significado (http://es.wiktionary.org/wiki/ ).
La accin y el efecto de identificar, distinguir y clasificar diferentes aspectos integrantes de un campode estudio, examinando qu relaciones guardan entre ellos y como quedara modificado el conjunto sise eliminara o se aadiera algn aspecto a los previamente identificados (http://es.wiktionary.org/wiki/ ).
Documento que revisa, separa o hace un resumen de los elementos o principios de un tema o de unaobra (http://es.wiktionary.org/wiki/ ).
Distincin y separacin de las partes de un todo hasta llegar a conocer sus principios o elementos
(http://www.rae.es/rae.html ).
CienciaConocimiento estructurado y sistemtico de las cosas por sus principios y causas; Conjunto deconocimientos que constituyen una rama del saber humano (http://es.wiktionary.org/wiki/ ).
Conjunto de conocimientos obtenidos mediante la observacin y el razonamiento, sistemticamenteestructurados y de los que se deducen principios y leyes generales (http://www.rae.es/rae.html ).
ConocerSaber de la existencia de una cosa (http://es.wiktionary.org/wiki/ ).
Averiguar por el ejercicio de las facultades intelectuales la naturaleza, cualidades y relaciones de lascosas (http://www.rae.es/rae.html ).
ConocimientoResultado de la accin de conocer. Comprensin, entendimiento, inteligencia, razn
(http://es.wiktionary.org/wiki/ )
Accin y efecto de conocer; entendimiento, inteligencia, razn natural ello (http://www.rae.es/rae.html ).
http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://es.wiktionary.org/wiki/http://www.rae.es/rae.htmlhttp://es.wiktionary.org/wiki/http://www.rae.es/rae.htmlhttp://es.wiktionary.org/wiki/http://www.rae.es/rae.htmlhttp://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
15/163
9
Una conviccin es una creencia de la que un cierto individuo opina que dispone de suficiente evidenciapara considerarla cierta. La diferencia entre una simple creencia y una conviccin, es que en el primer
caso el individuo puede no tener evidencia suficiente para justificar su veracidad, mientras que en elsegundo el individuo si la considera probada, con independencia de que exista evidencia cientfica ointersubjetiva incontrovertible de que dicha conviccin es verdadera (http://es.wikipedia.org/wiki/Saber).
Idea religiosa, tica o poltica a la que se est fuertemente adherido.(http://www.rae.es/rae.html ).
CreenciaAlgo en lo que se cree, confianza en que algo existe o que es cierto.
(http://es.wiktionary.org/wiki/ ).
Una creencia es una proposicin o conjunto de ellas, que un cierto individuo considera ciertas, peropara la que en general no existe evidencia intersubjetiva suficiente para considerarla conocimientopropiamente dicho. Una creencia puede ser acertada o equivocada. Sin embargo, aunque en el usocontidiano al oponer "creencia" y "conocimiento", el primero se usa frecuentemente con el sentido deproposiciones que alguien considera ciertas, pero de la que existe evidencia de estar equivocadas oser indemostrables(http://es.wikipedia.org/wiki/Saber).
Firme asentimiento y conformidad con algo; completo crdito que se presta a un hecho o noticia comoseguros o ciertos; religin, doctrina (http://www.rae.es/rae.html ).
CriterioNorma para conocer la verdad (http://www.rae.es/rae.html ).Juicio o discernimiento (http://www.rae.es/rae.html ).
Evaluar
Sealar el valor de algo (http://www.rae.es/rae.html ).Estimar, apreciar, calcular el valor de algo (http://www.rae.es/rae.html ).Estimar los conocimientos, aptitudes y rendimiento de los alumno (http://www.rae.es/rae.html ).
http://es.wikipedia.org/wiki/Saberhttp://es.wikipedia.org/wiki/Saberhttp://es.wikipedia.org/wiki/Saberhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wikipedia.org/wiki/Saberhttp://es.wikipedia.org/wiki/Saberhttp://es.wikipedia.org/wiki/Saberhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://es.wikipedia.org/wiki/Saberhttp://es.wiktionary.org/wiki/http://www.rae.es/rae.htmlhttp://es.wikipedia.org/wiki/Saber7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
16/163
10
InformacinComunicacin o adquisicin de conocimientos que permiten ampliar o precisar los que se poseen
sobre una materia determinada (http://www.rae.es/rae.html).Conocimientos as comunicados o adquiridos (http://www.rae.es/rae.html ).
La informacin es un fenmeno que proporciona significado o sentido a las cosas. En sentido general,la informacin es un conjunto organizado de datos procesados, que constituyen un mensaje sobre undeterminado ente o fenmeno. Los datos se perciben, se integran y generan la informacin necesariapara producir el conocimiento que es el que finalmente permite tomar decisiones para realizar lasacciones cotidianas que aseguran la existencia. La sabidura consiste en determinar correctamente
cundo, cmo, dnde y con qu objetivo emplear el conocimiento adquirido(http://es.wikipedia.org/wiki/Informaci%C3%B3n ).
HerramientaObjeto o aparato, normalmente artificial, que se emplea para facilitar o posibilitar un trabajo, ampliandolas capacidades naturales del cuerpo humano. Sinnimos: instrumento, utensilio
Principales caractersticas de la informacinSignificado (semntica)Importancia (relativa al receptor)Vigencia (en la dimensin espacio-tiempo)Validez (relativa al emisor)Valor (activo intangible voltil)Polimorfismo
http://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://es.wikipedia.org/wiki/Informaci%C3%B3nhttp://es.wikipedia.org/wiki/Informaci%C3%B3nhttp://es.wikipedia.org/wiki/Informaci%C3%B3nhttp://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wikipedia.org/wiki/Informaci%C3%B3nhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.html7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
17/163
11
PercepcinLa percepcin es la funcin psquica que permite al organismo, a travs de los sentidos, recibir,
elaborar e interpretar la informacin proveniente de su entorno(http://es.wikipedia.org/wiki/Percepci%C3%B3n ).
Accin y efecto de percibir (http://www.rae.es/rae.html).Sensacin interior que resulta de una impresin material hecha en nuestros sentidos.(http://www.rae.es/rae.html ).
Conocimiento, idea (http://www.rae.es/rae.html ).
ProcedimientoEl o un procedimiento es el modo de ejecutar determinadas acciones que suelen realizarse de lamisma forma, con una serie comn de pasos claramente definidos, que permiten realizar unaocupacin o trabajo correctamente. (http://es.wiktionary.org/wiki/ )
Mtodo de ejecutar algunas cosas (http://www.rae.es/rae.html ).
Saber
Conjunto de conocimientos, adquiridos mediante el estudio o la experiencia, sobre alguna materia,ciencia o arte. Sinnimo: sabidura, erudicin (http://es.wiktionary.org/wiki/ ).
Conocer algo, o tener noticia o conocimiento de ello (http://www.rae.es/rae.html )
SabiduraConocimiento de las ciencias y artes (http://es.wiktionary.org/wiki/ ).
Prudencia en la forma de actuar (http://es.wiktionary.org/wiki/ ).
Grado ms alto del conocimiento; conducta prudente en la vida o en los negocios; conocimientoprofundo en ciencias, letras o artes (http://www.rae.es/rae.html ).
http://es.wikipedia.org/wiki/Percepci%C3%B3nhttp://es.wikipedia.org/wiki/Percepci%C3%B3nhttp://es.wikipedia.org/wiki/Percepci%C3%B3nhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://www.rae.es/rae.htmlhttp://es.wiktionary.org/wiki/http://www.rae.es/rae.htmlhttp://es.wiktionary.org/wiki/http://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://es.wikipedia.org/wiki/Percepci%C3%B3n7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
18/163
12
condiciones. Las teoras adems permiten ser ampliadas a partir de sus propias predicciones, eincluso ser corregidas, mediante ciertas reglas o razonamientos, siendo capaces de explicar otros
posibles hechos diferentes de los hechos de partida de la teora.(http://es.wikipedia.org/wiki/Teor%C3%ADa )
En ciencia, se llama teora tambin a un modelo para el entendimiento de un conjunto de hechosempricos. Enfsica,el trmino teora generalmente significa una infraestructura matemtica derivadade un pequeo conjunto de principios bsicos capaz de producir predicciones experimentales para unacategora dada de sistemas fsicos. Un ejemplo sera la "teora electromagntica", que eshabitualmente tomada como sinnimo del electromagnetismo clsico, cuyos resultados especficospueden derivarse de lasecuaciones de Maxwell.
Prueba de hiptesis: Error tipo I y IIEl nivel de significancia se designa con la letra griega e indica cuan rara (muy grande o muy
pequea) deber ser la diferencia entre la media maestral y la media poblacional para rechazar lahiptesis nula dado que sta sea correcta. En trabajos estadsticos es usual rechazar la hiptesisnula si dicha diferencia tiene una probabilidad de ocurrencia por factores aleatorios inferior o igual al5% ( < 0.05). El valor de es un indicador del riesgo que el investigador(a) est dispuesto a asumircuando evala Ho. Por ejemplo, para un de 0.05 y aun cuando Ho sea verdadera, se espera que la
misma sea rechazada en un 5% de las veces que se ejecute el experimento. O sea, que en 5 de cada100 experimentos Ho ser rechazada an cuando sea verdadera. A este tipo de error se le denominaerror tipo I. Por otro lado, el no rechazar Ho cuando en realidad debe rechazarse se denomina errortipo II. Es comn observar en reportes cientficos valores de entre 0.1 y 0.001; al primero se ledenomina diferencia significativa y al ltimo diferencia altamente significativa.
Cuando se rechaza Ho se utiliza el trmino "significante" o estadsticamente significativo" y el resultadopuede interpretarse en el sentido de "haber aprendido algo nuevo sobre la poblacin". Por otro lado, eltrmino "no significativo" expresa el sentir de no haber aportado nuevo conocimiento de la poblacin
en estudio. Al realizar una prueba de hiptesis recuerde que muestras muy grandes tienden a rechazarHo aunque las diferencias entre grupos sean muy pequeas. De igual manera, pruebas estadsticascon un gran poder tienden a generar mayor nmero de resultados significativos (pueden detectardiferencias muy pequeas como estadsticamente significativas)
http://es.wikipedia.org/wiki/Teor%C3%ADahttp://es.wikipedia.org/wiki/Teor%C3%ADahttp://es.wikipedia.org/wiki/Teor%C3%ADahttp://es.wikipedia.org/wiki/Cienciahttp://es.wikipedia.org/wiki/Cienciahttp://es.wikipedia.org/w/index.php?title=Modelo_%28abstracto%29&action=edit&redlink=1http://es.wikipedia.org/w/index.php?title=Modelo_%28abstracto%29&action=edit&redlink=1http://es.wikipedia.org/wiki/F%C3%ADsicahttp://es.wikipedia.org/wiki/F%C3%ADsicahttp://es.wikipedia.org/wiki/F%C3%ADsicahttp://es.wikipedia.org/wiki/Electromagnetismohttp://es.wikipedia.org/wiki/Electromagnetismohttp://es.wikipedia.org/w/index.php?title=Teor%C3%ADa_cl%C3%A1sica&action=edit&redlink=1http://es.wikipedia.org/w/index.php?title=Teor%C3%ADa_cl%C3%A1sica&action=edit&redlink=1http://es.wikipedia.org/wiki/Ecuaciones_de_Maxwellhttp://es.wikipedia.org/wiki/Ecuaciones_de_Maxwellhttp://es.wikipedia.org/wiki/Ecuaciones_de_Maxwellhttp://es.wikipedia.org/wiki/Ecuaciones_de_Maxwellhttp://es.wikipedia.org/w/index.php?title=Teor%C3%ADa_cl%C3%A1sica&action=edit&redlink=1http://es.wikipedia.org/wiki/Electromagnetismohttp://es.wikipedia.org/wiki/F%C3%ADsicahttp://es.wikipedia.org/w/index.php?title=Modelo_%28abstracto%29&action=edit&redlink=1http://es.wikipedia.org/wiki/Cienciahttp://es.wikipedia.org/wiki/Teor%C3%ADa7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
19/163
13
Steiger, J.H., & Fouladi, R.T. 1997. Noncentrality interval estimation and the evaluation of statistical
models. Pp. 221-257. In Harlow, L. L., Mulaik, S. A., & Steiger, J. H. (Eds.) What if there were nosignificance tests? Mahwah, NJ: Lawrence Erlbaum Associates. Disponible en:http://www.statpower.net/Steiger%20Biblio/Steiger&Fouladi97.PDF
Sugerencias para el anlisis de datos
1. Listar variable(s) a analizar y su respectivo nivel de medicin (nominal, ordinal, intervalo,razn).
2. Cul es el historial y contexto de los datos (origen, mtodos de colecta, instrumentos
utilizados, temporalidad, limitaciones)?3. Para qu realiza usted el anlisis del set de datos? Qu se desea resaltar del set de datos?4. Describa el producto esperado o solicitado (e.g. descripcin del set de datos, prueba de una
hiptesis, comparacin de datos, ajustar un modelo).5. Seleccione el software a utilizar (e.g. Instat, XLSTatistics, PASS, otro) y realice un anlisis
exploratorio de datos.a. Anlisis grficob. Elaboracin de tablas
c. Estadsticos descriptivos6. Busque valores atpicos o extremos que podran indicar errores en la digitacin de los datos ydistribuciones asimtricas o inusuales. Concuerda la distribucin de los datos con lo que ustedesperaba?.
7. Estadstica inferencial. Selecciones las pruebas estadsticas a realizar, defina el valor designificancia a utilizar en las pruebas estadsticas.
8. Conclusiones9. Retroalimentacin
Estadstica: Software gratuitoSi usted desea explorar otros programas estadsticos gratuitos, le recomiendo visitar los siguientes
sitios.
http://www.statpower.net/Steiger%20Biblio/Steiger&Fouladi97.PDFhttp://www.statpower.net/Steiger%20Biblio/Steiger&Fouladi97.PDFhttp://www.statpower.net/Steiger%20Biblio/Steiger&Fouladi97.PDF7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
20/163
14
tamao de la muestra y clculos de potencia, nmeros aleatorios, sensibilidad, especificidad y otrasestadsticas de evaluacin, tablas FxC, chi-cuadrados para dosis-respuesta, y enlaces a otros sitios de
inters. Este software est orientado al anlisis de datos epidemiolgicos.OpenSTat Anlisis estadstico para Windows. Estadstica descriptiva e inferencial paramtrica y noparamtrica.http://statpages.org/miller/openstat/
PASTAnlisis estadstico univariado, multivariado, ndices de diversidad. Estadstica descriptiva einferencial paramtrica y no paramtrica.
PSPP. Este es un programa para el anlisis estadstico, su funcionalidad es similar al programa
comercial SPSShttp://www.jdmp.org/misc/related-software/
RemuestreoSofware para anlisis estimacin y pruebas de hiptesis utilizando remuestreo.
The R Project for Statistical Computing. Gran variedad de anlisis, muy poderoso pero requiere deusuarios experimentados. Opera en base a comandos.
WinIDAMS.Este es paquete de software para la validacin, tratamiento y anlisis estadstico de datos
desarrollado por la Secretara de la UNESCO en cooperacin con expertos de varios pases.http://portal.unesco.org/ci/en/ev.php-URL_ID=2070&URL_DO=DO_TOPIC&URL_SECTION=201.html
Referencias
Bryan F.J. Manly. Randomization, Bootstrap and Monte Carlo Methods in Biology, Third Edition.Chapman and Hall/CRC. 388p. 2006.
Bryan F.J. Manly. Statistics for Environmental Science and Management, Second Edition.Chapman &
Hall/CRC. 292p. 2008.
Cox Nicholas J. Stata Users Meeting London June 2004. Circular statistics in Stata, revisited.Department of Geography, University of Durham, Durham City, DH1 3LE, UK
http://statpages.org/miller/openstat/http://statpages.org/miller/openstat/http://statpages.org/miller/openstat/http://statpages.org/miller/openstat/http://statpages.org/miller/openstat/http://folk.uio.no/ohammer/past/http://folk.uio.no/ohammer/past/http://www.jdmp.org/misc/related-software/http://www.jdmp.org/misc/related-software/http://www.jdmp.org/misc/related-software/http://www.jdmp.org/misc/related-software/http://www.jdmp.org/misc/related-software/http://www.uvm.edu/~dhowell/StatPages/Resampling/Resampling.htmlhttp://www.uvm.edu/~dhowell/StatPages/Resampling/Resampling.htmlhttp://www.r-project.org/http://www.r-project.org/http://portal.unesco.org/ci/en/ev.php-URL_ID=2070&URL_DO=DO_TOPIC&URL_SECTION=201.htmlhttp://portal.unesco.org/ci/en/ev.php-URL_ID=2070&URL_DO=DO_TOPIC&URL_SECTION=201.htmlhttp://portal.unesco.org/ci/en/ev.php-URL_ID=2070&URL_DO=DO_TOPIC&URL_SECTION=201.htmlhttp://portal.unesco.org/ci/en/ev.php-URL_ID=2070&URL_DO=DO_TOPIC&URL_SECTION=201.htmlhttp://portal.unesco.org/ci/en/ev.php-URL_ID=2070&URL_DO=DO_TOPIC&URL_SECTION=201.htmlhttp://portal.unesco.org/ci/en/ev.php-URL_ID=2070&URL_DO=DO_TOPIC&URL_SECTION=201.htmlhttp://www.r-project.org/http://www.uvm.edu/~dhowell/StatPages/Resampling/Resampling.htmlhttp://www.jdmp.org/misc/related-software/http://www.jdmp.org/misc/related-software/http://folk.uio.no/ohammer/past/http://statpages.org/miller/openstat/http://statpages.org/miller/openstat/7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
21/163
15
Stata Users Meeting London June 2004. Circular statistics in Stata, revisited. Nicholas J. CoxDepartment of Geography, University of Durham, Durham City, DH1 3LE, UK. 4p.
Wonnacott, Thomas H. y Ronald J. Wonnacott.. Introductory statistics. Third Edition. New York, JohnWilley & Sons. 650p. 1977.
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
22/163
16
Qu es XLSTatistics?XLSTatistics es un conjunto de 82 libros de Excel creados por el profesor Rodney Carr de la
Universidad Deakin, Australia (http://www.deakin.edu.au/~rodneyc/XLStatistics ). XLSTatistics opera enMicrosoft Excel 97, 2000, 2002, 2003(XP) y 2007.
Citar XLSTatistics de la siguiente manera:
Carr, R., 2009, XLStatistics 09.09.24, XLent Works, Australia. Disponible en:http://www.deakin.edu.au/~rodneyc/XLStatistics [email protected]
La pestaa de options le permite configurar las principales opciones de XLSTatistics.
mailto:[email protected]://www.deakin.edu.au/~rodneyc/XLStatisticshttp://www.deakin.edu.au/~rodneyc/XLStatisticshttp://www.deakin.edu.au/~rodneyc/XLStatisticshttp://www.deakin.edu.au/~rodneyc/XLStatisticshttp://www.deakin.edu.au/~rodneyc/XLStatisticsmailto:[email protected]:[email protected]:[email protected]:[email protected]://www.deakin.edu.au/~rodneyc/XLStatisticshttp://www.deakin.edu.au/~rodneyc/XLStatisticsmailto:[email protected]7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
23/163
17
InstalacinDescargue el archivoXLS5.zip(5 Megas).http://www.deakin.edu.au/~rodneyc/XLStatistics/XLS5.zip
Cree un directorio denominado Xlstats y descomprima el contenido del archivo XLS5.zip.Para cargar XLStatistics abra el fichero XLStatistics.xlam (Excel 2007) o XLStats.xls
(Excel 5-2003). Le sugiero crear un acceso directo en su escritorio para dicho archivo.
Guardar sus resultados. No guardar directamente el libro de trabajo de XLStatistics! Si desea copiarlos resultados de su anlisis a otra hoja de Excel, Word, o Powerpoint simplemente seleccione el reao grafico deseado cpielo y pguelo en el archivo receptor. Si lo desea tambin puede guardar el librode trabajo con otro nombre y con la opcin de macros habilitada.
DesinstalacinXLStatistics no modifica la configuracin del sistema ni la de Excel y por tanto no requiere de
desinstalacin. Para desactivar XLStatistics haga un clic sobre .
XLStatistics: interfaz grafica y funciones
En Excel 2007 los libros de trabajo se organizan mediante una cinta utilizando como criterio elnmero y tipo de variable que usted analizar:
1Num: Anlisis de una variable numrica (variable cuantitativa discreta continua).1Cat: Anlisis de una variable nominal (variable cualitativa).
2N A li i d d i bl i ( ti di t ) C l i i i l
http://www.deakin.edu.au/~rodneyc/XLStatistics/XLS5.ziphttp://www.deakin.edu.au/~rodneyc/XLStatistics/XLS5.ziphttp://www.deakin.edu.au/~rodneyc/XLStatistics/XLS5.ziphttp://www.deakin.edu.au/~rodneyc/XLStatistics/XLS5.ziphttp://www.deakin.edu.au/~rodneyc/XLStatistics/XLS5.ziphttp://www.deakin.edu.au/~rodneyc/XLStatistics/XLS5.ziphttp://www.deakin.edu.au/~rodneyc/XLStatistics/XLS5.ziphttp://www.deakin.edu.au/~rodneyc/XLStatistics/XLS5.zip7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
24/163
18
A continuacin se lista, para cada libro de trabajo, el anlisis estadstico que usted puede realizar.
Variable Anlisis estadstico
Una variable numrica(datos de una muestrasimple) 1Num
La variable puede sercuantitativa continuo
discreta.
Sntesis numrica y grfica Estadstica descriptiva (tendencia central, variabilidad y forma). Histograma, polgono de frecuencia simple y acumulada,
diagrama de cajas o de Box-Whisker, grfico de mediaaritmtica y desviacin estndar, error estndar o intervalo deconfianza.
Pruebas estadsticas Prueba t para (media) Intervalo de confianza para (media) Prueba de signos e intervalo de confianza para la mediana Prueba de Chi2para la varianza Grfico de residuos Anlisis de poder y tamao de muestra Prueba de normalidad
Una variable Cualitativa1Cat
Sntesis numrica y grfica Tabla de frecuencia y proporciones, diagramas de barras,
grfico de pastel o circular., Histograma con barras de errorpara proporciones.
Pruebas estadsticas Pruebas de proporciones para muestras grandes y pequeas Intervalo de confianza para proporciones Anlisis de poder y tamao de muestra Prueba de bondad de ajuste/Prueba de corridas
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
25/163
19
Dos variablesnumricas
2Num
Estadsticos descriptivos por variable, grfico de dispersin
Anlisis de correlacin y regresin lineal, con o sin trmino constante Estimacin de parmetros del modelo (a y b) Intervalos de confianza para a y b, prueba de hiptesis
sobre la significancia de los a los parmetros Grfico de dispersin con lnea de regresin Anlisis de varianza Anlisis de residuos Prediccin y prediccin inversa Bandas de prediccin y de estimacin
Ajuste de una funcin definida por el usuario(a) Funciones linealizables (mtodo mnimos cuadrados) Ecuaciones polinomiales Regresin no lineal (mtodo mnimos cuadrados) Regresin lineal por mnimos cuadrados para detectar un punto
de inflexin en la tendencia de la serie
Ajuste de una curva de suavizado a los datos
Media mvil (media o mediana) Medias para datos agrupados con barras / bandas de error Regresin lineal localmente ponderada - LOWESS
Anlisis de correlacin entre variables ordinales rho de Spearman tau-b de Kendall
Aadir etiquetas a los puntos en un grfico de dispersinAnlisis de series de tiempo
Media mvil Ajuste ecuacin exponencial
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
26/163
20
Una variable numrica,una variable cualitativa
1Num1Cat
Sntesis numrica y grfica Estadsticos descriptivos (tendencia central, variabilidad, forma)
Grfico de de frecuencia (absoluta, relativa, proporciones),histogramas, lneas, barras Grfico de de frecuencia por categora Grficos de caja (Box-y-Whisker) Grficos de medias con barras de error
Pruebas estadsticas Anlisis de la varianza simple o de una va (efectos aleatorios y
fijos) Prueba de intercepto del modelo Prueba de Kruskal-Wallis Anlisis de residuos Prueba de Hartley (comparacin de varianzas) Prueba t para dos muestras e intervalo de confianza para la
diferencia entre medias Prueba de Mann-Whitney Prueba F de igualdad de varianzas Anlisis de la poder y tamao de muestra Prueba de aleatorizacin para la media de dos grupos
Dos variablescualitativas2Cat
Cuadros sinpticos Frecuencia (absoluta, relativa), proporciones, % por fila o
columna, total Grficos de proporciones y porciento con barras de error (error
estndar, Intervalo de Confianza)
Pruebas estadsticas Prueba de Chi2(independencia entre grupos) Prueba sobre diferencia entre dos proporciones para muestras
pequeas
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
27/163
21
Dos variablesnumricas, una variable
cualitativa2Num1Cat
Grficos de dispersin multiseries con ejes y/o direccin permutable.
Grficos multilnea / multieje
Regresin lineal (anlisis de covarianza) Varias opciones de anlisis (con o sin trmino constante) Diagrama de dispersin con lneas de regresin Grficos de pendientes e interceptos con barras de error Pruebas de hiptesis
Ajuste de una funcin definida por el usuario(a) (grupo por grupo) Funciones linealizables con regresin lineal por mnimos
cuadrados Ecuaciones polinomiales Regresin no lineal por mnimos cuadrados Regresin lineal por mnimos cuadrados para detectar un punto
de inflexin en la tendencia de la serie
Ajuste de curva de suavizado a los datos (grupo por grupo) Media mvil (media o mediana) Medias de grupo de datos con barras / bandas de error Regresin localmente ponderadaLOWESS
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
28/163
22
n Variables numricas(regresin mltiple)
nNum
Sntesis numrico y grfico por variable Histogramas y diagramas combinados por frecuencia
Grficos mltiples de cajas (Boxplots) Grficos de medias Estadstica descriptiva
Correlacin y regresin simple (2 variables) Diagrama de dispersin y matriz de correlacin Regresin lineal de dos variables, estadsticos y pruebas de
hiptesis Grficos multilneas y multiejes
Regresin mltiple Ecuacin de regresin, estadsticos y pruebas de hiptesis Prediccin Anlisis de residuos
Grficos de residuos Prueba de Jarque-Bera para normalidad Prueba de Ramsey para evaluar omisin de trmino en el
modelo Prueba de Durbin-Watson para correlacin de residuos
Correcciones para la correlacin serial de orden uno(Cochran-Orcutt)
Prueba de Glejser para heterocedasticidad (varianzasdiferentes)
Anlisis de varianza y comparacin de modelos
Anlisis de mediciones repetidas
Grfico de caso-por-caso Grficos de medias Grficos mltiples (boxplots) Anlisis de varianza
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
29/163
23
La interfaz grafica de cada libro de Excel es prcticamente estndar, lo cual facilita su uso. Alinterior de cada libro usted puede utilizar las funciones y herramientas de Excel (e.g. fuentes: tamao,color, itlico, negrita; colores en grficos; copiar y pegar tablas y grficos a otros programas de Office;guardar libros de Excel con macros habilitados.
El (Ia) usuario(a) solo tiene que digitar, copiar y/o pegar los datos en las columnas de Data de unlibro de trabajo y el resto se hace automticamente: Sntesis numrica y grfica; anlisis estadstico(e.g. pruebas de hiptesis, intervalos de confianza, pruebas de poder, determinacin de tamao demuestra, ajustar modelos de regresin, etc.). Su tarea fundamental es decidir qu prueba deborealizar? o cmo expreso grficamente los datos?.
Nota: Usted SOLO debe modificar el contenido de las celdas con nmeros o textos en color azul.
Otros complementos gratuitos para anlisis estadstico en Excel
Regresin y diseo de experimentos: otro complemento gratuito para ExcelEssential Regression and Experimental Design for Chemists and Engineerses un complemento
gratuito para Excel que permite ajustar modelos de regresin simple, mltiple (seleccin hacia adelantey hacia atrs) y polinomiales, as como disear plantillas para experimentos.
(http://www.jowerner.homepage.t-online.de/ERPref.html ).
Regresin localmente ponderada (LOESS) http://peltiertech.com/WordPress/loess-utility-for-excel/ http://peltiertech.com/WordPress/loess-utility-awesome-update/
Complementos comerciales para Excel
Analizar-se
Este es un complemento para Excel que permite realizar anlisis exploratorio de datos, calculo deestadsticos descriptivos, ajustar modelos de regresin (simples y mltiples, polinomiales) y realizarpruebas de hiptesis paramtricas y no paramtricas (http://www.analyse-it.com).
http://www.jowerner.homepage.t-online.de/ERPref.htmlhttp://www.jowerner.homepage.t-online.de/ERPref.htmlhttp://www.jowerner.homepage.t-online.de/ERPref.htmlhttp://peltiertech.com/WordPress/loess-utility-for-excel/http://peltiertech.com/WordPress/loess-utility-for-excel/http://peltiertech.com/WordPress/loess-utility-awesome-update/http://peltiertech.com/WordPress/loess-utility-awesome-update/http://www.analyse-it.com/http://www.analyse-it.com/http://www.analyse-it.com/http://www.analyse-it.com/http://peltiertech.com/WordPress/loess-utility-awesome-update/http://peltiertech.com/WordPress/loess-utility-for-excel/http://www.jowerner.homepage.t-online.de/ERPref.html7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
30/163
24
XLMinerXLMiner es un conjunto de herramientas para minera de datos conformado tanto por mtodos
estadsticos como de aprendizaje automatizado (disciplina cientfica que disea y desarrolla algoritmosque le permiten a las computadoras discernir comportamientos basados en datos empricos). Elprograma parte de la premisa que un mismo set de datos debe analizarse utilizando diferentesenfoques para luego elegir el modelo que mejor se adapte a los datos. Entre las funciones delprograma estn: particin del set de datos, diversos mtodos de clasificacin y prediccin, anlisis deafinidad, anlisis de series de tiempo y exploracin y reduccin del set de datos. Para mayores detallessobre la funcionalidad del programa visitar:http://www.resample.com/xlminer/capabilities.html
Programas gratuitos y en lnea para anlisis estadstico
Anlisis de regresin simple y mltiple, logstica, particin recursiva (clasificacin y arboles dedecisin)
Distribuciones estadsticas Pruebas de hiptesis (medias, error tipo II y tamao de muestra) Anlisis de series de tiempo
STATGRAPHICS Onlinehttp://www.statgraphicsonline.com/index.html Usted puede digitar los datos, leer datos de varios tipos de archivos (incluyendo Excel), copiar y
pegar los conjuntos de datos de otras aplicaciones, o analizar los set de datos de StatPoint. El accesoen lnea es gratuito para sets de datos de hasta 100 filas (observaciones) por 10 columnas (variables).Para utilizar el programa debe registrarse (es gratuito).
VassarStats: Website for Statistical Computationhttp://faculty.vassar.edu/lowry/VassarStats.html
Clinical Research Calculators(Calculators 1-3. For prevalence, sensitivity, specificity, predictivevalues, likelihood ratios, etc.,Kaplan-Meier Survival Probability Estimates,Kappa as a Measure ofConcordance in Categorical Sorting,Chi-Square, Cramer's V, and Lambda for a Rows by ColumnsContingency Table McNemar's Test for Correlated Proportions in the Marginals of a 2x2 Contingency
http://www.resample.com/xlminer/capabilities.htmlhttp://www.resample.com/xlminer/capabilities.htmlhttp://www.statgraphicsonline.com/index.htmlhttp://www.statgraphicsonline.com/index.htmlhttp://www.statgraphicsonline.com/index.htmlhttp://faculty.vassar.edu/lowry/VassarStats.htmlhttp://faculty.vassar.edu/lowry/VassarStats.htmlhttp://faculty.vassar.edu/lowry/VassarStats.htmlhttp://faculty.vassar.edu/lowry/VassarStats.htmlhttp://www.statgraphicsonline.com/index.htmlhttp://www.resample.com/xlminer/capabilities.html7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
31/163
25
McNemar's Test for Correlated Proportions in the Marginals of a 2x2 Contingency Table, Fisher ExactProbability Test for Tables Larger than 2x2, Chi-Square, Cramer's V, and Lambda for a Rows byColumns Contingency Table, Log-Linear Analysis for a 3-Way Contingency Table, Kappa as aMeasure of Concordance in Categorical Sorting
Proportions (The Confidence Interval of a Proportion, The Confidence Interval for the DifferenceBetween Two Independent Proportions, Significance of the Difference Between Two IndependentProportions, McNemar's Test for Correlated Proportions in the Marginals of a 2x2 Contingency Table)
Ordinal Data (Rank-Order Correlation, Mann-Whitney Test,Wilcoxon Signed-Ranks Test, Kruskal-Wallis Test, Friedman Test)
Correlation & Regression (Basic Linear Correlation & Regression, Matrix of Intercorrelations,Multiple Regression,0.95 and 0.99 Confidence Intervals for r, Estimating the Population Value of rho onthe Basis of Several Observed Sample Values of r, Test for the Heterogeneity of Several Values ofr,The Significance of an Observed Value of r, Significance of the Difference Between Two IndependentValues of r, Significance of the Difference Between an Observed Value of r and a Hypothetical Value ofrho, First- and Second-Order Partial Correlations, Phi Coefficient of Association, Point BiserialCoefficient, Correlation for Unordered Pairs: Eta2, Intraclass Correlation, & Resampling of r, SimpleLogistic Regression)
t-Tests & Procedures (t-Tests for the Significance of the Difference Between the Means of TwoSamples (independent or correlated), Single Sample t-Test,0.95 Confidence Interval for the EstimatedMean of a Population)
ANOVA (One-Way ANOVA for Independent or Correlated Samples, Two-Way Factorial ANOVA forIndependent Samples, Two-Factor ANOVA with Repeated Measures on One Factor, Two-Factor
ANOVA with Repeated Measures on Both Factors,2x2x2 ANOVA for Independent Samples,
Orthogonal Latin Square Designs for n=j2
)
ANCOVA (One-Way ANCOVA for Independent Samples, Two-Way Factorial ANCOVA forIndependent Samples)
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
32/163
26
Citar como:(Versin electrnica): StatSoft, Inc. (2010). Libro de texto electrnico de Estadstica. Tulsa, OK:StatSoft. WEB: http://www.statsoft.com/textbook/.
(Versin impresa): Hill, T. & Lewicki, P. (2007). ESTADSTICAS Mtodos y Aplicaciones. StatSoft,Tulsa, OK
En este sitio usted puede encontrar otros programas en lnea para el anlisis de datoshttp://www.psychnet-uk.com/experimental_design/online_calculators.htm
Descripcin y anlisis grafico de datos
http://www.statsoft.com/textbook/http://www.psychnet-uk.com/experimental_design/online_calculators.htmhttp://www.psychnet-uk.com/experimental_design/online_calculators.htmhttp://www.psychnet-uk.com/experimental_design/online_calculators.htmhttp://www.statsoft.com/textbook/7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
33/163
27
Temas tratados en el libro digital.http://www.statsoft.com/textbook/
http://www.statsoft.com/textbook/http://www.statsoft.com/textbook/7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
34/163
28
Anlisis de una variable numrica (variable cuantitativa discreta continua)En la presente seccin se ilustra el uso de XLSTatistics para el anlisis de una variable numrica.
Algunos ejemplos de variables cuantitativas son: peso, volumen, precipitacin, temperatura, biomasa,conteos (e.g. numero de arboles en una parcela, numero de animales por aparto). En el men graficode XLStatisitics corresponde a 1Num.
Para iniciar la sesin haga un doble clic sobre el archivo XLStatistics.xlam si usted utiliza Excel2007 o sobre XLStats.xls si usted utiliza Excel 2000 y habilite los MACROS.
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
35/163
29
4) Tests: Pruebas estadsticas5) Extra Tools: Herramientas adicionales
Nota: Usted SOLO debe modificar el contenido de las celdas con nmeros o textos en color azul.
Data and Description: Datos y su descripcin
Data (Datos): Variable que se analiza,en este caso precipitacin anual (mm)
Description (Describir):Estadsticos descriptivos (nmero deobservaciones, media, desviacinestndar, Coef. Variacin, asimetra,mnimo, primer cuartil, mediana, tercercuartil, mximo).
Grafico de frecuencia (barras histograma). Usted puede elegir
nmero de clases, lmite inferior ysuperior de la serie estadstica.
Grafico de datos individuales.
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
36/163
30
Nota: si desea observar los valores graficados por el programa, seleccione con el puntero del ratn lagrfica y observe a la derecha de la hoja de clculo las celdas seleccionadas. Ahora seleccione dichas
celdas y asgneles un color al texto (color de la fuente) .
Summaries : Sntesis de datos (Tabla de frecuencia y grficos)
Grfico de frecuencia(barras, histograma lnea). Usted puede elegir lmite inferiory superior de la serie estadstica,decimales, nmero de clases, ttulo deleje X (punto final de clase, punto mediode clase, intervalo). Tambin puede crearuna OJIVA (Grfico de frecuenciaacumulada).
Grfico de media aritmtica: Si lo deseapuede modificar el ttulo del eje vertical.Puede adicionar al grfico de barra el
rango, desviacin estndar, errorestndar e intervalo de confianza.Recuerde que usted puede elegir el nivelde confianza.
Grfico de cajas (Box-Whisker). Ustedpuede elegir el grfico vertical o
horizontal. Si lo desea puede adicionar unttulo al eje X de la grfica.
Haga un clic sobre la flecha azul para
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
37/163
31
lluvia y en un ao determinado se presenta un huracn, la lluvia de dicho ao debe considerarse comoun evento de otra poblacin estadstica.
Tests: Pruebas estadsticasPrueba t para una muestra(requisitos muestra independiente y normalidad)
Anlisis de Residuos
Pruebas estadsticas sobre la media deuna poblacin (Prueba t de Estudiante).Puede realizar pruebas de una y doscolas (superior e inferior). Recuerde queusted debe fijar el nivel de alfa antes de
realizar la prueba.
El ejemplo ilustra la siguiente prueba dehiptesis:Ho: = 3000mHa: 3000mPara un alfa de 0.05, Ho deberechazarse y por tanto la media esdiferente de 3000 mm.
Calculo de Intervalo de Confianza parala media para un nivel de confianza de95%. Observe que el valor 3000 mm seencuentra fuera del IC.
Anlisis de residuosEl anlisis de residuos permite probar por el
supuesto de normalidad del set de datos.
Para datos normales, los residuos debenajustarse a una recta y el histograma debe
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
38/163
32
Nota: si desea observar los valores graficados por el programa, seleccione con el puntero del ratn lagrfica y observe a la derecha de la hoja de clculo las celdas seleccionadas. Ahora seleccione dichas
celdas y asgneles un color al texto (color de la fuente) . A continuacin se muestran los datospara la grfica de probabilidad normal para los residuos y para el histograma de residuos.
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
39/163
33
Prueba de Normalidad
Recuerde que usted debe fijar el nivel de alfa antes de realizar cualquier prueba estadstica.
Anlisis de poder y determinacin de tamao de muestra
Al realizar cualquier prueba de hiptesis, su decisin est sujeta a dos errores estadsticos:el error tipo I y el error tipo II. A continuacin se describe cada uno de ellos.
Tabla de decisin estadstica para una prueba de hiptesis sobre dos grupos.
Hiptesis Verdad o estado de la realidadHo (no existe diferenciaentre los dos grupos)
HI (existe diferencia entre los dosgrupos)
No se rechaza Ho
(Decisin correcta)
No se rechaza Ho (Decisin
incorrecta) y por tanto no sedetectan diferencias verdaderas. Aeste error se le denomina error tipoII y se representa con la letra
Esta prueba se utiliza para determinar si
los datos de la muestra provienen de unadistribucin normal.
La hiptesis nula es la que la muestraproviene de una poblacin normal, lahiptesis alternativa es que la muestraproviene de una poblacin no normal.
El valor de p (nivel de significancia o alfa)permite evaluar Ho. En este caso y paraun alfa de 0.05, no se rechaza Ho porqueP= 0.903.
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
40/163
34
significativos (pueden detectar diferencias muy pequeas como estadsticamente significativas).Recuerde que una diferencia estadsticamente significativa no necesariamente es una diferenciaimportante para la toma de decisiones.
Steiger, J.H., & Fouladi, R.T. 1997. Noncentrality interval estimation and the evaluation of statisticalmodels. Pp. 221-257. In Harlow, L. L., Mulaik, S. A., & Steiger, J. H. (Eds.). What if there were nosignificance tests? Mahwah, NJ: Lawrence Erlbaum Associates. Disponible en:http://www.statpower.net/Steiger%20Biblio/Steiger&Fouladi97.PDF
Cul es el error tipo II de la prueba?
Es el poder de la prueba alto o bajo?Cul es la implicacin prctica del anlisis de poder?
Esta hoja de trabajo lepermite realizar unanlisis de poder de laprueba t para unamedia obtenida de unamuestra independiente.
Recuerde que ustedpuede modificar los
nmeros en color azul.
http://www.statpower.net/Steiger%20Biblio/Steiger&Fouladi97.PDFhttp://www.statpower.net/Steiger%20Biblio/Steiger&Fouladi97.PDFhttp://www.statpower.net/Steiger%20Biblio/Steiger&Fouladi97.PDF7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
41/163
35
Pruebas no paramtricas
Mediana(Prueba de signos, prueba del signo)
Prueba de Wilcoxon para muestras pareadasPrueba de Chi-2 para la varianza
Prueba de signos (prueba de mediana)
Prueba de Chi-2 para la varianza
Prueba sobre la Mediana (prueba designos). Esta prueba no paramtrica
utiliza la distribucin binomial paradeterminar si el nmero de datos sobre ybajo la mediana es el mismo.
Describa la prueba de hiptesis.
Cul es el poder de la prueba?
Prueba de varianza (Ji-cuadrado). Usted puede comparar la varianzab d l d t i d ( U t d d l
La prueba de Wilcoxon de los rangos con signo permite compararnuestros datos con una mediana terica (por ejemplo un valor publicado en un artculo).Tambin se utiliza en muestras pareadas para mediciones repetidas en el mismo sujeto omuestra. Esta prueba es el anlogo no paramtrico de la tde Estudiante y no requiere quela diferencia entre los pares de observaciones sigan una distribucin normal.
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
42/163
36
Intervalos de tolerancia y de prediccin
Herramientas adicionales
Datos agrupados1NumGD.xls
Este libro de clculo (1NumGD.xls) le permite analizar datos agrupados (calcularestadsticos descriptivos, graficar datos y realizar una prueba t de Estudiante sobre la media).
Datos
Intervalo de tolerancia para una confianza de 95% y unacobertura de 99%.
Intervalo de prediccin para una confianza de 95%.
Recuerde que usted puede modificar los nmeros en color azul.
Si desea utilizar este libropuede digitar los siguientes
datos en su libro de Excel.
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
43/163
37
Grfico de probabilidad normal
Bajo el supuesto de distribucinnormal la tendencia de los datosdebe ajustarse a una recta.
Si los datos provienen de unadistribucin lognormal la tendenciade los logaritmos de los datos ( logPt anual) debe ajustarse a unarecta.
Usted puede elegir entre graficardesviaciones estandarizadas(valores de Z) una frecuenciaacumulada.
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
44/163
38
Anlisis de una variable cualitativa (nominal-ordinal)
En la presente seccin se ilustra el uso de XLSTatistics para el anlisis de una variable cualitativa(nominal ordinal). Algunos ejemplos de variables cualitativas son: uso-cobertura de la tierra (e.g.bosque, pasto, urbano), sexo (masculino, femenino), color (e.g. azul, rojo, blanco) y cultivos (eg. maz,arroz, frijol, yuca), escala de Likert (. En el men grafico de XLStatisitics corresponde a 1Cat.
1. Abra el archivo xlstats_tutorial.xlsx y seleccione de la hoja de clculo 1Catla variable ENOS.
2. Haga un clic sobre XLStatistics y luego otro clic sobre . Observe que el programa abre ellibro de trabajo 1Cat.xlsy copia los datos seleccionados a dicho libro.
En la seccin inferior de la hoja de clculo 1Cat.xlsusted observar cuatro hojas de clculo:
1) Information: Informacin. Esta hoja contiene informacin general sobre la organizacin de estelibro de trabajo.
2) Data and Description: Datos y estadsticos descriptivos3) Summaries: Sntesis de datos (Tabla de frecuencia y grficos)4) Tests: Pruebas estadsticas
Nota: Esta seccin del tutorial asume que usted ya activ el complemento de XLStatisticis(XLStatistics.xlam XLStats.xls); de no ser as, ver pgina 23.
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
45/163
39
Summaries : Tabla de frecuencia y grficos
Tests: Intervalo de confianza y prueba de hiptesis para proporciones (N grande)
Grfico de frecuencia (barras). Ustedpuede elegir nmero de decimales, tipode frecuencia (absoluta, porciento,proporcin). Puede adicionar al grficode barra 1 Error estndar, 2 Erroresestndares, o un intervalo de confianza.Recuerde que usted puede elegir elnivel de confianza.
Grfico de pastel: Si lo desea puedemodificar el ttulo del eje vertical.Para series estadsticas con tres o mscategoras ordenar las frecuencias demayor a menor.
Inferencia sobre proporciones (muestrasgrandes-al menos 5 observaciones por celda),valor de p basado en aproximacin a ladistribucin normal).
1. Prueba de hiptesis2. Intervalo de confianza3. Anlisis de poder y determinacin de tamao
de muestra
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
46/163
40
Anlisis de poder y determinacin de tamao de muestra
Anlisis de error marginal para IC de proporciones
I t l d fi b d hi t i i ( t )
Esta hoja de trabajo le permiterealizar un anlisis de poder de laprueba Z para proporciones.
Recuerde que usted puede modificarlos nmeros en color azul.
Esta hoja de trabajo le permiterealizar un anlisis de error marginalpara el intervalo de confianza parauna proporcin.
Recuerde que usted puede modificarlos nmeros en color azul.
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
47/163
41
Prueba de Bondad de ajuste (ji-cuadrado)
Prueba de corridas o de WaldWolfowitz
(http://www.quantitativeskills.com/sisa/statistics/ordhlp.htm )
Esta prueba es aplicada a un set de datos conformado por una secuencia de dos valores(e.g. "+++++++++++++") y se utiliza para probar por la aleatoriedad en la secuenciadel set de datos (la hiptesis nula es que los elementos de la secuencia son independientes entre s) .
A continuacin se ilustra el resultado para el anlisis de la frecuencia de aos lluviosos (mayorque la media) Vs aos secos (menores que la media) para la precipitacin anual de laestacin Moravia de Chirrip.
El programa estima la proporcinobservada para las variables y usteddebe digitar la proporcin esperada oterica. En este caso se desea probarque la proporcin entre aos Nio(0.333), Nia (0.333) y Neutro (0.333)es la misma.
Para un alfa de 0.05, cul es el
resultado de la prueba de hiptesis?
Los resultados indican que existen 22 secuencias de
seco-lluvioso (o lluvioso-seco) y que para un set dedatos aleatorio dado el tamao de muestra (41 aos) seesperaran 24.95 secuencias.
http://www.quantitativeskills.com/sisa/statistics/ordhlp.htmhttp://www.quantitativeskills.com/sisa/statistics/ordhlp.htmhttp://www.quantitativeskills.com/sisa/statistics/ordhlp.htmhttp://www.quantitativeskills.com/sisa/statistics/ordhlp.htm7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
48/163
42
A. B.
A. Secuencia de aos clasificados como secos (1) y lluviosos (2)B. Pt anual expresado como un valor estandarizado (anomala estandarizada basado
en el periodo 1960-2007).
Observe que a partir de 1996 existe una mayor frecuencia de aos lluviosos; sin embargoa partir de 2006 parece que se inicia otro ciclo de menor precipitacin.
A. Anomalas estandarizadas basado en el periodo 1960-1990.
B. Anomalas estandarizadas basado en el periodo 1960-1980.
La anomala estandarizada es: (Pt ao-Pt media)/desviacin estndar
Observe que a partir de 1996 existe una mayor frecuencia de aos lluviosos; sinembargo a partir de 2006 parece que se inicia otro ciclo de menor precipitacin.
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
49/163
43
Anlisis de dos variables numricas (continuas discretas): Correlacin yregresin simple
En la presente seccin se ilustra el uso de XLSTatistics para el anlisis de dos variablescuantitativas. En el men grafico de XLStatisitics corresponde a 2Num.
A continuacin analizaremos los datos de las variables ao y precipitacin anual. A esta serie se leconoce como una serie temporal porque involucra a la variable tiempo (aos).
1. Abra el archivo xlstats_tutorial.xlsx y seleccione de la hoja de clculo 2Numlas variables Ao
(variable predictora) y Moravia Pt. anual (mm) (variable dependiente).2. Haga un clic sobre XLStatistics y luego otro clic sobre . Observe que el programa abre el
libro de trabajo 2Num.xlsy copia los datos seleccionados a dicho libro.
Nota: Esta seccin del tutorial asume que usted ya activ el complemento de XLStatisticis(XLStatistics.xlam XLStats.xls); de no ser as, ver pgina 23.
Nota: Dado que las dos variables son cuantitativas, XLStatistics ofrece herramientas pararealizar un anlisis de correlacin y regresin simple. En Excel la primera columnacorresponde al eje Y y la segunda al Eje X.
En este caso deseamos analizar el comportamiento de la lluvia anual en el tiempo y por tantola variable Y es PT anual y la variable X el tiempo.
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
50/163
44
Conceptos bsicos sobre regresin lineal simple
La ecuacin de regresin de Y en X muestra el valor medio esperado de Y dado un valor deX. La variable Y se denomina dependientey la variable Xpredictora. Una distribucin condicionales la distribucin de una variable (Y) dado un valor particular de otra variable (X). Por ejemplo, dado unbosque, la distribucin condicional de la variable altura (h) dada un valor particular de la variabledimetro (d) mostrara todos los posibles valores de altura para cada uno de los valores de dimetro.Dicha relacin se simboliza como h|d. Dado que no es posible conocer todas las posiblesdistribuciones condiciones de h dada cada uno de los posibles valores de d; se asume que elmuestreo independiente realizado de las variables h y d representa dicha relacin. Bajo estasuposicin y asumiendo que la distribucin de hes normal para cada valor de d, la mejor estimacinde hdado dsera la media de la distribucin como se muestra en la figura 1.
Figura 1: Distribucin hipottica de la variable altura (h) en metros para un valor de dimetro de 40cm. La distribucin de valores de altura es normal con una media de 22.78 m y un error deestimacin es 4.25 m.
Ahora supongamos que existen otros valores de altura y dimetro como se muestra en la figura 2.La ecuacin de regresin ajusta una recta a travs de las cimas de cada una de las distribucioes de
h|d. Sin embargo, observe que el ajuste no es perfecto, o sea existe un error de estimacin; dicho errorse utiliza para calcular los intervalos de confianza y realizar las pruebas de hiptesis sobre la validezestadstica del modelo. Cuanto ms pequeo sea dicho error mayor capacidad predictiva y descriptivatendr el modelo
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
51/163
45
Data and Description: Datos y su descripcin
Anlisis de correlacin y regresin lineal
Data: Listado de datosTwo-variable: Anlisis de correlacin(r) y coeficiente de determinacin (R2).
Single variable: Estadsticosdescriptivos para las variables Y y X.
Scatterplot: Grfico de dispersin
Anlisis de correlacin1. Coeficiente de correlacin lineal
2. Prueba de hiptesis sobre rho.Para un alfa 0.05 se rechaza Ho?____
Regresin lineal simple
1. Estimadores (intercepto y pendiente),error estndar e intervalos de confianza.2. Coef. determinacin (R2).3. Error estndar de estimacin (Syx) =CME.4. Diagrama de dispersin.
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
52/163
46
Anlisis de varianza: significancia del modelo
La hiptesis nula es que no existe regresin de Y en X; o sea no existecovariacin entre Y y X.
A un nivel de significancia de 0.05, la regresin de precipitacin en tiempo es estadsticamentesignificativa (p=0.044).
Anlisis de residuos: Evaluacin de los supuestos del modelo
Los supuestos del anlisis de regresin son las siguientes:
1- Modeloa. El modelo es completo. La ecuacin posee todos las variables requeridas para describir la
relacin entre Y y X. Ejemplo: Y=a+bX+e.No existe ninguna prueba estadstica que le indiquedirectamente si el modelo posee todas las variables requeridas para describir la relacin entreY y X. Le sugiero utilizar sus conocimientos tericos (e.g. publicaciones previas, consulta conexpertos, colegas, etc.) para evaluar este criterio.
b. Lineal. La relacin entre las variables X y Y es lineal. Principio de linealidad de la regresin.
c. Aditivo. La relacin entre las variables es aditiva. Este supuesto es especialmente crtico enregresiones mltiples (dos o ms variables predictoras); ya que el efecto de una variablepuede estar afectado por otra variable. Por ejemplo, el efecto de la fertilizacin en elcrecimiento de un bosque segundario puede depender del uso previo del sitio de la
Tabla de anlisis de varianza
DF: Grados de libertadSS: Suma de cuadradosMS: Cuadrado medioF: valor de F
p-value: valor de p corresponde al valor de F enla distribucin F.
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
53/163
47
3- Error del modeloa. Distribucin normal. Las pruebas estadsticas dependen de este supuesto; sin embargo la
inferencia estadstica puede se robusta aun cuando se viole este supuesto. Graficar residuos
y evaluar su distribucin, realizar prueba de hiptesis para normalidad.b. Su valor esperado es 0. Graficar residuos y evaluar su distribucin alrededor de cero.c. Los errores son independientes entre s. La inferencia estadstica asume que cada caso u
observacin es independiente de la otra. Por ejemplo, la medicin de lluvia diaria en el mes deoctubre no es independiente, ya que es probable que los das lluviosos no ocurran al azar.
d. Homocedasticidad de los errores (varianzas son constantes) con respecto a la variablepredictora. La no homogeneidad de la varianza sesga la estimacin del error estndar y por
ende la significancia estadstica. Si sus datos no cumplen con este supuesto puede utilizaruna matriz ponderada. (e.g. 1/X). La ecuacin original Y=a+bX+e se convierte enY/X=a/X+b+e/X. En este nuevo modelo el error para los valores grandes de X ser mspequeo (e/X). Para ajusta esta nueva regresin, usted debe crear la variable Y/X (su nuevavariable dependiente) y 1/X (su nueva variable predictora). Para este nuevo modelo, el valordel intercepto (a) ser ahora la pendiente y el valor de la pendiente (b) ser la interseccin dela nueva ecuacin.
La no independencia entre las observaciones sesga la estimacin del error estndar, yaque la frmula asume que las observaciones son independiente (n muestras
independientes). Si las observaciones estn correlacionadas, el valor de n utilizado esms grande que el real y por tanto el error estndar estimado ser ms pequeo y laspruebas estadsticas tendrn una mejor significancia (se tender a rechazar Ho). Estotambin puede sesgar las estimaciones de la intercepcin y la pendiente del modelo. Lano linealidad es un caso especial de los errores correlacionados.
Observe que la dispersin de los puntoses mayor conforme aumenta el valor de
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
54/163
48
B. Eficientes: Estima el parmetro de inters con el menor error posible. Ejemplo: el errorestndar de estimacin ser un mnimo.
C. Consistentes: Conforme el tamao de muestra aumenta el error del estimador tiende a cero.
Si alguno de estos supuestos es violado, entonces las estimaciones de los parmetros del modelo,las predicciones, las pruebas de hiptesis, los intervalos de confianza y la relacin entre las variablesindicada por el modelo de regresin puede ser, en el mejor de los casos, ineficiente o peor aun, estargravemente sesgadas o ser engaosas. Normalmente los residuos se utilizan para probar por lossiguientes supuestos del modelo:
Supuesto PruebaLa relacin entre lasvariables X y Y eslineal
Diagrama de dispersin, grfico de valores observados Vs valoresestimados, grfico de residuos Vs valores estimados ((. ).En caso de violar este supuesto debe utilizar un modelo linealizable nolineal, transformar las variables utilizar variables de clasificacin (dividir delset de datos en segmentos lineales).
Los errores sonindependientes
Para series temporales graficar errores vs tiempo. Para otros datos utilizar elgrfico de autocorrelacin de residuos de resago 1. Es deseable que lamayora de las autocorrelaciones residuales estn dentro de las bandas deconfianza del 95% en torno a cero, las cuales se encuentranaproximadamente a 2/(n)0.5, donde nes el tamao de la muestra. As, siel tamao de la muestra es de 48, las autocorrelaciones debe estar entre +/-0,29. Ponga especial atencin a las autocorrelaciones significativas deresago uno y dos. El estadstico Durbin-Watson (d) es utilizado para probarpor autocorrelacin de resago-1 entre residuos: d es aproximadamenteigual a 2*(1-r) donde res la autocorrelacin residual: un valor de 2,0 indicaausencia de autocorrelacin. Como regla general, cualquier valor de d
inferior a 1 indica autocorrelacin grave entre los residuos. El valor de dsiempre se encuentra entre 0 y 4. Si el estadstico de Durbin-Watson essustancialmente menor que 2, existe evidencia de correlacin serial positiva.Un estadstico robusto y ms poderoso que DW es la prueba LM de
7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010
55/163
49
Homocedasticidad delos errores (varianzasson constantes) con
respecto a la variablepredictora.
Grfico de residuos versus variable predictora (en este caso ao).
Los errores tienen unadistribucin normal.
Grfico de probabilidad normal e histograma de residuos. Prueba denormalidad.
El valor esperado delos residuos es cero
Graficar residuos y evaluar su distribucin alrededor de cero.
El libro 2NRP.xls de XlStatistics le ofrece las siguientes pruebas para evaluar los supuestos delmodelo.
Residuos versus observacin. Los valoresson grficos segn su orden (1 a n). Estagrfica permite determinar si existe algnpatrn en el orden en que se midieron los
datos (e.g. error sistemtico). Observe quelos residuos se encuentran dentro de unabanda de 1000 mm.
Grafico de probabilidad normal. Para cumplircon el supuesto de normalidad, los residuosdeben ajustarse a una