70
 CUADERNOS DE ESTADÍSTICA FASCÍCULO 1 ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL CAPÍTULO 1 GE NE RAL IDADES ............................................. 3 1.1 INT RODUCCIÓN .................................................... 3 1.2 INFORMACIÓN, DATOS Y VARIABLES ................................ 4 1.3 E SCAL AS DE ME DIDAS .............................................. 5 1.4 CL ASIFICACIÓN DE DATOS EST ADÍST ICOS ............................ 5 1.5 POB L ACIÓN Y MUESTRA ............................................ 6 CAPÍTULO 2 T ABL A DE FRE CUE NCIAS ...................................... 8 ............................................................. 8 2.1 T ABUL ACIÓN E N VARIABL E DISCRET A. .............................. 8 2.1.1 FRE CUENCIAS ABSOL UT AS ( n j ). ............................... 10  j 2.1.2 FRE CUENCIA ABSOL UT A ACUMUL ADA (N ). .................... 10 2.1.3 FRE CUENCIA REL AT IVA O PORCE NT UAL (hj). ................... 11 2.1.4 FRE CUENCIA REL AT IVA A CUMUL ADA ( Hj) ...................... 11 2.1.5 INT E RPRETACIÓN DE ALGUNOS VALO R E S DE .................. 13 2.1.6 USANDO COMPUTADOR ...................................... 14 2.1.6.1 USANDO PL ANILLA ELECT R ÓNICA ............................ 14 2.1.6.2 USANDO MICROST AT ........................................ 16 2.1.6.3 USANDO SPSS ............................................... 18 2.2 T ABUL ACIÓN DE VARIABL E CONTI NUA. ............................. 20 2.2.1 USANDO COMPUTADOR ...................................... 24 2.2.1.1 USANDO PL ANILLA ELECT R ÓNICA ............................ 24 2.2.1.2 USANDO MICROST AT ........................................ 25 2.2.1.3 USANDO SPSS ............................................... 26 2.3 PROPIE DADES DE L AS FRE CUE NCIAS .......................... 28 CAPÍTULO

CUAD_UNO

Embed Size (px)

Citation preview

CUADERNOS DE ESTADSTICA FASCCULO 1 ESTADSTICA DESCRIPTIVA UNIDIMENSIONAL

CAPTULO 1 GENERALIDADES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.1 1.2 1.3 1.4 1.5 INTRODUCCIN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 INFORMACIN, DATOS Y VARIABLES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 ESCALAS DE MEDIDAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 CLASIFICACIN DE DATOS ESTADSTICOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 POBLACIN Y MUESTRA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

CAPTULO 2 TABLA DE FRECUENCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 .............................................................8 2.1 TABULACIN EN VARIABLE DISCRETA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 2.1.1 FRECUENCIAS ABSOLUTAS (nj). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 2.1.2 FRECUENCIA ABSOLUTA ACUMULADA (Nj). . . . . . . . . . . . . . . . . . . . . 10 2.1.3 FRECUENCIA RELATIVA O PORCENTUAL (hj). . . . . . . . . . . . . . . . . . . . 11 2.1.4 FRECUENCIA RELATIVA ACUMULADA (Hj). . . . . . . . . . . . . . . . . . . . . . 11 2.1.5 INTERPRETACIN DE ALGUNOS VALORES DE . . . . . . . . . . . . . . . . . . 13 2.1.6 USANDO COMPUTADOR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.1.6.1 USANDO PLANILLA ELECTRNICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.1.6.2 USANDO MICROSTAT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 2.1.6.3 USANDO SPSS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 TABULACIN DE VARIABLE CONTINUA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2.2.1 USANDO COMPUTADOR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 2.2.1.1 USANDO PLANILLA ELECTRNICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 2.2.1.2 USANDO MICROSTAT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2.2.1.3 USANDO SPSS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 2.3 PROPIEDADES DE LAS FRECUENCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . 28

2.2

CAPTULO

3 GRFICOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 3.1 REPRESENTACIN GRFICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 3.1.1 GRFICOS PARA VARIABLES DISCRETAS . . . . . . . . . . . . . . . . . . . . . . . 31 3.1.2 GRFICOS PARA VARIABLES CONTINUAS . . . . . . . . . . . . . . . . . . . . . . 33 3.1.3 POLGONO DE FRECUENCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 3.1.4 PICTOGRAMAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 3.1.4.1 USANDO EL COMPUTADOR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

CAPTULO 4 ESTADGRAFOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 4.1 ESTADGRAFOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 4.1.1 ESTADGRAFOS DE POSICIN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 4.1.1.1 MEDIA ARITMTICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 4.1.1.1.1 PROPIEDADES DE LA MEDIA ARITMTICA. . . . . . . . . . 43 4.1.1.1.2 DEMOSTRACIN DE ALGUNAS PROPIEDADES . . . . . . 45 4.1.1.2 MEDIA ARMNICA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 4.1.1.3 MEDIA GEOMTRICA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 4.1.1.4 EL MODO O MODA (Md). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 4.1.1.5 LA MEDIANA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 4.1.1.6 LOS FRACTILES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 4.1.2 ESTADGRAFOS DE DISPERSIN. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 RANGO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 4.1.2.2 DESVIACIN INTER CUARTIL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 4.1.2.3 DESVIACIN INTER PERCENTIL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 4.1.2.4 DESVIACIN MEDIA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 4.1.2.5 VARIANZA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 4.1.2.6 DESVIACIN ESTNDAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 4.1.2.6.1 PROPIEDADES DE LA VARIANZA. . . . . . . . . . . . . . . . . . . 61 4.1.2.6.2 DEMOSTRACIN DE LAS PROPIEDADES DE LA VARIANZA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 4.1.2.7 COEFICIENTE DE VARIACIN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 4.1.3 ESTADGRAFOS DE DEFORMACIN. . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 4.1.4 ESTADGRAFOS DE APUNTAMIENTO. . . . . . . . . . . . . . . . . . . . . . . . . . . 68 4.2 USANDO EL COMPUTADOR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 4.2.1 USANDO PLANILLA ELECTRNICA . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 4.2.2 USANDO MICROSTAT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 4.2.3 USANDO SPSS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

3

4 CUADERNOS DE ESTADSTICA FASCCULO 1 ESTADSTICA DESCRIPTIVA UNIDIMENSIONAL

CAPTULO 1 GENERALIDADES

1.1

INTRODUCCIN

El ser humano desde que comenz a razonar, en alguna medida empez a generar las bases de lo que posteriormente se reconocera como la disciplina de la Estadstica. En efecto, sus primeros pasos en el conocimiento de la naturaleza fueron: la observacin de ciertas situaciones que por alguna razn le parecieron de importancia, especialmente para su supervivencia; el registro mental de aquellas que le parecieron ms significativas y que se repetan; y la inferencia o las conclusiones que obtuvo de lo observado. Los primeros procesos mentales que se observan en los recin nacidos, de alguna manera, tambin utilizan esta secuencia y el nio aprende en gran medida por el mtodo denominado "de ensayo y error", que consiste en sufrir una experiencia (observacin), memorizacin de la experiencia (registro) y reaccionar o provocar esa experiencia en el futuro (inferencia), segn los resultados sean o no deseables . Las etapas enunciadas anteriormente, en general son en lnea gruesa las etapas de cualquier proceso de investigacin cientfica y por lo tanto se encontrarn en cualquier libro de Mtodo Cientfico, de Metodologa de la Investigacin o de Anlisis Estadstico. La estadstica ha sido definida de mltiples maneras, se recopilan decenas de definiciones distintas, pero en esencia, todas contienen los tres elementos descritos anteriormente. Por ejemplo, los clsicos autores

5 Alexander Mood y Franklin Graybill definen la estadstica como la tecnologa del mtodo cientfico, (mtodo , que contiene las etapas sealadas anteriormente) y centran la atencin en la toma de decisiones en condiciones de incertidumbre; en tanto que, otro clsico Harold Cramer identifica que el principal objeto de la teora estadstica, consiste en la investigacin de las probabilidades, de obtener inferencias vlidas a partir de los datos estadsticos y en la construccin de mtodos para realizar dichas inferencias. Estas definiciones permiten afirmar que esta disciplina, al menos en lo bsico, es una sola; sus mtodos son aplicados en los mbitos ms diversos del conocimiento humano habiendo conceptos y procedimientos que son ms apropiados para una disciplina que para otra. En definitiva, la mejor comprensin de qu es la estadstica y cules son sus mtodos, se lograr gradualmente, a medida que se avance en el estudio de ella, por lo que, parece ms apropiado comenzar a estudiarla. La idea de este curso es que el alumno no slo adquiera los conocimientos bsicos de la disciplina y sepa cundo y cmo aplicarlos, sino que tambin y ms importante, adquiera un modo de pensar cuantitativo diferente, que le permita observar situaciones nuevas, aventurar hiptesis sujetas a prueba, en especial en situaciones con algn grado de incertidumbre y le facilite la toma de decisiones. 1.2 INFORMACIN, DATOS Y VARIABLES

Parece claro que la estadstica trabaja fundamentalmente con informacin relativa a un conjunto de personas u objetos. Dicha informacin puede ser de la ms diversa ndole y est sujeta a mediciones. La medicin consiste en la asignacin de nmeros a los objetos segn determinadas reglas y utilizando distintas escalas de medidas. Las reglas de medicin estn relacionadas con la forma estndar de hacer la medicin para todas las personas u objetos. Por ejemplo, para medir la altura de una persona, se debe medir desde la coronilla de la cabeza hasta la planta de los pies.

6 Cuando se trabaja con datos es necesario tener presente la precisin con que se hacen las mediciones, entendiendo por esto, la cantidad de cifras significativas que se utilizarn y tambin debe considerar la exactitud que indica, cuan bien la cantidad representa lo observado. Las escalas de medidas dicen relacin con el tipo de nmeros que se utilizarn y cmo en los estudios estadsticos son de fundamental importancia, los revisaremos brevemente. 1.3 ESCALAS DE MEDIDAS

Escalas nominales, son las que se utilizan para asignar un nombre o distintivo a un dato, pretenden agrupar a las personas u objetos en clases. Es usual que , por ejemplo, se utilice el cero para identificar el sexo femenino y el uno para el sexo masculino. Por lo tanto, estos valores slo tienen un sentido de clasificacin, no es posible realizar operaciones matemticas con ellos y no indican presencia o ausencia de alguna propiedad o atributo. Escala ordinal, como su nombre lo indica pretende establecer un orden entre los elementos, diferenciando los distintos grados de un atributo o propiedad que tienen las personas u objetos. Un ejemplo de este tipo de escala es el que se utiliza en un concurso de belleza, al asignar el primer, segundo, tercer, etc., lugar. Estos valores, slo tienen un sentido de ordenacin, por lo que tampoco es posible realizar operaciones matemticas con ellos ni indican presencia o ausencia de alguna propiedad o atributo. Escala de intervalos, asigna un nmero igual al nmero de unidades de medida equivalentes que tenga el objeto en estudio, es posible determinar diferencias entre los grados que se tiene de una propiedad de dos personas u objetos. La temperatura y la numeracin de los aos son unidades de medida que operan con este tipo de escala. Las diferencias entre ellas son significativas, pero el cero no tiene un sentido de ausencia de la propiedad. En ambos ejemplos se establece arbitrariamente el origen de la escala. Escala de razn o cociente, se define de igual forma que la escala anterior, pero adems, el cero indica la ausencia de la propiedad que se ha medido, lo que permite hacer uso de las operaciones aritmticas de suma, resta, multiplicacin y divisin y sus resultados tienen claras interpretaciones. La distancia o longitud, sera un buen ejemplo.

7 1.4 CLASIFICACIN DE DATOS ESTADSTICOS

Los datos estadsticos pueden clasificarse en datos de atributo y de variable. Se habla de atributo, cuando el dato a analizar es una cualidad y puede llamarse tambin cualitativo. Es de variable cuando se refiere a una cantidad y puede denominarse tambin cuantitativo. Los datos con respecto al tiempo se pueden clasificar en: cronolgicos, cuando interesa el perodo de tiempo en que ha sucedido la observacin y atemporales o no cronolgicos, cuando el perodo de tiempo de ocurrencia no se toma en cuenta. Se clasifican los datos respecto a la dimensin en: Unidimensional, cuando se analiza una sola caracterstica del objeto; Bidimensional, cuando se analizan dos caractersticas del objeto estudiado; Tridimensional, cuando se analizan tres caractersticas del objeto en referencia y Multidimensional, cuando se consideran ms de tres caractersticas. La variable se puede clasificar en: discreta, cuando toman valores enteros, algunos valores dentro de un intervalo o a lo sumo un nmero infinito contable de valores y continua, cuando puede tomar todos los valores dentro de un intervalo continuo real. 1.5 POBLACIN Y MUESTRA

Sin lugar a duda que para realizar un estudio lo ideal sera que se pudiera estudiar un determinado problema o fenmeno, observando o midiendo todos y cada uno de los elementos que pertenezcan o cumplan con una determinada condicin de inters, lamentablemente por diversas razones, no siempre es posible acceder a la informacin de todos sus elementos y por lo tanto para realizar dicho estudio debe proceder de una manera diferente, manera que en gran medida caracteriza o identifica el trabajo de un estadstico. Al conjunto de todos los elementos que se desean estudiar y para los cuales se desea obtener informacin y conclusiones, se le denomina Poblacin bajo estudio o simplemente Poblacin. Cuando es posible realizar el estudio recogiendo la informacin de la poblacin completa, se dice que se est trabajando con un Censo.

8 Cualquier estudio del comportamiento de los seres humanos, por ejemplo, no podra realizarse en la forma exhaustiva como se describi anteriormente, porque sera necesario que se cuente con la informacin de todos los seres humanos que existieron, existen y existirn. En la generalidad de los casos, al no ser posible acceder a la informacin de todos los elementos de la poblacin o por que la obtencin de los datos es econmicamente prohibitiva, se seleccionar de entre ellos a un subconjunto, que se denominar Muestra y a partir de la informacin obtenida en dicha Muestra se obtienen conclusiones con algn grado de validez para toda la Poblacin. De lo expuesto se desprende que en un estudio estadstico , la base de todo el trabajo est en la calidad de la muestra, por lo que la obtencin de ella resulta un proceso de fundamental importancia, por ello nos deber preocupar siempre por lo menos los siguientes aspectos: la forma en que se recoja la muestra y la cantidad de elementos de ella. Las distintas maneras que se utilizan para la obtencin de las muestras se encuentran el los libros bajo el nombre de Teora de Muestreo, donde se describen algunos mtodos de obtencin de ellas, sus correspondientes procedimientos y la determinacin del tamao necesario para tener algn grado de confianza en los resultados. El mtodo de muestreo ms fcil de aplicar y por lo general ms usado, recibe el nombre de Muestreo Aleatorio Simple y consiste en utilizar un mecanismo de seleccin de los elementos de la poblacin, que d igual oportunidad a cada uno de integrar la muestra. En la prctica, este mecanismo de seleccin consiste en utilizar el azar para la seleccin de los elementos de la muestra, esto equivale a incorporar en una caja o urna una ficha por cada elemento de la poblacin y escoger al azar tantas fichas como se haya determinado tenga la muestra. La realizacin de este procedimiento se puede simplificar, utilizando tablas de nmeros aleatorios que son tablas que contienen nmeros que se han obtenido por procedimientos similares o utilizando un computador. A la cantidad de elementos de una muestra se le denomina tamao de muestra y se denota comnmente con la letra n minscula.

9 De lo anterior se desprende que al realizar un estudio estadstico, con frecuencia, es necesario manipular y procesar una gran cantidad de datos, tarea que indudablemente se hace ms fcil con apoyo computacional. Por consiguiente, en el presente trabajo se darn orientaciones para que el alumno pueda realizar estas actividades en algn paquete estadstico o al menos, utilizando una planilla electrnica.

En primer trmino estudiaremos una caracterstica de los elementos de una muestra, es decir, nuestra variable ser Unidimensional y la denotaremos por Xi , donde cada elemento de la muestra sern denotados por x1 , x2 , x3 , ..., xn . El subndice (i) nos indica solamente el orden de recepcin de los datos. Desde luego, que el subndice mayor nos dar el tamao de la muestra (n). Los datos presentados en la forma anterior reciben el nombre de datos no tabulados.

CAPTULO 2 TABLA DE FRECUENCIAS

Lo primero que podemos hacer con los datos, especialmente cuando la cantidad de elementos es muy grande (como ocurre por lo general), es ordenarlos de alguna manera para poder visualizarlos rpidamente y obtener algunas conclusiones preliminares. Para ordenarlos, debemos tener presente una de las clasificaciones que se dio al comienzo de este cuaderno, variable discreta y variable continua, por cuanto se proceder de manera distinta en cada caso. 2.1 TABULACIN EN VARIABLE DISCRETA.

10 En la prctica las variables discretas son aquellas que toman un nmero pequeo de valores distintos y que posteriormente se van repitiendo, ejemplos: formas que puede caer una moneda; pinta que puede obtenerse al lanzar un dado; nmero de hijos por familia, etc. Como se puede apreciar, los elementos de la variable que se repiten son slo dos, seis y digamos 10 en cada caso respectivamente. Supongamos entonces, que encuestamos cincuenta personas de algn estrato social y les consultamos sobre el nmero de viajes al extranjero que ha o hayan realizado los integrantes de su grupo familiar en los ltimos dos aos. Supongamos adems, que la informacin obtenida es la siguiente segn el orden de recepcin de ella. x1 =3 x11 =3 x2 =4 x12 =6 x3 =3 x13 =5 x4 =3 x14 =8 x5 =4 x15 =7 x6 =6 x16 =4 x7 =2 x17 =5 x8 =0 x18 =7 x9 =2 x19 =9 x10 =6 x20 =1 x21 =7 x22 =2 x23 =1 x24 =4 x25 =5 x26 =3 x27 =8 x28 =5 x29 =2 x30 =3 x31 =6 x32 =8 x33 =4 x34 =4 x35 =4 x36 =4 x37 =5 x38 =2 x39 =6 x40 =4 x41 =3 x42 =5 x43 =1 x44 =6 x45 =7 x46 =4 x47 =1 x48 =7 x49 =5 x50 =2

Los datos en la forma anterior reciben el nombre de datos no tabulados.

11 Lo primero que debemos hacer es ordenar estos datos en una forma ms comprensible y resumida, agrupando aquellos elementos que tienen igual caracterstica o valor. Podemos entonces formar una columna con todas las posibilidades valores de la variable (posibles nmeros de viajes), esto es 0,1, 2, 3, 4, 5, 6, 7, 8, 9; estos valores los denotaremos por Yj donde j=1,2,3,...... m, donde m representa el nmero de clases lneas o renglones, denominado marca de clase. 2.1.1 FRECUENCIAS ABSOLUTAS (nj). Frente a la Columna Yj , incorporaremos una columna de frecuencias absolutas denotada por nj y que representa la cantidad de veces que se repite el nmero de viajes registrados en la lnea. Para facilitar este trabajo, que con una gran cantidad de datos no se podra hacer por una simple inspeccin, se recurre al sistema de "tarjetas" (que no es otra cosa que el sistema que se usa habitualmente para contar los votos en una eleccin informal), es decir, se van revisando los valores de Xi en su orden de recepcin y se va haciendo una raya (tarja) frente al lugar que corresponde a la columna Yj , como se indica en el cuadro siguiente. Naturalmente que, sumando estas tarjas se tiene el nmero de repeticiones para cada fila. 2.1.2 FRECUENCIA ABSOLUTA ACUMULADA (Nj ). La frecuencia absoluta acumulada, denotada por Nj , se define como la suma de las frecuencias absolutas hasta la fila o clase que se est observando. Supongamos que observamos la clase k-sima, donde 1