ESTADSTICA DESCRIPTIVALic. Tatiana Rettis Salazar
ESTADSTICA DESCRIPTIVARECOPILACIN CLASIFICACIN PRESENTACINDESCRIPCIN
CLASIFICACINLos datos recolectados suelen ser registrados en el orden que se presentan, para facilitar su interpretacin y anlisis, es necesario se ordenen o clasifiquen de forma sistemtica de acuerdo a su magnitud, y a sus caractersticas en grupos o sub grupos llamadas Distribucin de Frecuencias.
CLASIFICACINDistribucin de Frecuencias, es un agrupamiento de datos en categoras mutuamente excluyentes obteniendo el nmero de observaciones de cada categora.
CLASIFICACINDistribucin de Frecuencias para Variables Categricas
Ejemplo: Un asistente social de una comunidad esta interesado en conocer la calidad alimenticia de los nios, para ello interrogo a 50 de ellos obteniendo las siguientes respuestas.Variable: Calidad Alimenticia:
Muy DeficienteMDDeficienteDRegularRBuenaBMuy Buena MB
Distribucin de Frecuencias para Variables Categricas
BRRDMDRBDBBRDMDDDDRRRRMDRDMDDRDBDMDDMBDRRBDRMBDMDDMDDMDRBDRB
Distribucin de Frecuencias para Variables Categricas
Variable: Calidad Alimenticia: ConteoFrecuenciaFrecuencia RelativaFrecuencia PorcentualMuy DeficienteMD IIII III 80.1616.00%DeficienteD 170.3434.00%RegularR IIII IIII IIII150.330.00%BuenaB IIII III80.1616.00%Muy BuenaMB I I20.044.00%501100.00%
MTODOS GRFICOSVARIABLES CUALITATIVAS:Diagrama de barrasDiagrama de sectores angulares
Mtodos Grficos para variables CategricasDiagrama de barras: Se utilizan rectngulos separados, que tienen como base a cada uno de las categoras y como altura la frecuencia de ese dato.Grfica de Torta: Se forma al dividir un crculo en sectores circulares de manera que: a) cada sector circular equivale al porcentaje correspondiente a la categora o grupo que representa; y b)la unin de los sectores circulares forma el crculo y la suma de sus porcentajes es 100%.
Grfico1
MD8
D17
R15
B8
MB2
Variable Calidad Alimenticia
N de Casos
Calidad Alimenticia en la Comunidad Rural
Hoja1
BRRDMD
RBDBB
RDMDDD
DRRRR
MDRDMDD
RDBDMD
DMBDRR
BDRMBD
MDDMDDMD
RBDRB
Variable: Calidad Alimenticia:ConteoFrecuenciaFrecuencia RelativaFrecuencia Porcentual
Muy DeficienteMD80.1616.00%
DeficienteD170.3434.00%
RegularR150.330.00%
BuenaB80.1616.00%
Muy BuenaMB20.044.00%
501100.00%
Hoja1
Variable Calidad Alimenticia
N de Casos
Calidad Alimenticia en la Comunidad Rural
Hoja2
Hoja3
Grfico2
8
17
15
8
2
Calidad Alimenticia
Hoja1
BRRDMD
RBDBB
RDMDDD
DRRRR
MDRDMDD
RDBDMD
DMBDRR
BDRMBD
MDDMDDMD
RBDRB
Variable: Calidad Alimenticia:ConteoFrecuenciaFrecuencia RelativaFrecuencia Porcentual
Muy DeficienteMD80.1616.00%
DeficienteD170.3434.00%
RegularR150.330.00%
BuenaB80.1616.00%
Muy BuenaMB20.044.00%
501100.00%
Hoja1
Variable Calidad Alimenticia
N de Casos
Calidad Alimenticia en la Comunidad Rural
Hoja2
Calidad Alimenticia
Hoja3
CLASIFICACINDistribucin de Frecuencias para Variables Numricas
Ejemplo:Los datos obtenidos por una trabajadora Social a quien le interesa conocer el nmero de hijos por familias de una comunidad para llevar a cabo un estudio socio econmico de estos datos.
Distribucin de Frecuencias para Variables Numricas
84745103524294625683601167464450323488597543510379869
Distribucin de Frecuencias para Variables Numricas
Variable: Numero de Hijos: FrecuenciaFrecuencia RelativaFrecuencia Porcentual020.044.00%100.000.00%240.088.00%360.1212.00%490.1818.00%570.1414.00%660.1212.00%740.088.00%850.1010.00%940.088.00%1020.044.00%1110.022.00%50100.00%100.00%
Consideraciones que se deben tomar en cuenta en la construccin de cuadros de frecuencias para datos cuantitativosLos intervalos deben ser mutuamente excluyentes o no traslapados.Se recomienda tener entre 5 y 15 intervalos.Se debe tener en cuenta la naturaleza de la variable de inters, el nmero de datos y la amplitud del conjunto de datos.Es recomendable que los intervalos tengan igual tamao cuando se desea hacer comparaciones entre ellos. Adems, usualmente, los intervalos son cerrados a la izquierda y abiertos a la derecha; excepto el ltimo intervalo que es cerrado en ambos lados.Cuando se desea comparar el cuadro a construir con un cuadro ya construido, los intervalos del cuadro ya construido deben servir de base para la construccin de los intervalos del cuadro a construir.
Distribucin de Frecuencias para Variables NumricasElementos que se debe tener en cuenta para construir una tabla de distribucin de frecuencias por intervalos.Alcance (A)Rango (R)Intervalo de clase (Ii)Limite clase (Li)Ancho de clase (Ci)
Procedimiento de construccin de un cuadro de frecuencias para datos continuos, con intervalos de igual tamao, y aplicando la regla de Sturges Determinar el rango o amplitud de los datos. Rango = (Obsv. mayor valor) - (Obsv. Menor valor). Establecer el nmero de intervalos mediante la regla de Sturges. K 1 + 3.3 Log n Determinar el tamao de intervalo de clase comn.Ci Rango / K Establecer los lmites de cada uno de los intervalos. LI1=Xmin LS1=LI1+ Ci LIj=LSj-1 LSj=LIj + Ci Verificar si el intervalo K contiene a la Obsv. Mayor valor. Determinar las marcas de clase, las frecuencias absolutas, frecuencias relativas y porcentajes.
Distribucin de Frecuencias para Variables NumricasDefiniremos como frecuencia de un dato el nmero de veces que este aparece en el colectivo. Siendo n la suma de las respectivas frecuencias de cada dato (n=Xi). Este n ser denominado como frecuencia total. A efectos prcticos, asumiremos las siguientes definiciones de frecuencias:
a) frecuencias absolutas : es el nmero de datos contenidos en cada clase y se representa por ni.
b) frecuencias relativas: es el cociente entre la frecuencia absoluta y el tamao de la muestra. La denotaremos por hi
c) frecuencias absoluta acumulada: es el nmero de veces que ha aparecido en la muestra un valor menor o igual que el de la variable, se puede acumular, en la tabla estadstica en orden ascendente (Ni) o descendente (Ni)
d) frecuencia relativa acumulada: al igual que en el caso anterior se calcula como el cociente entre la frecuencia absoluta acumulada dividido por el tamao de la muestra (Hi).
e) Marca de Clase, son los puntos medios de los intervalos de clase. (Xi).
Distribucin de Frecuencias para Variables Numricas
Variable: Numero de Hijos: FrecuenciaMarca de ClaseFrecuencia RelativaFrecuencia PorcentualFrecuencia Absoluta AcumuladaFrecuencia Relativa AcumuladaFrecuencia Porcentula AcumuladaLiLsniXihihi %NiHi Hi %0220.044.00%24100.220.00%46160.3232.00%68100.220.00%81090.1818.00%101230.066.00%501100.00%
MTODOS GRFICOSVARIABLES CUANTITATIVAS:Diagrama de bastones HistogramaPolgono de frecuenciasDiagrama de sectores
Diagrama de bastones
Grfico2
2
0
4
6
9
7
6
4
5
4
2
1
Numero de Hijos
Frecuencia
Numero de Familias segn el numero de Hijos
Hoja1
IntervalosniXihiNiHiHi %
022
2410
4616
6810
8109
10123
50
02
10
24
36
49
57
66
74
85
94
102
111
50
Hoja1
000000
[0 - 2>
[2 - 4>
[4 - 6>
[6 - 8>
[8 - 10>
[10 - 12>
Frecuencia
Numero de Hijos por Familia
Hoja2
0
0
0
0
0
0
0
0
0
0
0
0
Numero de Hijos
Frecuencia
Numero de Familias segn el numero de Hijos
Hoja3
Histograma
Grfico1
210161093
[0 - 2>
[2 - 4>
[4 - 6>
[6 - 8>
[8 - 10>
[10 - 12>
Frecuencia
Numero de Familias segn el numero de Hijos
Hoja1
IntervalosniXihiNiHiHi %
022
2410
4616
6810
8109
10123
50
Hoja1
000000
[0 - 2>
[2 - 4>
[4 - 6>
[6 - 8>
[8 - 10>
[10 - 12>
Frecuencia
Numero de Hijos por Familia
Hoja2
Hoja3
Polgono de frecuencias
Grfico4
2
10
16
10
9
3
Marcas de Clase
Frecuencia
POLIGONO DE FRECUENCIAS
Hoja1
IntervalosniXihiNiHiHi %
02212
2410312
4616528
6810738
8109947
101231150
50
02
10
24
36
49
57
66
74
85
94
102
111
50
Hoja1
[0 - 2>
[2 - 4>
[4 - 6>
[6 - 8>
[8 - 10>
[10 - 12>
Frecuencia
Numero de Hijos por Familia
Hoja2
Numero de Hijos
Frecuencia
Numero de Familias segn el numero de Hijos
Hoja3
[0 - 2>
[2 - 4>
[4 - 6>
[6 - 8>
[8 - 10>
[10 - 12>
Numero de Hijos
Frecuencia
OJIVA
Marcas de Clase
Frecuencia
POLIGONO DE FRECUENCIAS
Grfico3
21228384750
[0 - 2>
[2 - 4>
[4 - 6>
[6 - 8>
[8 - 10>
[10 - 12>
Numero de Hijos
Frecuencia
OJIVA
Hoja1
IntervalosniXihiNiHiHi %
02212
2410312
4616528
6810738
8109947
101231150
50
02
10
24
36
49
57
66
74
85
94
102
111
50
Hoja1
[0 - 2>
[2 - 4>
[4 - 6>
[6 - 8>
[8 - 10>
[10 - 12>
Frecuencia
Numero de Hijos por Familia
Hoja2
Numero de Hijos
Frecuencia
Numero de Familias segn el numero de Hijos
Hoja3
[0 - 2>
[2 - 4>
[4 - 6>
[6 - 8>
[8 - 10>
[10 - 12>
Numero de Hijos
Frecuencia
OJIVA
Diagrama de sectores Angulares
Grfico5
2
10
16
10
9
3
Familias por Numero de Hijos
Hoja1
IntervalosniXihiNiHiHi %
02[0 - 2>212
24[2 - 4>10312
46[4 - 6>16528
68[6 - 8>10738
810[8 - 10>9947
1012[10 -12>31150
50
02
10
24
36
49
57
66
74
85
94
102
111
50
9693881171279511396108
13914294107125155155103112
112135132111125104106139134
118136125143120103113124138
941271191481179715612089
TalloHojas
889
93445667
10334678
11122337789
1200455577
132456899
14238
15556
Hoja1
[0 - 2>
[2 - 4>
[4 - 6>
[6 - 8>
[8 - 10>
[10 - 12>
Frecuencia
Numero de Hijos por Familia
Hoja2
Numero de Hijos
Frecuencia
Numero de Familias segn el numero de Hijos
Hoja3
21228384750
[0 - 2>
[2 - 4>
[4 - 6>
[6 - 8>
[8 - 10>
[10 - 12>
Numero de Hijos
Frecuencia
OJIVA
2
10
16
10
9
3
Marcas de Clase
Frecuencia
POLIGONO DE FRECUENCIAS
Familias por Numero de Hijos
La tcnica tallo-hoja1. Ordenacin de los datos, en forma ascendente. Datos InicialesX1, X2, X3, ..., XnDatos Ordenados en forma ascendenteY1, Y2, Y3, ..., Yn
La tcnica tallo-hojaObservacinParte 1Parte 2Conformado por cifras ms notables(usualmente es la primera cifra)Conformado por cifras menos notables2. Formacin del tallo. Para formarlo se debe considerar que en cada observacin se puede considerar dos partes: una parte ms notable (que usualmente es la primera cifra) y la otra parte menos notable constituida por las otras cifras.
La tcnica tallo-hojaEn una columna se colocan, en forma ordenada y ascendente y a distancias iguales, desde el valor ms bajo hasta el valor ms alto correspondiente a la parte 1 o troncal, se hallen presentes o no dentro del conjunto de datos.3. Formacin de las hojas. Una hoja es el conjunto de dgitos que se encuentran a la derecha de un valor troncal. Cada uno de los valores troncales tiene cero, una o ms hojas . Estas hojas se colocan, en forma ordenada y ascendente, con espaciamientos iguales, a la derecha del valor troncal correspondiente.
La tcnica tallo-hoja
969388117127951139610813914294107125155155103112112135132111125104106139134118136125143120103113124138941271191481179715612089
La tcnica tallo-hoja
TalloHojas88996356447108734631173272198312757055041395294681482315655
TalloHojas88993445667103346781112233778912004555771324568991423815556
MTODOS ANALTICOSMEDIDAS DE TENDENCIA CENTRAL Moda Media Mediana Cuantiles: cuartiles, deciles y percentilesMEDIDAS DE DISPERSIN Rango o recorrido Recorrido intercuartlico Varianza y desviacin tpica Desviacin media Coeficientes de variacinMEDIDAS DE FORMA Coeficientes de asimetra