View
216
Download
0
Category
Preview:
Citation preview
Estadísticas PCQ IP de Chile 2009 1
Estadística descriptiva:
Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para un análisis posterior.
1. Introducción a la Estadística
Estadística inductiva o inferencia estadística:
Se encarga de, obtener, a partir del estudio de una parte de una gran parte de un gran grupo de datos, conclusiones válidas sobre el grupo total e, incluso, calcula la probabilidad que dichas conclusiones sean realmente correctas.
Estadísticas PCQ IP de Chile 2009 3
Información
Observación directa
Observación indirecta
Encuestas; recolección deresultados de una experiencia
Recolección de datos yaregistrados en ocasionesanteriores
La información necesaria sobre los datos a trabajar se obtiene por dos vías:
Cuando se tiene una serie de datos correspondientes a determinadas características de un grupo de objetos en estudio, resulta prácticamente imposible o poco realista observar la totalidad de los objetos individualmente, especialmente si son muy numerosos o de gran tamaño.
Por ello en vez de examinar todo el grupo, que se denomina población, lo que suele hacerse es examinar una pequeña parte del mismo, de menor tamaño, que se denomina muestra.
PoblaciónMuestra
N Tamaño de la población
n Tamaño de la muestra
Población Muestra
Parámetro EstadísticoLa medida usada para describir las características de una población.Para calcular un parámetro se emplea la información de toda la población, en consecuencia existe una certidumbre total sobre su aplicación.
La medida usada para describir las características de una muestra.Para calcular un estadístico se emplea la información de una muestra o de una parte de la población, en consecuencia existe un grado de incertidumbre sobre su aplicación
Variables o características estadísticasCorresponden a las propiedades que se pretenden estudiar y de que dispone cada uno de los objetos individuales de la población en particular.
Cualitativas (atributos)
Cuantitativas (datos)
No medibles numéricamente. Medibles numéricamente.Varían en forma discreta (como lo hacen los números enteros o en forma continua como los números reales.
Ejemplos: la variable sexo de un determinado curso. El atributo es masculino o femenino (variable dicotómica).La variable estado civil de los individuos: casado, soltero, divorciado o viudo.
Ejemplos: la cantidad de integrantes de una familia corresponde a una variable discreta, mientras que la estatura de los sujetos corresponde a una variable continua.
Estadísticas PCQ IP de Chile 2009 8
CLASIFICACIÓN DE VARIABLES
Los datos son valores o categorías especificas de las variables inherentes al problema.
Se presentarán dos criterios diferentes (no excluyentes y complementarios) para clasificar variables.
Estadísticas PCQ IP de Chile 2009 9
Según Nivel de Medición
Variable Nominal
Esta es una variable cualitativa y sólo permite distinguir entre clases.
Ejemplo: Nacionalidad, Estado Civil, color de pelo, marca de las calculadoras, etc.
Estadísticas PCQ IP de Chile 2009 10
Variable Ordinal: Esta es también una variable cualitativa, pero además existe una relación de orden en el recorrido de la variable.Ejemplo: Nivel Socioeconómico, Grado en la Fuerzas Armadas y de Orden, etc.
Variable Cuantitativa:Esta es una variable propiamente cuantitativa. TIENE SENTIDO Y ES POSIBLE efectuar operaciones aritméticas con el recorrido de estas variables
Ejemplo: Número de hijos, número de artefactos eléctricos que existen en el hogar, temperatura corporal, altura de los árboles, precio de las calculadoras, etc.
Según Nivel de Medición
Estadísticas PCQ IP de Chile 2009 11
Según Tamaño de Recorrido:
Variable Discreta:
La variable tiene recorrido finito o a lo más numerable.
Ejemplos: Número de hijos, número de artefactos eléctricos que existen en el hogar, estado civil, nivel socioeconómico, sexo, etc.
Estadísticas PCQ IP de Chile 2009 12
Variable Continua:
La variable tiene un recorrido infinito no numerable. Si una variable es continua, entre dos valores potencialmente observables siempre existe otro valor potencialmente observable.
Ejemplos: Temperatura corporal, altura de los árboles, precio de las calculadoras, etc.
Según Tamaño de Recorrido:
Estadísticas PCQ IP de Chile 2009 13
Clasificación de las variables Clasificación de las variables estadísticasestadísticas
Nivel de Medición Tamaño de Recorrido
Cualitativa Nominal Ordinal
Cuantitativa Discreta Continua
Estadísticas PCQ IP de Chile 2009 14
Variable Estadística
Cualitativa Cuantitativa
Nominal Ordinal Discreta Continua
Estadísticas PCQ IP de Chile 2009 15
DISTRIBUCIÓN DE DISTRIBUCIÓN DE FRECUENCIASFRECUENCIAS
YY
TABLAS DE TABLAS DE FRECUENCIASFRECUENCIAS
2.2.
¿Qué es una distribución de frecuencias ?¿Qué es una distribución de frecuencias ?
Es el conjunto formado por todos los valores que toma la variable estadística en estudio, junto a sus respectivas frecuencias.
La distribución de frecuencias se organiza en una tabla de frecuencias.
Estadísticas PCQ IP de Chile 2009 16
Estadísticas PCQ IP de Chile 2009 17
¿Para qué se construyen las tablas de frecuencias ?
ORDENAR información
AGRUPAR información
RESUMIR información
Estadísticas PCQ IP de Chile 2009 18
El formato general de una tabla estadística , llamada también TABLA DE FRECUENCIAS O TABLA DE DISTRIBUCIÓN DE FRECUENCIAS es el siguiente:
Nombre de la variable Frecuencia
Categorías
o
Recorrido de la variable
Frecuencias
Observadas
TOTAL n
En la siguiente tabla se presenta el motivo En la siguiente tabla se presenta el motivo de consulta en un centro médico, durante de consulta en un centro médico, durante una semana.una semana.
Motivo de la consulta Cantidad de pacientes
Bronquitis 19
Otitis 13
Heridas 7
Fracturas 18
Vacunas 20
Consultas Totales 77
Estadísticas PCQ IP de Chile 2009 19
Estadísticas PCQ IP de Chile 2009 20
0
5
10
15
20
Histograma de frecuencias de consultas semanales
Bronquitis Otitis Heridas Fracturas Vacunas
Histograma de FrecuenciasHistograma de Frecuencias
Representaciones Estadísticas GráficasRepresentaciones Estadísticas Gráficas
Cuando se representa la distribución de frecuencias mediante una tabla de frecuencias, se consigue una lectura más fácil de la información, pero resulta aún más sencilla si se recurre a los gráficos estadísticos
Estadísticas PCQ IP de Chile 2009 21
Información en HistogramasInformación en Histogramas
0
2
4
6
8
10
12
14
0 1 2 3 4 5 6
Nº de Asignaturas No Aprobadas
Fre
cuen
cia
Abs
olut
a
Histograma de consultas semanales
VacunasBronquitis
Otitis
Fracturas
Fracturas
0
5
10
15
20
25
Frecuencias Porcentuales del Nº de Asignaturas No Aprobadas
15,0%
12,5%
30,0%
20,0%
7,5% 2,5% 12,5%
Estadísticas PCQ IP de Chile 2009 22
0,000
0,050
0,100
0,150
0,200
0,250
0,300
0,350
0,150 0,125 0,300 0,200 0,075 0,025 0,125
0 1 2 3 4 5 6
Frecuencia Relativa del Nº de Asignaturas No Aprobadas
Gráfico según la variable estadísticaGráfico según la variable estadísticaLa elección del gráfico más apropiado para representar algún tipo de variable, depende exclusivamente si ésta es cualitativa o cuantitativa. En general se pueden utilizar las siguientes:
Estadísticas PCQ IP de Chile 2009 23
Variable Tipo de Gráfico
Cualitativa •Circular•Gráfico de Barras
Cuantitativa Discreta •Circular•Polígono de Frecuencias
Cuantitativa Continua •Histograma•Polígono de Frecuencias
Frecuencia o Frecuencia Absoluta [ fi ]
Frecuencia Relativa [ hi ]
Es la cantidad de veces que se presenta un valor o categoría de una variable entre todos los datos agrupados observados en una población o en una muestra.La suma de todas las frecuencias de una tabla corresponde al tamaño de la muestra o de la población.
La cantidad de veces que aparece ese valor de la variable en relación al total de los datos de la población o muestra.La frecuencia relativa se puede expresar en términos de porcentaje o de proporción (tanto por uno).
Así, si hay n datos en total, una frecuencia fi representa una proporción hi del total, dada por:
Estadísticas PCQ IP de Chile 2009 24
1
1
para el caso de una muestra
para el caso de una población
p
ii
p
ii
f n
f N
..
Estadísticas PCQ IP de Chile 2009 25
Frecuencia Absoluta Acumulada [ Fi ]
Frecuencia Relativa Acumulada [ Hi ]
En algunas ocasiones interesa conocer la cantidad de datos recolectados que se encuentra por encima o por debajo de un determinado valor de la variable en un conjunto de datos agrupados ordenados en forma creciente. La frecuencia absoluta acumulada corresponde a la suma de todas las frecuencias correspondientes a los datos menores o iguales al que se considera (el dato i )
Cuando interesa conocer la proporción de datos recolectados que se encuentra por encima o por debajo de un determinado valor de la variable, se define, hi , la frecuencia relativa acumulada de un valor de la variable a la razón entre la fi de ese valor y el tamaño de la muestra o población.
La frecuencia relativa acumulada puede ser expresada como fracción (tanto por uno) o en términos porcentuales H i (%)
1 1 11
con = i
i k i i ik
F f F F f F f
ii
FH
n
Clases de DistribucionesClases de Distribuciones
Distribuciones no Distribuciones no agrupadasagrupadas
Son aquellas en que los valores de la variable se exponen de forma individual. Este tipo de distribución sólo se utiliza con variables discretas y siempre que el tamaño de la muestra o población no sea excesivamente numeroso.
Distribuciones Distribuciones agrupadasagrupadas
Son aquellas en que los valores de la variable se exponen agrupadas en intervalos, llamados clases o intervalos de clases. Este tipo de distribución se utiliza siempre con variables continuas y a veces con variables discretas con gran cantidad de valores observados.
Estadísticas PCQ IP de Chile 2009 26
Estadísticas PCQ IP de Chile 2009 27
Tabla de datos agrupadosTabla de datos agrupados
i Valores de la
variable X
iX
Frecuencia absoluta
if
1 1 x 1 f 2 2 x 2 f k kx kf p px pf
p
1i
nfi
i iX if ih (%) ih
1 1 x 1 f n
fh 1
1 100(%) 11
n
fh
2 2 x 2 f n
fh 2
2 100(%) 22
n
fh
k kx kf n
fh k
k 100(%) n
fh k
k
p px pf n
fh p
p 100(%) n
fh p
p
p
1i
nfi
p
1i
p
1i
p
1i
11 i
ii f
nn
fh 001(%)
p
1i
ih
Estadísticas PCQ IP de Chile 2009 28
Estadísticas PCQ IP de Chile 2009 29
i iX if iF iH
1 1 x 1 f 11 fF n
FH 1
1
2 2 x 2 f 21212 fffFF n
FH 2
2
k kx kf
k
iikkk ffFF
11 n
FH k
k
p px pf nfFfFFp
ii
p
iippp
111 1
n
n
n
FH p
p
p
1i
nfi
Estadísticas PCQ IP de Chile 2009 30
i Xi (cm) fi hi hi(%) Fi Hi Hi (%)
1 160 4 0,29 29,0 4 0,29 29,0
2 163 1 0,07 7,0 5 0,36 36,0
3 165 2 0,14 14,0 7 0,50 50,0
4 170 1 0,07 7,0 8 0,57 57,0
5 173 3 0,21 21,0 11 0,79 79,0
6 176 1 0,07 7,0 12 0,86 86,0
7 178 2 0,14 14,0 14 1,00 100,0
Σ 14 1,00 100,0
Un ejemplo numérico de lo vistoUn ejemplo numérico de lo visto
Estadísticas PCQ IP de Chile 2009 31
Tabla de datos agrupados por clasesTabla de datos agrupados por clases
Intervalos de clase
Marcas de
clase
Frecuencias
simples
1
1 f
2
2 f
k
kf
m
mf
1,i ix x
1 2,x x
2 3,x x
1,k kx x
1,m mx x
i `ix
` 1 21 2
x xx
` 2 32 2
x xx
` 1
2k k
k
x xx
` 1
2m m
m
x xx
1
m
ii
f n
if
Regla de SturgesRegla de Sturges
1 3,3log30
5,8745
5
m Ent
Ent
Es una regla empírica que permite calcular el número m de clases cuando se conoce el tamaño n de la muestra o población.
Ejemplo: para una muestra de tamaño 30 se pueden organizar los datos en 5 clases.
Estadísticas PCQ IP de Chile 2009 32
1 3,3logm Ent n
Un ejemplo numérico de lo vistoUn ejemplo numérico de lo visto
i [ Xi , Xi+1 [ Xi´ fi hi hi(%) Fi Hi
1 [ 160 , 180 [ 170 4 0,29 29,0 4 0,29
2 [ 180 , 200 [ 190 3 0,21 21,0 7 0,50
3 [ 200 , 220 [ 210 2 0,14 14,0 9 0,64
4 [ 220 , 240 [ 230 5 0,36 36,0 14 1,00
Σ 14 1,00 100,0
Estadísticas PCQ IP de Chile 2009 33
Estadísticas PCQ IP de Chile 2009 34
Diagramas de Tallos y Diagramas de Tallos y HojasHojas
3.3.
Los Diagramas de Tallos y Hojas se usan generalmente, como una Los Diagramas de Tallos y Hojas se usan generalmente, como una forma más rápida de representar un conjunto de datos en forma gráfica.forma más rápida de representar un conjunto de datos en forma gráfica.Sirven generalmente para estudiar la dispersión de los valores de una Sirven generalmente para estudiar la dispersión de los valores de una muestra.muestra.El siguiente conjunto de datos correspondientes a los salarios medios El siguiente conjunto de datos correspondientes a los salarios medios mensuales en US$ de doce ejecutivos del banco Lehmann Brothers mensuales en US$ de doce ejecutivos del banco Lehmann Brothers durante el año 2008.durante el año 2008.
4.000 6.342 9.520 3.200 10.350 9.00014.000 14.789 3.286 4.275 3.500 9.834
3.200 3.286 3.500 4.000 4.275 6.3429.000 9.520 9.834 10.350 14.000 14.789
Estadísticas PCQ IP de Chile 2009 35
De este diagrama se puede obtener información como la siguiente:De este diagrama se puede obtener información como la siguiente:
Tallo Hojas
3 200 286 500
4 000 275
6 342
9 000 520 834
10 350
14 000 789
El ejecutivo que tiene el menor salario promedio mensual percibió US$ 3.200.
La mayoría de los ejecutivos percibió un salario promedio mensual que varía entre US$ 3.200 y US$ 9.834.
El ejecutivo que tiene el salario promedio mayor, percibió US$ 14.789.
Son 3 los ejecutivos que percibieron salarios promedios que van desde los US$ 9.000 hasta los US$ 9.834.
etc.
Estadísticas PCQ IP de Chile 2009 36
Recommended