Upload
baldomero-araya
View
244
Download
0
Embed Size (px)
Citation preview
medidas demedidas de resumen resumen
Problema variable en estudio
Ordenar los datos, amplitud y número de clases
Tipo de variable y escala de medida
Tabla de frecuencias
gráfico
Procedimiento En un programa para la detección de hipertensión en una muestra de 30 hombres en edades entre 30 y 40 años, la distribución de la presión diastólica (mínima) en mm Hg fue la siguiente:
70 85 85 75 65 90 110 95 90 70
60 75 80 120 85 95 90 70 100 65
80 90 95 90 95 110 100 85 80 75
La variable en estudio es :
presión diastólica ( medida en mm de Hg)
Problema variable en estudio
Ordenar los datos, amplitud y número de clases
Tipo de variable y escala de medida
Tabla de frecuencias
gráfico
ProcedimientoDentro de los tipos de variables y escalas de medida tenemos:
tipos de variables
escalas de medida
ejemplos
categórica o de atributo
nominal raza, sexo
numéricas
ordinal
intervalo
razón
calificaciones
temperatura
peso, altura
La variable en estudio ( presión diastóloca ,mm de Hg) es numérica, continua . Escala de razón
continuas discretas
Problema variable en estudio
Ordenar los datos, amplitud y número de clases
Tipo de variable y escala de medida
Tabla de frecuencias
gráfico
Procedimiento
60 65 65 70 70 70 75 75 75 80
80 80 85 85 85 85 90 90 90 90
90 95 95 95 95 100 100 110 110 120
La amplitud total = 120 – 60 =
En este caso , entonces, la tabla de frecuencias tendrá aproximadamente 6 clases de amplitud 10 unidades en cada clase
Los datos ordenados en forma creciente:
Número de clases:
60
K = 6 clasesK = 1 + 3.32log n = 5.90
Extensión del intervalo : h
H = A/ K = 60/6 = 10
Otra forma de calcular k es n , en este caso 30 =5.48.Aproximando al entero superior, da 6 clases
Problema variable en estudio
Ordenar los datos, amplitud y número de clases
Tipo de variable y escala de medida
Tabla de frecuencias
gráfico
Procedimiento
60 -70
x f fr F Fr
70 -8080 -9090 -100
100 -110110 -120
total
36792
30
2
0.10.2
0.07
0.230.3
1.0
0.07
3916
27
29
25
0.10.30.530.830.90
1.00120 -130 1 0.03 300.97
Problema variable en estudio
Ordenar los datos, amplitud y número de clases
Tipo de variable y escala de medida
Tabla de frecuencias
gráfico
Procedimiento
0
2
4
6
8
10
mmHg
f
60 70 80 90 100 110 120 130
De acuerdo con el tipo de variable (numérica ,continua) y su escala de medida (de razón), el gráfico más adecuado sería un histograma o un Polígono de frecuencias. En este ejemplo se utiliza un
Histograma de la distribución de presión diastólica en mm de Hg según las frecuencias absolutas
RESUMEN DE DATOS
Dan una idea global de la forma
tablas gráficos
Una forma rápida de tener información sobre una distribución
Se puede hacer a través de
MEDIDAS DE RESUMEN
medidas de tendencia central
MEDIA
MEDIANA
MODA
ó
Otra forma es a través de las
MEDIDAS DE RESUMEN medidas de tendencia central medidas de dispersión
AMPLITUD TOTAL
VARIANZA y
DESVIACIÓN TIPICA
SEMIRRECORRIDO INTERCUARTILICO
COEFICIENTE DE VARIACION
A
Q
CV
2 2
0.20
0.80
MEDIDAS DE RESUMEN medidas de tendencia central medidas de dispersión medidas de posición
0.40
P20 P40 P80
SEPARATRICES ó CUANTILES : deciles
cuartiles
percentiles
D
Q
P
MEDIDAS DE RESUMEN medidas de tendencia central medidas de dispersión medidas de posición medidas de asimetría (sesgo)
asimetría positiva
asimetría negativa
distribución simétrica
MEDIDAS DE RESUMEN medidas de tendencia central medidas de dispersión medidas de posición medidas de asimetría
medidas de apuntamiento o curtosis
Distrib. leptocurtica Distrib. platicurtica
en azul la distribución normal (de referencia) distribución mesocurtica
medidas de tendencia central y dispersión forman
DUOSMedia - Varianza ydesviación típica
Mediana - Semirrecorrido intercuartílico
Moda -Amplitud total
Según teoría de momentos
Según el método de las separatrices
Según el método de los extremos
Datos numéricos – distribuciones simétricas o asimétricas con muchas observaciones
Datos ordinales o numéricos distribución asimétrica y con pocas observaciones-
Datos nominales Distribuciones bimodales
Moda y Amplitud total
Moda(Mo)
Amplitud totalo recorrido (A)
Rol estadistico(lista ordenada)
Valor más repetido(de mayor frecuentcia)
Ls – Li
(límites reales) Tabla de frec.Sin agrupar
x|f =máx
Tabla de frec.agrupados
Ls – Li (límites reales de las clases superior e inferior)
hLi
21
1
Datos nominales Distribuciones bimodales
12
x
h
LiLimite inferior de la clase modal
Diferencia entre la frecuencia de la clase modal y la clase anterior
Diferencia entre la frecuencia de la clase modal y la clase siguiente
Extensión del intervalo
Mo
Mediana y semirrecorrido intercuartilico
Mediana(Mn)
Semirrecorrido intercuartilico (Q)
Rol estadistico(lista ordenada)
Valor central (si n es impar)
Promedio de valores centrales
( si n es par)
P75 – P25
2
Q3 – Q1
2
Tabla de frec.Sin agrupar
Tabla de frec.agrupados
h
fFan
Li
2/
ó
Datos ordinales o numéricos ; o se usa en Distribución asimétrica y con pocas observaciones
x
Fr
1
0.75
0.5
0.25
0
P25 P50 P75
Q1 Q2 Q3mediana
recorrido intercuartil
105 110 112 112 118 119 120 120 120 125 126 127 128 130 132 133 134 135 138 138 138 138 141 142 144 145 146 148 148 148 149 150 150 150 151 151 153 153 154 154 154 154 155 156 156 158 160 160 160 163 164 164 165 166 168 168 170 172 172 176 179
Niveles de Hb en 61 adultos normales
Un resumen de esta serie en 5 valores
Min =105 ; Max =179; Q1 = 133.5 ; Q3 = 159 ; Q2 =Mn= 149.5
179105 133.5 149,5 159
recorrido intrercuartil
Min Max
Mn
149.5
Q1 Q3
133.5
159
Media Varianza
Desviación típica = var
Rol estadistico(lista ordenada)
Tabla de frec.Sin agrupar
Tabla de frec.agrupados
Media - Varianza y Desviación típica
nx
ó
nfx
nxf
2 2
nxx 2
nxxf 2
nxxf 2
1
2
nxx
1
2
nxxf
1
2
nxxf
Datos numéricos ;distribuciones simétricas o asimétricas con muchas observaciones
Histograma
2
7
5
8
11
15
8
4
0
2
4
6
8
10
12
14
16
100 110 120 130 140 150 160 170 180 Hb
f
Mismo ejemplo anterior
DATOS SIN AGRUPAR
Niveles de Hb (g/l) Media 145,715 Mediana 149,5Moda 138Desviaciónestándar 18,13 Curtosis -0,6643 Coeficiente de asimetría -0,3531Amplitud total 74Mínimo 105Máximo 179n 60
DATOS AGRUPADOS
Media 144,33Mediana 147,22Moda 153,64 Desviaciónestándar 18,67
Es la que más varia al agrupar
Al agrupar los datos se produce una perdida de información: Niveles de Hb (g/l) en 60 adultos normales
En este caso el limite superior está incluido en la clase anterior
ejemplo: Hb, en statgraphics