12
ESTADÍSTICA DESCRIPTIVA Describe el comportamiento de un conjunto de datos por medio de: Tablas de distribución de frecuencias Gráficas Calcula medidas de tendencia central Calcula medidas de dispersión Calcula medidas de posición (cuartiles y percentiles) Calcula medidas de forma (distribución) COMPETENCIA: Analizar conjuntos de datos por medio de métodos de estadística descriptiva para conocer características de muestras o poblaciones de origen biológico.

Estadistica y Probabilidad

Embed Size (px)

DESCRIPTION

Estadistica inferencial

Citation preview

Page 1: Estadistica y Probabilidad

ESTADÍSTICA DESCRIPTIVA

Describe el comportamiento de un conjunto de datos por medio de:

• Tablas de distribución de frecuencias

• Gráficas

• Calcula medidas de tendencia central

• Calcula medidas de dispersión

• Calcula medidas de posición (cuartiles y percentiles)

• Calcula medidas de forma (distribución)

COMPETENCIA:

Analizar conjuntos de datos por medio de métodos de estadística

descriptiva para conocer características de muestras o poblaciones

de origen biológico.

Page 2: Estadistica y Probabilidad

Se seleccionaron aleatoriamente a 40 estudiantes de una Facultad y se les determinó

el peso corporal. Se desea realizar la estadística descriptiva para estos datos:

Peso de los 40 estudiantes:

138 164 150 132 144 125 149 157

146 158 140 147 136 148 152 144

168 126 138 176 163 119 154 165 n = 40

146 173 142 147 135 153 140 135

161 145 135 142 150 156 145 128

Para realizar la Tabla de Distribución de Frecuencias: Se ordenan los datos ascendentemente

119 135 138 144 146 150 156 164

125 135 140 144 147 150 157 165

126 135 140 145 147 152 158 168

128 136 142 145 148 153 161 173

132 138 142 146 149 154 163 176

Rango = Xmax – Xmin = 176-119 = 57

El número de intervalos k = 1+3.32 ( log 40 ) = 6.32 consideremos 6 clases

El ancho del intervalo C = R / k = 57 / 6 = C = 9.5

Page 3: Estadistica y Probabilidad

Intervalos Frec.

Absolutas

Marca de

Clase

Frecuencias

Acumulativas

  f Xi f a

119 – 128.5

128.5 – 138

138 – 147.5

147.5 – 157

157 – 166.5

166.5 – 176

C = 9.5

Frecuencias

Relativas

Frecuencia

Relativa

(%)

4

7

12

9

5

3

f = 40

123.75

133.25

142.75

152.25

161.75

171.25

 

4/40=0.100

7/40=0.175

12/40=0.30

9/40=0.225

5/40=0.125

3/40=0.075

 

10

17.5

30

22.5

12.5

7.5

 

4

11

23

32

37

40

 

TABLA DE DISTRIBUCIÓN DE FRECUENCIAS ABSOLUTAS

119 135 138 144 146 150 156 164

125 135 140 144 147 150 157 165

126 135 140 145 147 152 158 168

128 136 142 145 148 153 161 173

132 138 142 146 149 154 163 176

Datos ordenados ascendentemente:

Page 4: Estadistica y Probabilidad

HISTOGRAMA DE FRECUENCIAS ABSOLUTAS

4

7

12

9

5

3

0

2

4

6

8

10

12

14

119.0-128.5 128.5-138.0 138.0-147.5 147.5-157.0 157.0-166.5 166.5-176.0

Fre

cue

nci

as a

bso

luta

s

Límites reales de clase

Histograma

Page 5: Estadistica y Probabilidad

0

2

4

6

8

10

12

14

114.25 123.75 133.25 142.75 152.25 161.75 171.25 180.75

Fre

cu

encia

s ab

solu

tas

Marcas de clase

Poligono de frecuencias

Page 6: Estadistica y Probabilidad

0

10

20

30

40

50

114.25 123.75 133.25 142.75 152.25 161.75 171.25

Fre

cue

nci

as a

cum

ula

tiva

s

Marcas de clase

Ojiva

Page 7: Estadistica y Probabilidad

MEDIDAS DE TENDENCIA CENTRAL

Moda = 135.0

Moda el dato que presenta la mayor frecuencia

Mediana el dato que parte a la mitad el conjunto

Mediana = 146.0

Media Aritmética

8.14640

176...125119Xi321

nn

XXXXX n

Page 8: Estadistica y Probabilidad

Sean X1, X2, X3, …. , Xn Las estaturas de n estudiantes medidas en metros

XX X X X

n

X

n

X

n

N j

1 2 3

El promedio o media aritmética estará dado por:

Qué es esto (Xm – X ) ?

En Matemáticas En Estadística

Diferencia o Resta Desviación o Variación

Qué es esto (Xm – X )2 ? Diferencia cuadrática Desviación cuadrática

Qué es esto Σ(Xi – X )2

------------ ?

n

Promedio de Promedio de

Diferencias cuadráticas Desviaciones cuadráticas

n

XXis

2

2)(

Es la varianza: promedio de desviaciones cuadráticas

Pero tenemos un problema: la varianza tiene unidades cuadráticas

y no se puede relacionar con media ni con los datos originales. Qué hacer?

2( )jX Xs

n

Esto es la Desviación Estándar. Mide el grado de variabilidad

de los datos respecto a su media

Page 9: Estadistica y Probabilidad

MEDIDAS DE DISPERSIÓN

RANGO = dato mayor – dato menor= 176-119 = 57

COEFICIENTE DE VARIACIÓN = C.V. = (12.89/146.8)*100 = 0.087*100 = 8.7%

1n

)XXi(s

2

2

VARIANZA = = 165.89

DESVIACIÓN ESTÁNDAR = S = √S² = √165.89 = 12.89

ERROR ESTÁNDAR = ES = S/√n = 12.89/√40 = 2.038

Page 10: Estadistica y Probabilidad

Donde: i (=1, 2, 3, …, 99) es el número del percentil y n el tamaño de muestra

MEDIDAS DE POSISCIÓN

10(40+1)

P10= ------------ = 4, el percentil 10 se encuentra en la posición 4 128.

100

90(40+1)

P90 = --------------- = 36.9, por lo tanto el P90 corresponde al promedio de los datos

100 en la posición 36 y 37; (164+165)/2 164.5

Percentiles

Cuartiles

Los cuartiles dividen a la distribución de los datos (ordenados ascendentemente) en

cuatro (4) partes iguales en frecuencia. El primer cuartil Q1 se encuentra en la posición

de n / 4, el Q2 corresponde con la mediana y el Q3 en 3n / 4.

Q1 = 138.0 Q2 = 146.0 Q3 = 154.0

Page 11: Estadistica y Probabilidad

SESGO

El sesgo es el grado de asimetría, o falta de simetría, de una distribución.

Si la curva de frecuencias (polígono de frecuencias suavizado) de una distribución

tiene una <cola> más larga a la derecha del máximo central que a la izquierda, se

dice de la distribución que está sesgada a la derecha o que tiene sesgo positivo. Si es

al contrario, se dice que está sesgada a la izquierda o que tiene sesgo negativo.

3( ) 3( )Media Mediana X MdSesgo

desviacion tipica s

Sesgo = 3(146.8-146)/12.89 = 0.18

Su interpretación es:

a) Si el sesgo = 0, la distribución es simétrica ( X = Md)

b) Si el sesgo > 0, la distribución es asimétrica a la derecha ( X > Md).

c) Si el sesgo < 0, la distribución e asimétrica a la izquierda ( X < Md).

En nuestro ejemplo el sesgo positivo de 0.18 indica que la distribución

es ligeramente asimétrica a la derecha.

MEDIDAS DE FORMA

Page 12: Estadistica y Probabilidad

Es el grado de apuntamiento de una distribución, normalmente se toma en relación a

la distribución normal. Una distribución que presenta un apuntamiento relativo alto,

se llama leptocúrtica, mientras que la curva más achatada, se llama platicúrtica. La

distribución, que ni es apuntada ni achatada, se llama mesocúrtica (normal).

CURTOSIS

KQ

P P

90 10

donde Q = ½(Q3 - Q1) es el rango semintercuartílico. Se conoce como

coeficiente de curtosis percentílico. Para la distribución normal es 0,263.

Para los pesos de los estudiantes curtosis = K = ½(155-138)/(164.5-128) = 0.233

Su interpretación es como sigue:

Si la curtosis = 0.263, la distribución es mesocúrtica ( normal).

Si la curtosis es > 0.263, la distribución es leptocúrtica (más apuntada que la normal).

Si la curtosis es < 0.263, entonces la distribución es platicúrtica (más plana que la normal).

En nuestro ejemplo el valor de la curtosis = 0.233 (menor que 0.263) indica que la

distribución es ligeramente platicúrtica.