20
DR. DENY GONZALEZ UNIVERSIDAD ALONSO DE OJEDA ESTADISTICA I UNIDAD I FUNDAMENTOS DE ESTADISTICA Y ANALISIS DE DATOS (GUIA DE ESTUDIO) MAYO 2016

UNIVERSIDAD ALONSO DE OJEDA ESTADISTICA I · Regla de Spiegel: Se construyen entre 5 y 20 clases. ... UNIDAD I. FUNDAMENTOS DE ESTADISTICA Y ANALISIS DE DATOS Para crear los intervalos

Embed Size (px)

Citation preview

DR. DENY GONZALEZ

UNIVERSIDAD ALONSO DE OJEDAESTADISTICA I

UNIDAD IFUNDAMENTOS DE ESTADISTICA Y ANALISIS DE DATOS

(GUIA DE ESTUDIO)

MAYO 2016

La Estadística ……

“incluye la recopilación, presentación y caracterización de la informacióna fin de que auxilie tanto en el análisis de datos como en el proceso detoma de decisiones”. (Berenson y Levine, 1992).

“es un conjunto de métodos para la toma de decisiones en condiciones deincertidumbre”. (Harnett y Murphy, 1987 )

DESCRIPTIVA:Métodos que incluyen larecolección, presentación ycaracterización de unconjunto de datos con el finde describir apropiadamentelas diversas características deese conjunto de datos.

INFERENCIAL:Métodos que hacen posiblela estimación de unacaracterística de unapoblación o la toma de unadecisión referente a unapoblación, basándose sólo enlos resultados de la muestra.

UNIDAD I. FUNDAMENTOS DE ESTADISTICA Y ANALISIS DE DATOS

Población Muestra Muestreo Aleatorio

Herramientas Estadísticas

Mediana Muestral

2

)1)2/(()2/(

2/)1(

nn

n ; n es impar

; n es par

Media Muestraln

x

x

n

i

i 1

Moda

Varianza Muestral1

)(

1

2

2

n

xx

S

n

i

i

Desviación estándar muestral (S)

Media PoblacionalN

x

N

xxx iN

...21

1,2,3,4,4,4,5,6,7

𝑠2 =1

𝑛 − 1

𝑖=1

𝑛

𝑋𝑖2 − 𝑛( 𝑋)2

UNIDAD I. FUNDAMENTOS DE ESTADISTICA Y ANALISIS DE DATOS

Ejemplo: El número de respuestas incorrectas en una prueba de competencia de

falso o verdadero para una muestra aleatoria de 15 estudiantes fueron los siguientes:

2,1,3,0,1,3,6,0,3,3,5,2,1,4 y 2. Encuentre: a) la media, b) la mediana c) la moda, d)

varianza y desviación estándar.

a)n

x

x

n

i

i 1 4.2

15

36x

b) 2/)1( nEs impar x(15+1)/2 = x8 = 2

Ordenar datos: 0,0,1,1,1,2,2,2,3,3,3,3,4,5,6

c) 0,0,1,1,1,2,2,2,3,3,3,3,4,5,6

d)

x f x2 x2 *f x*f

0 2 0 0 0

1 3 1 3 3

2 3 4 12 6

3 4 9 36 12

4 1 16 16 4

5 1 25 25 5

6 1 36 36 6

15 91 128 36

9714.2)115(*15

)36()128*15( 22

S

)1(*

***

1

2

1

2

2

nn

fxfxn

S

k

i

k

i

iiii

e) S = 1.7237n

fx

x

k

i

ii 1

*

𝑠2 =1

𝑛 − 1

𝑖=1

𝑛

𝑋𝑖2 − 𝑛( 𝑋)2

(1/14)(128-15*2.42)=2.9714

UNIDAD I. FUNDAMENTOS DE ESTADISTICA Y ANALISIS DE DATOS

Cuando se trabaja con conjuntos grandes de datos, es útil organizarlos

y resumirlos por medio de la construcción de una tabla que liste los

distintos valores posibles de los datos, individual o por grupos, junto

con el número de veces que se presentan dichos valores. (frecuencias)

Ordenamiento de notas en Estadística

9 9 10 11 11

11 12 12 13 13

13 14 14 14 14

16 17 17 19 20

Clase Frecuencia

9 - 11 6

12 - 14 9

15 - 17 3

18 - 20 2

Diferencia entre ordenamiento de datos y frecuencia

DISTRIBUCIÓN DE FRECUENCIAS

UNIDAD I. FUNDAMENTOS DE ESTADISTICA Y ANALISIS DE DATOS

Si se agrupan en intervalos de clase y se cuenta el número deindividuos que pertenece a cada intervalo.

Regla de Spiegel: Se construyen entre 5 y 20 clases.

Regla de Sturgess: El número de clases viene dado por el valor de k, donde:

)( log1 5003,322 nnk

Regla Empírica: El número de clases viene dado por:

nk

Es necesario primero determinar el número óptimo de clases ocategorías (k) y luego construirlos.

DISTRIBUCIÓN DE FRECUENCIAS

UNIDAD I. FUNDAMENTOS DE ESTADISTICA Y ANALISIS DE DATOS

Ordenamiento de notas en Estadística

9 9 10 11 11

11 12 12 13 13

13 14 14 14 14

16 17 17 19 20

Clase Frecuencia

7 - 9 2

10 - 12 6

13 - 15 7

16 - 18 3

19 - 21 2

Regla de Spiegel: 5 clases

Regla de Sturgess: k=1+3.322*log(20) = 5.322

Regla Empírica: K=raíz(20) = 4.47

DISTRIBUCIÓN DE FRECUENCIAS

Rango

KAncho de Clase =

Se selecciona k=5

(20-9)/5 = 2.75 aprox 3

Calcula los límites superiores sumándole al límite inferior el ancho de clase menosuna unidad, una décima o una centésima, según sea el caso para evitar que loslímites de un intervalo y el siguiente tengan los mismos valores. Ejemplo 3-1=2

UNIDAD I. FUNDAMENTOS DE ESTADISTICA Y ANALISIS DE DATOS

ESTIMADOR

Un estimador de un parámetro poblacional es una función de los datos

muestrales. En pocas palabras, es una fórmula que depende de los valores

obtenidos de una muestra, para realizar estimaciones.

Por ejemplo, un estimador de la media poblacional, μ, sería la media muestral,

, según la siguiente fórmula:

Donde (x1, x2, ..., xn) sería el conjunto de datos de la muestra.

MUESTREOS PROBABILISTICOS

Muestreo aleatorio simple

Muestreo aleatorio sistematico

Muestreo aleatorio estratificado

MUESTREO NO PROBABILISTICOS

Muestreo por cuotas

Muestreo intencional o por conveniencia

Bola de nieve.

TIPOS DE MUESTRA

UNIDAD I. FUNDAMENTOS DE ESTADISTICA Y ANALISIS DE DATOS

UNIDAD I. FUNDAMENTOS DE ESTADISTICA Y ANALISIS DE DATOS

› Obtención de intervalos de clase

› Es conveniente que cada intervalo tenga lamisma medida (o anchura).

Valor más alto – Valor más bajo

Selección del número de clases

Una gran cantidad de observaciones requiere un mayor número

de clases. Sin embargo una distribución de frecuencias debe

tener como mínimo 5 clases, pero no mas de 15

Número de clases deseadoAncho de Clase =

UNIDAD I. FUNDAMENTOS DE ESTADISTICA Y ANALISIS DE DATOS

16,87 16,87 13,13 18,87 12,91 14,26

11,70 13,47 15,85 16,98 13,58 14,15

16,98 10,75 13,96 15,85 12,08 15,28

18,49 19,25 20,00 15,70 17,21 13,36

13,21 19,62 17,77 13,96 18,04 15,62

15,62 18,11 15,47 14,45 13,58 11,25

16,30 19,25 16,23 14,72 14,94 13,36

18,11 16,23 12,79 16,87 12,04

11,70 17,74 13,92 12,45 10,75

17,66 15,25 16,75 20,00 11,47

TABLA DE DISTRIBUCIÓN DE FRECUENCIAS

UNIDAD I. FUNDAMENTOS DE ESTADISTICA Y ANALISIS DE DATOS

Para crear los intervalos de clase, sigue los siguientes pasos:

Donde: r rango valor más alto valor más bajo.k número de clases.

20,00 10,751,32 1,4

7a

.r

ak

1. Calcula el ancho o amplitud de la clase (a) mediante la fórmula:

2. Construye una tabla con 4 columnas y un número de filas igual al númerode clases más dos . Coloca en la primera fila lo que se indica.)( 927

Intervalo de clase

Frecuencia Absoluta

Frecuencia Relativa

(%)

Frecuencia Relativa

Acumulada (%)

UNIDAD I. FUNDAMENTOS DE ESTADISTICA Y ANALISIS DE DATOS

3. Cada intervalo de clase está limitado por dos valores, llamados límitesde clase (límite inferior y límite superior). Elije como límite inferior alvalor más bajo o uno cercano a él y colócalo en la segunda fila.

Intervalo de clase

Frecuencia Absoluta

Frecuencia Relativa

(%)

Frecuencia Relativa

Acumulada (%)

10,75

UNIDAD I. FUNDAMENTOS DE ESTADISTICA Y ANALISIS DE DATOS

4. En la tercera fila coloca el resultado de sumar el valor inicial más laamplitud de clase. Luego en cada una de las restantes filas coloca lasuma del resultado anterior más la amplitud hasta completar el total deintervalos de clases.

Intervalo de clase

Frecuencia Absoluta

Frecuencia Relativa

(%)

Frecuencia Relativa

Acumulada (%)

10,75

12,15

13,55

14,95

16,35

17,75

19,15

10,75+1,4

12,15+1,4

13,55+1,4

14,95+1,4

16,35+1,4

17,75+1,4

UNIDAD I. FUNDAMENTOS DE ESTADISTICA Y ANALISIS DE DATOS

Intervalo de clase

Frecuencia Absoluta

Frecuencia Relativa

(%)

Frecuencia Relativa

Acumulada (%)

10,75 – 12,14

12,15 – 13,54

13,55 – 14,94

14,95 – 16,34

16,35 – 17,74

17,75 – 19,14

19,15 – 20,54

5. Calcula los límites superiores sumándole al límite inferior el ancho declase menos una unidad, una décima o una centésima, según sea elcaso para evitar que los límites de un intervalo y el siguiente tenganlos mismos valores. ),,,( 39101041

10,75+1,39

12,15+1,39

13,55+1,39

14,95+1,39

16,35+1,39

17,75+1,39

UNIDAD I. FUNDAMENTOS DE ESTADISTICA Y ANALISIS DE DATOS

6. Cuenta los datos ordenados en orden ascendente (Frecuencia Absoluta)y clasificados por ubicación en los intervalos.

19,25

19,25

19,62

20,00

20,00

17,77

18,04

18,11

18,11

18,49

18,87

16,75

16,87

16,87

16,87

16,98

16,98

17,21

17,66

17,74

15,25

15,28

15,47

15,62

15,62

15,70

15,85

15,85

16,23

16,23

16,30

13,58

13,58

13,92

13,96

13,96

14,15

14,26

14,45

14,72

14,94

12,45

12,79

12,91

13,13

13,21

13,36

13,36

13,47

10,75

10,75

11,25

11,47

11,70

11,70

12,04

12,08

10,75 – 12,14 12,15 – 13,54 13,55 – 14,94 14,95 – 16,34 16,35 – 17,74 17,75 – 19,14 19,15 – 20,54

8 8

10

11

9

6

5

UNIDAD I. FUNDAMENTOS DE ESTADISTICA Y ANALISIS DE DATOS

Intervalo de clase

Frecuencia Absoluta

Frecuencia Relativa

(%)

Frecuencia Relativa

Acumulada (%)

10,75 – 12,14 8

12,15 – 13,54 8

13,55 – 14,94 10

14,95 – 16,34 11

16,35 – 17,74 9

17,75 – 19,14 6

19,15 – 20,54 5

7. Escribe en la columna deFrecuencia Absoluta losvalores correspondientes.

8. Escribe TOTAL en la últimafila y primera columna y lasuma de las frecuenciasabsolutas (es igual a n) enla última fila y segundacolumna.

Intervalo de clase

Frecuencia Absoluta

Frecuencia Relativa

(%)

Frecuencia Relativa

Acumulada (%)

10,75 – 12,14 8

12,15 – 13,54 8

13,55 – 14,94 10

14,95 – 16,34 11

16,35 – 17,74 9

17,75 – 19,14 6

19,15 – 20,54 5

TOTAL 57

UNIDAD I. FUNDAMENTOS DE ESTADISTICA Y ANALISIS DE DATOS

8. Calcula la Frecuencia Relativa en porcentaje y colócala en la terceracolumna.

Intervalo de clase

Frecuencia

Absoluta

Frecuencia

Relativa (%)

Frecuencia

RelativaAcumulada (%)

10,75 – 12,14 8 14,04

12,15 – 13,54 8 14,04

13,55 – 14,94 10 17,54

14,95 – 16,34 11 19,29

16,35 – 17,74 9 15,79

17,75 – 19,14 6 10,53

19,15 – 20,54 5 8,77

TOTAL 57 100

8 100

578 100

5710 100

5711 100

579 100

576 100

575 100

57

UNIDAD I. FUNDAMENTOS DE ESTADISTICA Y ANALISIS DE DATOS

9. Calcula la Frecuencia Relativa Acumulada en porcentaje y colócala en lacuarta columna.

Intervalo de clase

Frecuencia Absoluta

Frecuencia Relativa

(%)

Frecuencia Relativa

Acumulada (%)

10,75 – 12,14 8 14,04 14,04

12,15 – 13,54 8 14,04 28,08

13,55 – 14,94 10 17,54 45,62

14,95 – 16,34 11 19,29 64,91

16,35 – 17,74 9 15,79 80,7

17,75 – 19,14 6 10,53 91,23

19,15 – 20,54 5 8,77 100

TOTAL 57 100

14,04 14,04

28,08 17,54

45,62 19,29

64,91 15,79

80,7 10,53

91,23 8,77

UNIDAD I. FUNDAMENTOS DE ESTADISTICA Y ANALISIS DE DATOS

UNIDAD I. FUNDAMENTOS DE ESTADISTICA Y ANALISIS DE DATOS