62
PROBABILIDAD Unidad I Ordenamiento de la Información 1

PROBABILIDAD - Sitio de recursos para estudiantes · La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico

Embed Size (px)

Citation preview

PROBABILIDADUnidad I Ordenamiento de la Información

1

Captura de datos muestrales2

Conceptos básicos de la estadística

Población (o universo): Totalidad de elementos o

cosas bajo consideración

Muestra: Es una parte de la población seleccionada

para el análisis.

Parámetro: Es una medida numérica que describe

una característica de la población

Estadístico: Es la medida numérica que describe

alguna característica de la muestra

3

Tipos de Muestras

Tipos de muestras usadas

Muestras no probabilísticas

Muestra de juicio

Muestra de cuota

De parte Grande

Muestras de probabilidad

Muestra Aleatoria

simple

Muestra sistemática

Muestra estratificada

Muestra de agrupación

4

Recolección de Datos

Proporcionados por una organización o un

individuo.

El diseño de un Experimento

Una encuesta

Un estudio observacional

5

Tipos de Datos

Tipo de Dato Tipo de Preguntas Respuestas

Categórico

Numérico

¿Posee actualmente algunas acciones o bonos? Si | No

Discreto

Continuo

¿A cuántas revistas está

Suscrito actualmente?

¿Cuánto mide?

______ Número

______ Metros

6

Diseño del cuestionario

Propósito: Recabar información significativa que nos

ayude en el proceso de toma de decisiones.

Formular preguntas cortas, libres de

ambiguedades.

¿Fuma Usted? ____ Si ____No

¿Cuántos Años tiene? ____ (en años)

Pruebas piloto

7

Elección de la muestra

Para seleccionar la muestra pueden usarse 2

métodos básicos:

Con remplazo

Sin remplazo

Uso de tabla de números aleatorios

8

Organización de los datos numéricos

Arreglo Ordenado

Diagrama de tallo y hojas

9

Distribución de frecuencias

Es una tabla de resumen en la que los datos se

disponen en agrupamientos o categorías

convenientemente establecidas de clases ordenadas

numéricamente.

10

Tipos de frecuencias11

Frecuencia absoluta

La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico.

Se representa por fi

La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N.

Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria.

Tipos de frecuencias12

Frecuencia relativa

La frecuencia relativa es el cociente entre la

frecuencia absoluta de un determinado valor y el

número total de datos.

Se puede expresar en tantos por ciento y se

representa por ni.

La suma de las frecuencias relativas es igual a 1.

Tipos de frecuencias13

Frecuencia acumulada

La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.

Se representa por Fi.

Frecuencia relativa acumulada

La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento.

Ejemplo14

Durante el mes de julio, en una ciudad se han

registrado las siguientes temperaturas máximas:

32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29,

30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31,

34, 33, 33, 29, 29.

xi Recuento fi Fi ni Ni

32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31,

31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29

15

xi Recuento fi Fi ni Ni

27 I 1 1 0.032 0.032

28 II 2 3 0.065 0.097

29 IIIII I 6 9 0.194 0.290

30 IIIII II 7 16 0.226 0.0516

31 IIIII III 8 24 0.258 0.774

32 III 3 27 0.097 0.871

33 III 3 30 0.097 0.968

34 I 1 31 0.032 1

31 1

Este tipo de tablas de frecuencias se utiliza con variables discretas.

Distribución de frecuencias agrupadas16

La distribución de frecuencias agrupadas o tabla

con datos agrupados se emplea si las variables

toman un número grande de valores o la variable

es continua.

Se agrupan los valores en intervalos que tengan

la misma amplitud denominados clases. A cada

clase se le asigna su frecuencia correspondiente.

17

Límites de la clase

Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.

Amplitud de la clase

La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase.

Marca de clase

La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo elintervalo para el cálculo de algunos parámetros.

Construcción de una tabla de

frecuencias agrupadas18

3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.

1º Se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48.

2º Se restan y se busca un número entero un poco mayor que la diferencia y que sea divisible por el número de intervalos queramos establecer.

Es conveniente que el número de intervalos oscile entre 5 y 15.

En este caso, 48 - 3 = 45, incrementamos el número hasta 50 / 5 = 10 intervalos.

Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece al intervalo, pero el límite superior no pertenece intervalo, se cuenta en el siguiente intervalo.

3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34,

36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35,

28, 38, 41, 48, 15, 32, 13.19

ci fi Fi ni Ni

[0, 5) 2.5 1 1 0.025 0.025

[5, 10) 7.5 1 2 0.025 0.050

[10, 15) 12.5 3 5 0.075 0.125

[15, 20) 17.5 3 8 0.075 0.200

[20, 25) 22.5 3 11 0.075 0.2775

[25, 30) 27.5 6 17 0.150 0.425

[30, 35) 32.5 7 24 0.175 0.600

[35, 40) 37.5 10 34 0.250 0.850

[40, 45) 42.5 4 38 0.100 0.950

[45, 50) 47.5 2 40 0.050 1

40 1

Ejercicios20

Las puntuaciones obtenidas por un grupo en una

prueba han sido:

15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16,

20, 16, 15, 18, 16, 14, 13.

Construir la tabla de distribución de frecuencias

21

El número de estrellas de los hoteles de una ciudad

viene dado por la siguiente serie:

3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2,

2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1, 2, 2, 4, 1.

Construir la tabla de distribución de frecuencia

22

Los pesos de 65 Empleados de una fabrica

Peso [50, 60) [60, 70) [70, 80) [80,90) [90, 100)[100,

110)

[110,

120)

fi 8 10 16 14 10 5 2

Definición de parámetro estadístico23

Un parámetro estadístico es un número que se

obtiene a partir de los datos de una distribución

estadística.

Los parámetros estadísticos sirven para sintetizar

la información dada por una tabla o por una

gráfica.

Tipos de parámetros estadísticos24

Hay tres tipos parámetros estadísticos:

De centralización.

De posición

De dispersión.

Medidas de Centralización25

Nos indican en torno a qué valor (centro) se distribuyen

los datos.

Media aritmética

La media es el valor promedio de la distribución.

Mediana

La mediana es la puntación de la escala que separa la

mitad superior de la distribución y la inferior, es decir

divide la serie de datos en dos partes iguales.

Moda

La moda es el valor que más se repite en una distribución.

Medidas de posición26

Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de individuos.

Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a mayor.

La medidas de posición son:

Cuartiles

Los cuartiles dividen la serie de datos en cuatro partes iguales.

Deciles

Los deciles dividen la serie de datos en diez partes iguales.

Percentiles

Los percentiles dividen la serie de datos en cien partes iguales.

Medidas de dispersión27

Rango o recorrido

El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística.

Desviación media

La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media.

Varianza

La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media.

Desviación típica

La desviación típica es la raíz cuadrada de la varianza.

Trabajo Parcial 128

Fecha de entrega: 07 Septiembre de 2011

Encuestar a 25 estudiantes de la escuela de sistemas sobre Cultura y Deporte

Elaborar la Distribución de frecuencias para cada una de las preguntas

Para Cada distribución calcular los parámetros estadísticos de centralización y de dispersión

Graficar los resultados de las distribuciones.

Minimo de preguntas para la encuesta: 7

Incluir evidencias de encuesta!!!!!

Moda29

La moda es el valor que tiene mayor frecuencia

absoluta.

Se representa por Mo.

Se puede hallar la moda para variables

cualitativas y cuantitativas.

Hallar la moda de la distribución:

2, 3, 3, 4, 4, 4, 5, 5 Mo= 4

Moda30

Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la distribución esbimodal o multimodal, es decir, tiene varias modas.

1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9

Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.

2, 2, 3, 3, 6, 6, 9, 9

Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos puntuaciones adyacentes.

0, 1, 3, 3, 5, 5, 7, 8Mo = 4

Moda (datos agrupados)31

Li es el límite inferior de la clase modal.

fi es la frecuencia absoluta de la clase modal.

fi-1 es la frecuencia absoluta inmediatamente

inferior a la clase modal.

fi+1 es la frecuencia absoluta inmediatamente

posterior a la clase modal.

ai es la amplitud de la clase.

Moda32

También se utiliza otra fórmula de la moda que da

un valor aproximado de ésta:

Ejemplo (Moda)33

Calcular la moda de una distribución estadística

que viene dada por la siguiente tabla:

Ejemplo (Moda)34

Mediana35

Es el valor que ocupa el lugar central de todos

los datos cuando éstos están ordenados de menor

a mayor.

La mediana se representa por Me.

La mediana se puede hallar sólo para variables

cuantitativas.

Calculo de la Mediana36

1 Ordenamos los datos de menor a mayor.

2 Si la serie tiene un número impar de

medidas la mediana es la puntuación central de

la misma.

2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5

3 Si la serie tiene un número par de puntuaciones

la mediana es la media entre las

dos puntuaciones centrales.

7, 8, 9, 10, 11, 12Me= 9.5

Calculo para datos agrupados37

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas.

Es decir tenemos que buscar el intervalo en el que se encuentre .

Li es el límite inferior de la clase donde se encuentra la mediana.

fi es la frecuencia absoluta.

Fi-1 es la frecuencia acumulada anterior a la clase mediana.

ai es la amplitud de la clase.

Ejemplo (Mediana)38

Media aritmética39

La media aritmética es el valor obtenido

al sumar todos los datos y dividir el resultado

entre el número total de datos.

es el símbolo de la media aritmética.

Media aritmética para datos

agrupados40

Si los datos vienen agrupados en una tabla de

frecuencias, la expresión de la media es:

Ejercicio (Media Aritmética)41

En un test realizado a un grupo de 42 personas se

han obtenido las puntuaciones que muestra la

tabla. Calcula la puntuación media.

42

43

Los pesos de 65 Empleados de una fabrica

Peso [50, 60) [60, 70) [70, 80) [80,90) [90, 100)[100,

110)

[110,

120)

fi 8 10 16 14 10 5 2

Encontrar para datos agrupados Me, Mo , x

Cuartiles44

Los cuartiles son los tres valores de la variable

que dividen a un conjunto de datos

ordenados en cuatro partes iguales.

Q1, Q2 y Q3 determinan los valores

correspondientes al 25%, al 50% y al 75% de

los datos.

Q2 coincide con la mediana.

Cálculo de los cuartiles45

1 Ordenamos los datos de menor a mayor.

2 Buscamos el lugar que ocupa

cada cuartil mediante la expresión .

Cálculo de Cuartiles46

Cuartiles para datos agrupados47

En primer lugar buscamos la clase donde se encuentra , en la tabla de las frecuencias acumuladas.

Li es el límite inferior de la clase donde se encuentra el cuartil.

N es la suma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase del cuartil.

ai es la amplitud de la clase

Ejercicio48

49

Percentiles50

Los percentiles son los 99 valores que dividen la

serie de datos en 100 partes iguales.

Los percentiles dan los valores correspondientes al

1%, al 2%... y al 99% de los datos.

P50 coincide con la mediana y con el cuartil 2.

Cálculo de precentiles51

Li es el límite inferior de la clase donde se encuentra el percentil.

N es la suma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase del percentil.

ai es la amplitud de la clase.

Ejercicio de percentiles52

Resultado53

Desviación Media54

La desviación media es la media aritmética de

los valores absolutos de las desviaciones

respecto a la media.

La desviación media se representa por

55

Desviación media para datos

Agrupados56

Si los datos vienen agrupados en una tabla de

frecuencias, la expresión de la desviación

media es:

Ejemplo: calcular la desviación media

de la siguiente distribución:57

Varianza58

La varianza es la media aritmética del cuadrado

de las desviaciones respecto a la media de una

distribución estadística.

La varianza se representa por:

Varianza para datos agrupados59

Ejemplo: Calcular la varianza para la

siguiente distribución60

Desviación estándar61

La desviación estándar es la raiz cuadrada de la

varianza.

Esta representada por:

Ejemplo: Calcular la desviación

estándar para la siguiente distribución62