16
Cap. 1: Estad´ ıstica descriptiva Clase 1 A. Iturriaga A. Iturriaga Cap. 1: Estad´ ıstica descriptiva 1 / 16

Clase_1

Embed Size (px)

DESCRIPTION

clase de probabilidad y estadistica

Citation preview

Page 1: Clase_1

Cap. 1: Estadıstica descriptivaClase 1

A. Iturriaga

A. Iturriaga Cap. 1: Estadıstica descriptiva 1 / 16

Page 2: Clase_1

Introduccion

La estadıstica descriptiva es la parte de la estadıstica que se preocupade describir y resumir un conjunto de datos en estudio. Para lo anteriorse utilizan tablas, graficos y medidas descriptivas.

Los datos (o variables) pueden ser clasificados en dos tipos: cuantita-tivos o cualitativos.

Definicion 1 (Datos cuantitativos)

Los datos cuantitativos representan una cantidad reflejada en escalanumerica. Se clasifican tıpicamente en datos cuantitativos:

Discretos - se refieren al conteo de alguna caracterıstica.

Continuos - se refieren a una medicion.

A. Iturriaga Cap. 1: Estadıstica descriptiva 2 / 16

Page 3: Clase_1

Definicion 2 (Datos cualitativos o categoricos)

Los datos cualitativos representan caracterısticas que no estan aso-ciadas a cantidades con significado numerico, pero que permiten laclasificacion.

Ejemplo 11 El punto de fractura de una soldadura continua (cuantitativa

continua).

2 El numero de accidentes de transito durante un fin de semanalargo (cuantitativa discreta).

3 Si se estan analizando los niveles de mercurio en una muestra depescados y el interes es si se sobrepasa o no cierta normasanitaria (categorica)

A. Iturriaga Cap. 1: Estadıstica descriptiva 3 / 16

Page 4: Clase_1

Metodos graficos y numericos para describir datos cualitativos

La forma mas simple y usual de describir de manera numerica unavariable categorica es a traves de su distribucion de frecuencias.

Definicion 3 (Distribucion de frecuencias)

La distribucion de frecuencias de una variable cualitativa es el numerode veces que se repite cada categorıa. Si en vez del numero de repeti-ciones se entrega la proporcion, se habla de distribucion de frecuenciasrelativas.

A. Iturriaga Cap. 1: Estadıstica descriptiva 4 / 16

Page 5: Clase_1

Ejemplo 2Los siguientes datos senalan el paıs de procedencia de los 98 reactoresnucleares mas grandes del mundo:

A. Iturriaga Cap. 1: Estadıstica descriptiva 5 / 16

Page 6: Clase_1

La tabla de frecuencias del ejemplo anterior es:

∎Las representaciones graficas mas usuales son los denominados diagra-mas de barras y diagramas de sectores.

A. Iturriaga Cap. 1: Estadıstica descriptiva 6 / 16

Page 7: Clase_1

Definicion 4 (Diagrama de barras)

Es una representacion grafica en el plano en la que cada categorıa serepresenta en el eje de las abscisas a traves de una barra cuya alturacorresponde a su frecuencia o frecuencia relativa.

Para el ejemplo 2, su diagrama de barras es:

A. Iturriaga Cap. 1: Estadıstica descriptiva 7 / 16

Page 8: Clase_1

Definicion 5 (Diagrama de sectores)

Es una representacion grafica en el plano en la que un cırculo se divi-de en tantos sectores como categorıas presenta la variable categorica,siendo el angulo de cada sector proporcional a la frecuencia de cadacategorıa.

Para el ejemplo 2, su diagrama de sectores es:

A. Iturriaga Cap. 1: Estadıstica descriptiva 8 / 16

Page 9: Clase_1

Metodos graficos para describir datos cuantitativos

Si disponemos de una variable cuantitativa discreta con pocos valoresdistintos, podemos tratarla como una variable categorica y calcularpor ende su distribucion de frecuencias y dibujar su diagrama de barras.

Ejemplo 3En una empresa se producen piezas de un artefacto electronico, lascuales se empaquetan dentro cajas. Es de interes conocer la calidad dela produccion para lo cual se extrae una muestra de cajas. Los datossiguientes muestran la cantidad de piezas defectuosas dentro de cadacaja:

A. Iturriaga Cap. 1: Estadıstica descriptiva 9 / 16

Page 10: Clase_1

El diagrama de barras para el ejemplo 3 es:

A. Iturriaga Cap. 1: Estadıstica descriptiva 10 / 16

Page 11: Clase_1

Si disponemos de una variable cuantitativa con muchos valores distin-tos, puede ser poco util considerarla como una variable discreta. En estecaso es mas interesante considerar la variable en estudio como conti-nua. En este caso, el diagrama de barras aporta muy poca informacion.

Definicion 6 (Histograma)

Es una representacion grafica en el plano, similar al grafico de barras,pero en la que el eje de las abscisas se divide en intervalos de maneraque su distribucion de frecuencias sea mayor que 1.

A. Iturriaga Cap. 1: Estadıstica descriptiva 11 / 16

Page 12: Clase_1

La metodologıa para determinar un histograma es la siguiente:

1. Se calcula N (el numero de intervalos)

N = {√n (recomendado),

[log2(n) + 1] (metodo de Sturges),

donde n es la cantidad total de datos.

2. Se calcula el rango R = xM − xm, donde xM es un valor(arbitrario) ligeramente por encima del maximo y xm es un valor(arbitrario) ligeramente por debajo del mınimo.

3. Se calcula la longitud L = RN de cada intervalo.

A. Iturriaga Cap. 1: Estadıstica descriptiva 12 / 16

Page 13: Clase_1

4. Se construyen los N intervalos:

I1 = [xm, xm + L),I2 = [xm + L, xm + 2L),

⋮IN = [xm + (N − 1)L, xM).

5. Se calcula la frecuencia (o frecuencia relativa) de cada intervalo.

A. Iturriaga Cap. 1: Estadıstica descriptiva 13 / 16

Page 14: Clase_1

Obs.: Si se toma la frecuencia relativa como el area de las barras sehabla de un histograma en escala de densidad.

Ejemplo 4Los siguientes datos corresponden al tiempo necesario para procesar25 trabajos en una CPU:

A. Iturriaga Cap. 1: Estadıstica descriptiva 14 / 16

Page 15: Clase_1

Para el ejemplo 4, el procedimiento para obtener el histograma es elsiguiente:

1. N =√25 = 5 intervalos.

2. mın{xi} = 0,02, max{xi} = 4,75 y R = 4,8 (una opcion).

3. L = 4,85 = 0,96.

4. Los intervalos son:

I1 = [0; 0,96),I2 = [0,96; 1,92),I3 = [1,92; 2,88),I4 = [2,88; 3,84),I5 = [3,84; 4,8).

A. Iturriaga Cap. 1: Estadıstica descriptiva 15 / 16

Page 16: Clase_1

5. La distribucion de frecuencia asociada a estos intervalos es:

6. Finalmente el histograma es:

A. Iturriaga Cap. 1: Estadıstica descriptiva 16 / 16