Clases Estadistica 1 Unid

Embed Size (px)

Citation preview

Diapositiva 1

ESTADSTICA

Mg.C.D. ARMANDO CARRILLO FERNNDEZ

25/02/2013AMCF

1ytytkyutyu

25/02/2013AMCF

25/02/2013AMCF

25/02/2013AMCF

INTRODUCCION A LA ESTADSTICA

PRIMERA SEMANA

25/02/2013AMCF

5ytytkyutyu

DEFINICIONES

DATOS

ESTADISTICA: # estadistico: muestra

POBLACIN

CENSO

MUESTRA

PARAMETRO. Medicin numrica que describe algunas caractersticas de una poblacin25/02/2013AMCF

PARAMETRO De los 1324 semforos de Huancayo Distrito estn funcionando a la fecha 890.

25/02/2013AMCF

Estadstico Una muestra de 300 trabajadores , se encontr que el 80 % est satisfecho con su salario.

Los datos muestrales deben reunirse de forma adecuada: 25/02/2013AMCF

25/02/2013AMCF

25/02/2013AMCF

TIPOS DE DATOS25/02/2013AMCFLos datos muestrales sirven para hacer INFERENCIAS sobre una POBLACION COMPLETA.

DATOS CUANTITATIVOS : peso,talla,etcDATOS CUALITATIVOS :gnero

Conocer y diferenciar la naturaleza de los datos muestrales, ya que su mal aplicacin afectan de manera importante los mtodos y resultados

25/02/2013AMCF

MarsOrbiterClimate

Datos cuantitativos

Datos discretos cuando es un NMERO FINITO

Datos continuos (numricos) resultan de un infinito de posibles valores.25/02/2013AMCF

25/02/2013AMCFOTRA CLASIFICACION DE LOS DATOSNOMINALORDINALINTERVALO RAZN

25/02/2013AMCFNOMINAL: Son exclusivamente en nombre,etiquetas o categoras. No se pueden ordenar.

EJEMPLO:Si-no-indecisoColores

25/02/2013AMCFORDINAL: Cuando se pueden colocar en algn orden, para obtener comparaciones relativas, aunque no es posible determinar diferencias de magnitud.

EJEMPLO:Calificaciones del curso: ABCDERango

25/02/2013AMCFINTERVALO: Parecido al ordinal, pero la diferencia entre los datos tiene un significado. No tienen un punto de partida cero natural inherente.

EJEMPLO:TemperaturaAos

25/02/2013AMCFRAZON: Parecido al intervalo, la diferencia entre los datos tiene un significado. Tienen un punto de partida cero natural inherente.

EJEMPLO:PesoPrecio

Qu es lo que hemos visto?

25/02/2013AMCF

ACTIVIDADES PAGINAS 11 Y 12

Entrega prxima clase de teora

VARIABLES

SEGUNDA SEMANA

25/02/2013AMCF

22ytytkyutyu

25/02/2013AMCFCONCEPTO

Es cualquier caracterstica, cualidad o propiedad de un fenmeno o hecho que tiende a variar y que es susceptible de ser modificado o evaluado

25/02/2013AMCFTambin se puede definir como una propiedad que adquiere varios valores.Por ejemplo, la edad,sexo,religin,etc.

25/02/2013AMCFForman la estructura del problema de investigacin ya que la relacin que vamos a investigar es la relacin entre variables

25/02/2013AMCFCLASIFICACION DE LAS VARIABLESNATURALEZA: 1.- CUALITATIVAS. Son aquellas cuyos elementos de variacin tienen un carcter cualitativo. No se pueden medir mediante nmeros,sin utilizar la frecuencia en que aparecen,es decir se expresan verbalmente con un cdigo prestablecido,no llevan clasificacin numrica y se expresan en atributos o categoras de clasificacin.

Ejemplo: Sexo,estado civil,caractersticas de la personalidad

25/02/2013AMCFCLASIFICACION DE LAS VARIABLESNATURALEZA: 1.- CUALITATIVAS.

a) NOMINALES. Cuando la categora de clasificacin o atributo no tiene ningn orden. Ejemplo. Sexo, estado civil, color cabello

25/02/2013AMCFCLASIFICACION DE LAS VARIABLESNATURALEZA: 1.- CUALITATIVAS.

a) ORDINALES. Cuando la categora de clasificacin o atributo poseen una ordenacin natural. Ejemplo. Estatus socioeconmico, medidas de las camisas, niveles de estudio.

NATURALEZA: 2.- CUANTITATIVAS. Son aquellas cuyos elementos de variacin tienen un carcter cuantitativo o numrico. Ejemplo. Rendimiento escolar,nivel de ingreso econmico,edad.

25/02/2013AMCFCLASIFICACION DE LAS VARIABLES

25/02/2013AMCFCLASIFICACION DE LAS VARIABLESNATURALEZA: 2.- CUANTITATIVAS. a) Discretas. Cuando estn restringidas a determinado valor.Son tambin llamadas categricas.Ejemplo. N de hijos, ctdad de trabajadores que reciben un sueldo por encima de X soles

25/02/2013AMCFCLASIFICACION DE LAS VARIABLESNATURALEZA: 2.- CUANTITATIVAS. b) Continuas.Son aquellas que pueden tomar cualquier valor numricoEjemplo. Rendimiento intelectual, temperatura ambiental , etc.

25/02/2013AMCFCLASIFICACION DE LAS VARIABLESB) DE ACUERDO AL LUGAR O IMPORTANCIA DENTRO DE UNA RELACIN DE VARIABLES Se clasifican en variables independientes,dependientes y extraa o intermitente

Ejemplo: Estudio sobre el efecto de un programa de aprestamiento perceptivo-motor en el aprendizaje de la lecto escritura

25/02/2013AMCFINDICADORESSon los instrumentos para medir a la variable, es necesario tomarlos en cuenta para construir los instrumentos de recoleccin de datos.

25/02/2013AMCF

Variable estadstica (v.e.): Caracterstica propia del individuo objeto del estudio estadstico

Modalidad: Cada una de las posibilidades o estados diferentes de una variable estadstica Exhaustivas e incompatibles Variables estadsticas. ModalidadesEjemplos:- Estatura- Salario- Color del pelo- Nivel de colesterol- N de hijos de una familia

Ejemplo: color del pelo:- castao- rubio- negro

36 Cualitativas: Las caractersticas no son cuantificables Cuantitativas: Caractersticas cuantificables o numricas Discretas: Numricas numerables Continuas: Numricas no numerables Tipos de variables estadsticasEjemplos: Grupo sanguineo Profesin Color del pelo

Ejemplos: N de hijos de una familia N de nidos de procesionarias por rbol N de virus en un cultivo

Ejemplos: Estatura Salario Nivel de colesterol

RESUMEN DE DATOS

TERCERA SEMANA

25/02/2013AMCF

37ytytkyutyu

25/02/2013AMCFORGANIZARRESUMIRGRAFICAR DATOS

SABER ENTENDER E INTERPRETAR LOS DATOS

25/02/2013AMCFCARACTERISTICAS IMPORTANTES DELOS DATOS1.- CENTRO.2.-VARIACIN.3.- DISTRIBUCIN: ( campana,uniforme,sesgada)4.- VALORES EXTREMOS5.- TIEMPO: caractersticas cambiantes de los datos

25/02/2013AMCFDISTRIBUCIONES DE FRECUENCIALa empleamos cuando trabajamos con grandes conjuntos de datos, con el fin de organizarlos y resumirlos y entenderlos lo que nos dicen.(su naturaleza)

25/02/2013AMCFDEFINICINSon las listas de valores (individuales o intervalos), junto a sus frecuencias (conteos) respectivos.Distribucin de frecuencia: Edades de las mejores actricesEdad de las actricesFRECUENCIAS21-302831-403041-501251-60261-70271-802

25/02/2013AMCFDEFINICIONES1.- LIMITE CLASE INFERIOR 2.-LIMITE DE CLASE SUPERIOR3.- FRONTERAS DE CLASE til para elaborar histogramas4.- MARCAS DE CLASE (Ci + Cs) / 25.- ANCHURA DE CLASE Diferencia entre Ci consecutivas

25/02/2013AMCFProcedimientos para construir una distribucin de frecuenciasSeleccionar las clases2.- Anchura de clase= valor ms alto valor ms bajo ------------------------------------------ nmero de clases = 9,833 = 103.- Partida 214.- Ci 31,41,51,61,71.5.- Cs 30,40,50,60,70,80

25/02/2013AMCFProcedimientos para construir una distribucin de frecuencias relativasDividir cada frecuencia de clase entre el total de frecuencias, se expresan en porcentajes2.- Frecuencia relativa= frecuencia de la clase ------------------------------------------ suma de todas las frecuencias

25/02/2013AMCFDistribucin de frecuencia relativas de las edades de las mejores actricesEdad de las actricesFRECUENCIAS21-3037%31-4039%41-5016%51-603%61-703%71-803%

La suma de las frecuencias relativas debe sumar 1 o 100%,con discrepancias por el redondeo

25/02/2013AMCFDistribucin de frecuencias acumulativas

Es la suma de las frecuencias para es clase y todas las clases anteriores28+30 = 582.- 28+30+12=703.- 28+30+12+2=724.- 28+30+12+2+2= 745.- 28+30+12+2+2+2= 76

25/02/2013AMCFDistribucin de frecuencia acumuladas de las edades de las mejores actricesEdad de las actricesFRECUENCIASMenor de 3128Menor de 4158Menor de 5170Menor de 6172Menor de 7174Menor de 8176

Los lmites de clase son reemplazados por la expresin menor que

Qu es lo que hemos visto?

25/02/2013AMCFDISTRIBUCIN NORMALAl graficarlas tienen forma de CAMPANA

Al inicio las frecuencias son bajas, despus se incrementan hasta un punto mximo, luego descienden

Deben ser simtricas y las frecuencias se distribuyen de manera uniforme a ambos lados de la frecuencia mxima

25/02/2013AMCFEJERCICIO PRACTICOLAS NOTAS DEL CURSO DE ESTADSTICA DEL CICLO PASADO HAN SIDO LAS SIGUIENTES:

3,4,1,2,8,9,8,7,6,6,7,9,8,7,7,1,0,1,5,9,9,8,0,8,8,8,9,5,7,5,

25/02/2013AMCFnotasfrecuencia absolutafrecuencia absoluta acumuladaporcentajePorcentaje acumulado

25/02/2013AMCFInterpretacin de los datos

25/02/2013AMCFFRECUENCIA DE DATOS AGRUPADOS EN INTERVALOS DE CLASERecorrido o rango. Se usa para variables cuantitativas, es la diferencia entre el mayor y menor valor de los datos

25/02/2013AMCFDeterminacin del nmero de intervalos de clase (k)Consiste en dividir el rango en un nmero conveniente de intervalos.

Si n menor igual que 100 k= raz cuadrada de n

Si n mayor que 100 k= 1+ 3,32193 * log 10 n

25/02/2013AMCFFRECUENCIA DE DATOS AGRUPADOS EN INTERVALOS DE CLASE8.36.67.57.98.27.88.57.97.98.57.26.68.86.68.37.77.97.88.49.36.67.67.58.67.97.47.97.87.997.47.57.7.17.77.38.58.26.67.56.77.76.76.68.46.87.987.898.78.78.26.78.37.37.96.78.59.199.38.46.67.26.67.27.57.99.8108.77.29.67.48.57.97.88.58.5

25/02/2013AMCFK= 80 = 8.9= 9 son los intervalos a trabajar

Rango = 10- 6,6 = 3,4

Amplitud de clase 3,4/ 9 = 0,4

25/02/2013AMCF

ACTIVIDADES completar el cuadro de la presentacin (diapositiva) 28

Entrega prxima clase de teora

GRFICOS DE DATOS

CUARTA SEMANA

25/02/2013AMCF

58ytytkyutyu

25/02/2013AMCFHISTOGRAMASGrficas que describen la naturaleza de la distribucin

Qu es? Es una grfica de barras donde la escala horizontal representa clases de valores de datos y la escala vertical representa frecuencias.La altura corresponde a las frecuencias

25/02/2013AMCFHISTOGRAMAS DE FRECUENCIAS RELATIVASLa escala vertical representa frecuencias RELATIVAS EN LUGAR DE LAS FRECUENCIAS REALES

25/02/2013AMCF

25/02/2013AMCFGRFICAS ESTADSTICAS1.- Polgonos de frecuencia utiliza segmentos lineales conectados a puntos que se localizan directamente por encima de los valores de marcas de clase

25/02/2013AMCFGRFICAS ESTADSTICAS2.- Ojivas grfica lineal que representa frecuencias acumulativas

25/02/2013AMCFGRFICAS ESTADSTICAS3.- Puntos es aquella donde se marca cada valor de un dato como un punto a lo largo de una escala de valores

25/02/2013AMCFGRFICAS ESTADSTICAS4.- Grficas de Pareto es para datos cualitativos

25/02/2013AMCFGRFICAS ESTADSTICAS5.- Grficas circulares Tambin datos cualitativos

25/02/2013AMCFGRFICAS ESTADSTICAS6.- Dispersin datos apareados (x,y)

Qu es lo que hemos visto?

69

Variables continuas: IntervalosIntervalo I ix in iNifiFi e0 e1 ... e i-1 ei ... e k -1 ekx1...x i...xkn1...n i...n kN1...Ni...N kf1...fi...fkF1...Fi...Fkn1

Marca de clase xi (punto medio de cada intervalo) Amplitud ai (distancia entre los extremos) Intervalos cerrados por un extremo y abiertos por otro

70 V. E. Cualitativas: Grfico rectangular2010

NegroGrisBlancoRojoVioleta Grficos estadsticosColor PlumajeN de Aves ( n i ) Negro10Gris14Blanco20Rojo6Violeta454

71 V. E. Cualitativas: Grfico de sectores

rojovioletanegrogrisblancoColor PlumajeN de Avesn i f iGradosNegro100,18566,6Gris140,25993,24Blanco200,37133,2Rojo 60,11139,96Violeta 40,07426,6454

Grados de un sector = 360 0 x fi

72

V. E. Discretas: Grfico de barrasN de crasN animales: n if iFi2200.200.203300.300.504250.250.755150.150.906100.101n = 100

73Estaturan ih i = n i / a i140 160301.5160 170222.2170 180202180 190181.8190 200101100

V. E. Continuas: Histograma

El rea de cada rectngulo es proporcional a la frecuencia

11,51,8

140160170180200

hi

190

2.2

2

25/02/2013AMCF

ACTIVIDADES pgina 25-26 de la pregunta1 a la 3

Entrega prxima clase de teora

ESTADSTICA PARA DESCRIBIR,EXPLORAR Y COMPARAR DATOS

QUINTA SEMANA

25/02/2013AMCF

75ytytkyutyu

25/02/2013AMCFMEDIDAS DE TENDENCIA CENTRALCaracteristicas del CENTRO, buscamos obtener un nmero que represente el valor central de un conjunto de datos.

Existen formas de encontrarlo, entre ellas tenemos LA MEDIA, MEDIANA,MODA Y MITAD DE RANGO

25/02/2013AMCFMEDIAEs la ms importante que se emplea para describir datos, comnmente se le conoce como el promedio.

Se obtiene al sumar los valores y dividirlos entre el nmero de valores.

Su desventaja es su sensibilidad a cada valor, cuando son puntuaciones excepcionales

25/02/2013AMCFMEDIANAResuelve en gran forma la desventaja de la MEDIA.Es un valor intermedio, ya que la mitad de los valores de los valores estn por debajo de ella y la otra mitad por arriba.Se denota X.

Se emplea para conjuntos de datos relativamente pequeos

25/02/2013AMCFMEDIANAPara obetnerla:

1.- ordenar los valores: a) Si son datos impares, la mediana es el nmero que se localiza exactamente a la mitad de la lista.

b) Si son datos pares, se obtiene calculando la media de los dos nmeros que estan a la mitad.

25/02/2013AMCFMEDIANAEjemplo

3,50 3,57 9,0 1,3 5,6 8,3, 0,3

3,50 3,57 1,3 5,6 8,3, 0,3

25/02/2013AMCFMODAEs el valor que se presenta con mayor frecuencia.

Cuando dos valores se presentan con la misma frecuencia y sta es la ms alta , ambos son MODAS, por lo que el conjunto es BIMODAL.

Cuando ms de dos valores se presentan con la misma frecuencia y sta es la ms alta , ambos son MODAS, por lo que el conjunto es MULTIMODAL

Cuando NINGN VALOR SE REPITE ,no hay moda

25/02/2013AMCFMODAEs la nica que puede usarse con datos de medicin NOMINAL

25/02/2013AMCFMITAD DEL RANGOEs el valor que esta a la mitad ,entre la puntuacin ms alta y la ms baja.

Se obtiene sumando la puntuacin ms alta con la puntuacin ms baja y el resultado se divide entre dos

25/02/2013AMCFMEDIA DE DISTRIBUCIN DE FRECUENCIASSe obtiene multiplicando la frecuencia por la marca clase de cada dato.Luego sumamos todos los resultados y los dividimos entre el nmero de datos de la frecuencia

Distribucin de frecuencia: Edades de las mejores actricesEdad de las actricesFRECUENCIAS21-302831-403041-501251-60261-70271-802

25/02/2013AMCFCLCULO DE LA MEDIA DE UNA DISTRIBUCIN DE FRECUENCIASEdad de las actricesFRECUENCIASMarca de la claseF*X21-302825.571431-403035.5106541-501245.554651-60255.511161-70265.513171-80275.5151

762748 2748 / 76 = 35.8

Produce una aproximacin a X ,ya que no se emplea la lista original

25/02/2013AMCFMEDIA PONDERADACuando los valores varan de acuerdo a su importancia.

control de lectura 30% nota 16Tarea acadmica 50% nota 10Examen 20% nota 13

(30*16) + (50*10) + (20*13) / (30+20+50)

25/02/2013AMCFSESGOEs una comparacin entre la media,mediana y la moda.Una distribucin es sesgada si no es simtrica: a) sesgada a la izquierda. Media y mediana estn a la izquierda de la modab) sesgada a la derecha. Media y mediana estn a la derecha de la moda.

Una distribucin es simtrica si la moda,mediana y media son iguales

RecordarDistribucin de Frecuencias

2.1.1.- Medida AritmticaDefinicinEn un conjunto de datos agrupados: {(xi , ni); i=1,...,k} N = n1 + n2 + ... + nk: el nmero de datos observados

Se define la Media Aritmtica por

2.1.1.- Medida Aritmtica

Variables cuantitativas continuas o agrupadasxi sern marcas de claseVariables cuantitativas discretas o no agrupadas

Variables cualitativas no tiene sentidoClculo

2.1.1. Media AritmticaEjemplo: Estaturas de 50 nios. Fuente: Pea y Romo 1997.

2.1.1.- Medida Aritmtica

Ejemplo: Estaturas de 50 nios. Fuente: Pea y Romo 1997. Los nios tienen una estatura media de 1,569 m

2.1.1.- Medida Aritmtica

Ejercicio:

2.1.1.- Medida Aritmtica

Ejercicio:

2.1.2.- Medida Aritmtica PonderadaMedia aritmtica en la que se tiene en cuenta la importancia especfica de cada uno de sus datos, a travs de unos pesos, dando as a stos mayor o menor relevancia o aportacin al clculo de la media.

Ejemplo: Las notas obtenidas por un estudiante en cada parte de una determinada materia, as como los pesos de importancia de las distintas unidades, son los que se presentan en la tabla.

2.1.2.- Medida Aritmtica PonderadaDefinicinEn un conjunto de datos agrupados: {(xi , ni); i=1,...,k} N = n1 + n2 + ... + nk: el nmero de datos observados

Sean {wi; i=1,...,k} un conjunto de pesos que ponderan la importancia de cada uno de los datos observados, verificando que: wi 0 para i =1,..., k

Se define la Media Aritmtica Ponderada por

2.1.2.- Medida Aritmtica PonderadaEjemploCalcular la nota media del ejemplo anterior

2.1.3.- Medida Geomtrica

Definicin: Sea X una variable cuantitativa medida en una escala de razn y que slo toma valores positivos. En la distribucin de frecuencias:{(xi , ni); i=1,...,k}

Se define la Media Geomtrica la denotamos G - como:

Es til para promediar tasas, porcentajes, tipos de inters y, en general, en todas aquellas situaciones en las que la variable analizada presente variaciones acumulativas

DefinicinLa Mediana (Me) es aqul valor o dato de la distribucin, que divide a sta en dos partes iguales dejando al 50% de las frecuencias por debajo y al 50% por encima.

Ejemplo: valores observados de una variable : 2, 3, 3, 3, 5, 6, 6, 7 y 9 La mediana es 5, pues es el valor que deja el mismo nmero de datos (4) por debajo que por encima de l.

Para su clculo distinguiremos segn tengamos distribuciones: Discretas Continuas o agrupadas2.1.4 Mediana

Pasos a seguir en su clculo:Ordenamos de forma creciente los datos: Si m < N/2 m+1 con m entero Me = x(m+1)

2.1.4 MedianaDistribuciones discretasEjercicio: 2, 3, 3, 3, 5, 6, 6, 7 y 9 N / 2 = 4,5 4 < 4,5 < 5 Me = x(m+1) = x5 =5

2.1.4.- Mediana

Ejercicio: Distribuciones continuas o con variables agrupadas

Obtener la distribucin de frecuencias acumuladas

Identificar el Intervalo de Clase Mediano (Lm-1,Lm] Es el que verifica que:

Nm-1 < N/2 Nm Fm-1 < 0,50 Fm

y/o tomar la marca de clase

2.1.4.- Mediana

Identificar el Intervalo de Clase Mediano (Lm-1,Lm] Es el que verifica que:

102 = Nm-1 < 105,2 = N/2 Nm = 150 0,484 = Fm-1 < 0,50 Fm = 0,711

(100 120] o marca de clase = 110

DefinicinLa Moda (Mo) de una distribucin de frecuencias es el valor ms frecuente de la misma. Dependiendo del nmero de modas, las distribuciones se clasifican en Unimodales, Bimodales o Multimodales.Ejemplo: valores observados de una variable : 2, 3, 3, 3, 5, 6, 6, 7 y 9 La moda es 3, pues es el valor ms frecuente.

Para su clculo distinguiremos segn tengamos distribuciones: Discretas Continuas o agrupadas2.1.5 Moda

Se identifica el valor Mo = xm cuya frecuencia absoluta nm sea mxima 2.1.5 ModaDistribuciones discretas

Como los valores de la variable estn incluidos en intervalos de clase no es posible identificar directamente el valor o valores centrales.

Pasos a seguir en su clculo:

Obtener la densidad de frecuencia (dm=nm/am)

Identificar el Intervalo de Clase Modal (Lm-1,Lm] Es el que maximiza dm y/o tomar la marca de clase

2.1.5 ModaDistribuciones continuas o agrupadas

2.1.5.- ModaEjercicio:

Obtener la distribucin de densidades de frecuencias

Identificar el Intervalo de Clase Modal (Lm-1,Lm] Es el que maximiza la densidad de frecuenciasTomar la marca de clase

2.1.5.- Moda

Identificar el Intervalo de Clase Modal (Lm-1,Lm] Es el que verifica que maximiza di = 2,4(100 120] o marca de clase =110

108

1.3. Caractersticas de variables estadsticas unidimensionales 1.3.1 Caractersticas de Posicin Media aritmticaEstaturaN Personasn iM. Clasex in i x i140 150201452900150 16010015515500160 1808017013600180 200101901900n = 21033900

109175224453362341nixi

Ejemplo

Datos en tablaDatos en serie2, 2, 3, 3, 3, 3, 5, 6, 7Mo = 3Mo = 3 Valor de la variable ms frecuente Puede haber ms de una moda Plurimodal

Moda

Variables discretas

110

x in ih i = n i / a i140 160301.5160 170222,2170 180202180 190181,8190 200101100

Variables continuas Ejemplo Observaciones:1. Puede utilizarse la frecuencia relativa2. Si las amplitudes son iguales, la moda se puede obtener directamente con las frecuencias

111 Valor de la variable que ocupa el lugar central en una serie de datos ordenados. El 50% de los elementos de la poblacin tienen un valor de la variable menor o igual que la mediana. El 50% de los elementos de la poblacin tienen un valor de la variable mayor o igual que la mediana.N par de observaciones: 3, 4, 6, 6, 6, 7, 8, 8, 9, 9 Me = 6 7 Indeterminada entre 6 y 7 Mediana Variables discretas

Datos en serie

xiniNifiFi2330,3330,3333140,1110,4445150,1110,5556160,1110,6667280,2220,8888190,1110,99991

xiniNifiFi3110,10,14120,10,26350,30,57160,10,68280,20,892100,21101

N impar de observaciones: 2, 2, 2, 3, 5, 6, 7, 7, 8 Me = 5

112

Datos en tabla Variables discretasn /2 = 14Fi = 0,5

Me = 2 Ejemplo28

43210xi28351064ni

10.8920.7140.3570.142Fi 10.1070.1780.3570.2140.142fi

2520104Ni

Observacin: Si n / 2 coincide con un N i

la mediana est indeterminada entre x i y x i+1

113

n/2 = 50Fi = 0,5

Variables continuas Ejemplo Observacin: Si n/2 coincide con un Ni la mediana es el extremo superior del intervalo que le corresponde

10.900.700.450.15Fi

0.100.200.250.300.15fi

10090704515Ni

100

10180 20020170 18025160 17030150 16015140 150niEstatura

ESTADSTICA PARA DESCRIBIR,EXPLORAR Y COMPARAR DATOS

SEXTA SEMANA

25/02/2013AMCF

114ytytkyutyu

MEDIAS DE DISPERSIN O VARIABILIDAD

AB

Algunas consideracionesVariacin, se refiere a la cantidad en que los datos u observaciones varan entre si, esta variacin puede medirse.

Los datos que estn relativamente cercanos entre si, tienen bajas medidas de variabilidad, mientras que los que estn mas alejados entre si tienen medidas de variacin mas grandes,

Trminos equivalentesMenor dispersin = ms homogneoMayor dispersin = menos homogneoMenor dispersin = menos heterogneoMayor dispersin = ms heterogneo

MEDIDAS DE DISPERSIONDefinicin 1Una medida de dispersin de un conjunto de datos, mide cuan esparcidos se encuentran estos o que tan heterogneos son. Hay varias medidas de dispersin, siendo las ms comunes las siguientes:

Principales medidas de dispersinEl rangoRango IntercuartilLa varianza La desviacin estndarEl coeficiente de variacin

RANGOR = X mx X min

Ejemplo 1Ante la pregunta sobre nmero de hijos por familia, una muestra de 12 hogares, marc las siguientes respuestas:2124132320 51Calcule el rango de la variable

SolucinEl Rango es R =5 0 = 5

La varianza

MuestralPoblacional

Ejemplo 2Calcule la varianza para los datos del ejemplo 1 2 1 2 4 1 3 2 3 2 0 51

Solucin:

Desviacin estndar

MuestralPoblacional

Ejemplo 3Calcule la desviacin estndar para los datos del ejemplo 1

Solucin:

Calcula la desviacin estndar para los datos del ejemplo 1

2. Ingresa los datos. 3. Solicita xn-1. 1. Ingresa a modo STAT.

Calcula la desviacin estndar para los datos del ejemplo 1

2. Ingresa los datos. 3. Solicita xn-1. 1. Ingresa a modo SD.

Coeficiente de variacinCompara la variabilidad de series de datos que tengan unidades diferentes.No tiene unidades de medida.Se calcula para variables medidas en escala de razn

MuestralPoblacional

Ejemplo 4Calcule el coeficiente de variabilidad para los datos del ejemplo 1 Solucin:

Medidas de dispersin en tablas de frecuencias (caso discreto)

MuestralPoblacional

Ejemplo 5Se han registrado durante 20 das, el nmero de viajeros que hacen reservaciones a una agencia de viajes pero que no las hacen efectivas:Calcule las medidas de dispersin de la variable en estudio. Interprete iNmero de viajeros: xi fi11232133314641535165Total7020

Solucinixifixifixi2xi2fi11233614443221333916950731468419611764153452256755165802561280Total70202849904070

Una variable cuantitativa continuaVarianza poblacional

Varianza muestral

Propiedades de la varianzaEs un nmero real no negativo.Si yi=axi+b entonces S2Y = a2S2X .Depende de todos los datos y es sensible a la variacin de cada dato.Se puede calcular en variables medidas en escala de intervalo y de razn.

Estadsticos apropiados por escalasNominalModa, nmero de casosOrdinalMediana, percentilIntervaloMedia, rango, rango intercuartil, varianza, desviacin estndarRaznTodos

Ejemplo 6En un grifo se form la siguiente distribucin de frecuencias de galones de gasolina vendidos por automvil, en una muestra de 300 vehculos:Galones de gasolinafrecuencia0 6506 - 129512 - 186518 - 245024 -302530 - 3615total300

Calcule e interprete las medidas de Dispersin

SolucinGalones xifiFihiHi0 63505016,6716,676 - 1299514531,6748,3312 - 18156521021,6770,0018 - 24215026016,6786,6724 -3027252858,3395,0030 - 3633153005,00100,00total300

138

Q 3 Q1

Valor mximo menos valor mnimo de la variable Miden la Homogeneidad de las observaciones 1.3.2. Caractersticas de Dispersin Rango o recorrido Recorrido intercuartlico

139

Varianza Desviacin tpica Coeficiente de variacin

140xininixinixi242080320640240144084435228161036360360012222643168162129611344

Ejemplo

141

Momentos centrales (Respecto a la media)

CUATILES,DECILES,PERCENTILES

SEPTIMA SEMANA

25/02/2013AMCF

142ytytkyutyu

ObjetivosDe las diferentes medidas descriptivas de una distribucin de frecuencias, que se presentan a lo largo del tema, el alumno deber comprender el inters y el objetivo de cada una de ellas; as mismo sabr aplicar su definicin y manejar sus principales propiedadesTodas ellas comparten el propsito comn de servir de indicadores de la Posicin (Central y No Central) que ocupan un conjunto de datos. De esta forma, con su uso se aprender a sintetizar o resumir la informacin contenida en un conjunto de datos indicando su POSICIN globalInterpretar correctamente los valores obtenidos para estas medidasDiferenciar y elegir aquella medida - de entre las alternativas presentadas - que resulte ms conveniente para describir los aspectos que se pretenden poner de manifiesto.

Medidas de Posicin Medidas de tendencia central Media aritmtica, geomtrica y ponderada, Mediana y Moda

Medidas no centrales Cuantiles: Cuartiles, deciles, percentiles

144

IntroduccinUn objeto pequeo se pesa con un mismo instrumento por ocho estudiantes de una clase, obtenindose los siguientes valores en gramos: 62, 60, 60, 63, 61, 623, 615, 62 Cul sera la mejor estimacin del peso real?

Cmo determinar, a partir de un conjunto de medidas x1, x2 , ..., xn la mejor estimacin posible del verdadero valor X desconocido?

1 IntroduccinCul sera la mejor estimacin del peso real?61475? (62 + 60 + 60 + 63 + 61 + 623 + 615 + 62) / 860 ,62? Valores que ms se repiten615 62? 60, 60, 61, 615, 62, 62, 623, 63No tenemos ninguna razn para pensar que el verdadero valor est ms cercano a uno u otro de los datos obtenidos.

Unidad 2: Medidas de Posicin1 IntroduccinLas Medidas de Posicin van a desvelar aquellos valores con respecto de los cuales, los datos suelen disponerse.

Son magnitudes que pueden considerarse como representativas del grueso de los datos, sirviendo de referencia a los mismosSe clasifican en:Medidas de centralizacinMedidas de posicin no centrales

1 Introduccin

Son aquellos valores de la variable, que ordenados de menor a mayor, dividen a la distribucin en partes, de tal manera que cada una de ellas contiene el mismo nmero de frecuencias.

Los tipos ms importantes de cuantiles son:

Los cuartiles, que dividen a la distribucin en cuatro partes Los deciles, que dividen a la distribucin en diez partes Los percentiles, que dividen a la distribucin en cien partes2.2.Cuantiles

DefinicinPara 0 (p) 1 se define el Cuantil de orden (p) como el valor de la variable o dato tal que el x 100 de los datos son inferiores. Lo denotamos Q (Qp)

Casos particulares notables son los: Percentiles, Cuartiles y Deciles2.2.Cuantiles

Q70

Distribuciones discretas Si m < Np m+1 con m entero entonces Qp = x(m+1)

Distribuciones Continuas o AgrupadasSu aproximacin se basa en un argumento idntico al utilizado en el clculo de la Mediana para datos agrupados2.2.Cuantiles

Cuartiles: {Ci = Qi/4 i = 1, 2, 3}

Primer Cuartil C1 Cuantil 0.25 (Q0.25) Segundo Cuartil C2 Cuantil 0.5 (Q0.5) Tercer Cuartil C3 Cuantil 0.75 (Q0.75)

Deciles: {Di = Qi/10 i = 1, ..., 9}

Percentiles: {Pi = Qi/100 i = 1, ...,99}

Ejemplo: En cualquier conjunto de datos: El percentil P95 es superado nicamente por el 5% de los datos.2.2.- Cuantiles

Ejemplo 1: El 15% de los espaoles viven por debajo del umbral de pobreza. Qu renta se considera demasiado baja? Percentil 15

Ejemplo 2: El colesterol se distribuye en la poblacin simtricamente. Supongamos que se consideran patolgicos los valores extremos, de forma que el 90% de los individuos son normales Entre qu valores se encuentran los individuos normales? Percentiles 5 y 952.2.- Cuantiles

Ejemplo 1: Calcular el cuartil 2 y el percentil 952.2.- Cuantiles

Cuartil 2 = Percentil 50 = Mediana

Ejemplo 1: Calcular el cuartil 2 y el percentil 952.2.- CuantilesPercentil 95

Qu es lo que hemos visto?

158 Definicin: Pk , k: 1,2,...,99, percentil k, valor de la variable que deja por debajo, el k% de los valores de la variableQ1 = P25 Cuartil 1Q2 = P50 Cuartil 2 = MeQ3 = P75 Cuartil 3

D1 = P10 Decil 1D2 = P20 Decil 2 .D9 = P90 Decil 9 Percentiles Clculo para v.e. discretas:Igual que la mediana, cambiando:

Clculo para v.e. continuas:

159x in iNi220203305044494520114610124124

Percentil 40, P40 = 3Percentil 95, P95 = 6

n k /100 =124x25/100 = 31

n k /100 =124x50/100 = 62

n k /100 =124x75/100 = 93

Ejemplos percentiles v.e. discretaPercentil 50, P50 = 4 = Me = Q2

Percentil 25, P25 = 3 = Q1

Percentil 75, P75 = 4 = Q3

160

Ejemplos percentiles v.e. continuaTallasniNifiFi140-15015150.150.15150-16030450.300.45160-17025700.250.70170-18020900.200.90180-200101000.101100

MEDIDAS DE ASIMETRA Y CURTOSIS

OCTAVA SEMANA

25/02/2013AMCF

161ytytkyutyu

162

1.3.3 Caractersticas de forma

Distribucin sesgada a la derecha

Distribucin simtrica

Distribucin sesgada a la izquierda Coeficiente de Sesgo (Asimetra)

163

Distribucin ms aplastada que la distribucin Normal

Distribucin menos aplastada que la distribucin Normal

Distribucin igual de aplastada que la distribucin Normal

Coeficiente de Curtosis (Aplastamiento)

25/02/2013AMCF

25/02/2013AMCF