Upload
carlos-palomo
View
214
Download
1
Embed Size (px)
Citation preview
MODELACION ESTADISTICA
ESTADISTICA PARA PROCESOSANALISIS DE DATOS:
En un proceso de manufactura, el dimetro en milmetros de cierto ensamble se considera de vital importancia para poder continuar con la produccin. El inspector de control de calidad ha recopilado la siguiente informacin respecto a los dimetros de 10 unidades tomadas aleatoriamente con el propsito de analizar estadsticamente los datos. En la siguiente tabla se presenta dicha informacin:
Elemento# 1# 2# 3# 4# 5# 6# 7# 8# 9# 10
Dimetro121510721332312812
ANALISIS GRAFICO
MEDIDAS DE TENDENCIA CENTRAL: primer momento MEDIA MEDIANA
MODA
MEDIA:
MEDIANA:
EMBED Equation.3 MODA:
MEDIDAS DE DISPERSION: segundo momento RANGO
VARIANZA
DESVIACION ESTANDAR
RANGO:
VARIANZA
DATOS:
12, 15, 10, 7, 21, 33, 23, 12, 8, 12.
-3.310.89
-0.30.09
-5.328.09
-8.368.89
5.732.49
17.7313.29
7.759.29
-3.310.89
-7.353.29
-3.310.89
total588.10
DESVIACION ESTANDAR
MEDIDAS DE FORMA
COEFICIENTE ASIMETRIA: Tercer momentoEste coeficiente mide la asimetra de los datos respecto a su centro. Este coeficiente es cero para una variable simtrica. Cuando el valor absoluto del coeficiente es aproximadamente mayor que uno podemos concluir que los datos tienen una distribucin claramente asimtrica.
xi
12-0.40823-0.06803
15-0.03711-0.00005
10-0.65565-0.28184
7-1.02677-1.08247
210.705130.35059
332.1896210.49799
230.952540.86427
12-0.40823-0.06803
8-0.90306-0.73646
12-0.40823-0.06803
total9.40794
Asimetra:
Una caracterstica importante de un conjunto de datos es su homogeneidad. Si las desviaciones d:
son muy distintas, esto sugiere que hay datos que se separan mucho de la media y que tenemos por tanto alta heterogeneidad. Una posible medida de homogeneidad es la varianza de las d, que se expresa como:
CURTOSIS: cuarto momentoUna manera alternativa de medir la homogeneidad de los datos es el coeficiente de curtosis. Un objetivo central de la descripcin de los datos es decidir si los datos son una muestra homognea de una poblacin o corresponden a una mezcla de poblaciones distintas que deben estudiarse separadamente.Un caso especial importante de heterogeneidad es la presencia de una pequea proporcin de observaciones atpicas (outliers), que corresponden a datos heterogneos con el resto. La deteccin de estas observaciones es fundamental para una correcta descripcin de la mayora de los datos, ya que estos valores extremos distorsionan los valores descriptivos del conjunto.
El coeficiente de curtosis puede ayudar en este objetivo, ya que tomar un valor alto, mayor que 7 u 8.
Siempre que observemos un valor alto de la curtosis para una variable, esto implica heterogeneidad debido a unos pocos atpicos muy alejados del resto.
Aparece un tipo distinto de heterogeneidad cuando tenemos una mezcla de dos poblaciones, de manera que una proporcin importante de los datos, entre el 25% y el 50% son heterogneos con el resto. En este caso, el coeficiente de curtosis es pequeo, menor que 2.
x
12-0.408230.02777
15-0.037110.0000018
10-0.655650.18479
7-1.026771.11145
210.705130.24721
332.1896222.98661
230.952540.82325
12-0.408230.02777
8-0.903060,66506
12-0.408230.02777
total26.10168
OTRAS MEDIDAS
COEFICIENTE DE VARIACION
EMBED Equation.3 DESVIACION MEDIA Y ERROR ESTANDAR DE LA MEDIA.
n= 10
= 15.3
x
EMBED Equation.3
78.3
87.3
105.3
123.3
123.3
123.3
150.3
215.7
237.7
3317.7
= 62.2
CUARTILES, DECILES Y PERCENTILES.
EJERCICIODados los datos : 12, 15, 10, 7, 21, 33,23,12,8,12.
1. Ordenar en forma ascendente:
7,8,10,12,12,12,15,21,23,33
CALCULAR:
DIAGRAMA DE CAJA
Una medida alternativa de dispersin que puede ser ms representativa en el caso en que la distribucin es asimtrica o en presencia de datos atpicos, es el rango intercuartlico.
El rango intercuartlico (RIC). Hemos definido la mediana como el punto que separa el conjunto en dos partes de mismo tamao. Definimos de la misma manera los cuartiles como los puntos que separan el conjunto en cuatro partes de mismo tamao. El primer cuartil Q1 deja el 25% de los datos ordenados a su izquierda, y el otro 75% a su derecha, mientras que el tercer cuartil Q3 deja el 75% de los datos ordenados a su izquierda, y el otro 25% a su derecha. Por lo tanto el par (Q1,Q3) nos proporciona informacin sobre la dispersin presente en los datos: cuanto ms alejados estn los cuartiles, ms dispersos estn los datos. Por ello, calculamos el rango intercuartlico RIC como la diferencia entre Q3 y Q1.
El RIC tambin se utiliza para detectar datos atpicos:
Regla: Se consideran como atpicos los datos que son menores de Q1 1,5 RIC, o mayores de Q3 + 1,5 RIC.
El diagrama de caja-bigotes es un resumen grfico que permite visualizar, para un conjunto de datos, la tendencia central, la dispersin y la presencia posible de datos atpicos. Para realizarlo se necesita calcular la mediana, el primer cuartil, y el tercer cuartil de los datos.
Los segmentos 1.5 RIC (llamados bigotes) se recortan hasta el dato del conjunto inmediatamente superior a Q1 1,5 RIC para el bigote inferior, y el dato inmediatamente inferior a Q3 + 1,5 RIC, para el bigote superior.La mayor utilidad de los diagramas caja-bigotes es para comparar dos o ms conjuntos de datos.
La media es el promedio de los datos
EMBED Equation.3
Es el punto medio de una serie ordenada de datos.
PASOS:
Ordenar los datos en forma ascendente
7, 8, 10, 12,12, 12 , 15, 21, 23, 33
Si n es impar la mediana es el nmero de la mitad del conjunto ordenado.
Si n es par se debe promediar los dos valores intermedios del conjunto ordenado.
MEDIANA= 12+12/2=12 divide a los datos en dos mitades.
Es el valor mas frecuente dentro de un grupo de datos.
MODA= 12 ( SE REPITE 3 VECES)
Es la diferencia entre el valor mximo y mnimo de un grupo de datos.
12, 15, 10, 7, 21, 33, 23, 12, 8, 12.
Ordenar en formar ascendente.
7, 8, 10, 12, 12, 12,15, 21, 23, 33.
RANGO= MAX MIN
RANGO = 33 -7 = 26
Es el indicador de dispersin alrededor de la media.
EMBED Equation.3 EMBED Equation.3
Mide la dispersin promedio de los datos alrededor de la media.
EMBED Equation.3
EMBED Equation.3
EMBED Equation.3
EMBED Equation.3
EMBED Equation.3
Esta representa la elevacin o el achatamiento de una distribucin comparada con la distribucin normal.
Si la curtosis es +, la distribucin es relativamente elevada.
Si es es plana.
EMBED Equation.3
EMBED Equation.3
Es una medida de variacin alrededor de la media, es til cuando se desea comparar la variabilidad de dos conjuntos de datos.
EMBED Equation.3
Mide la exactitud de la media
EMBED Equation.3
EMBED Equation.3
EMBED Equation.3
Son aquellos que subdividen los datos de acuerdo con la proporcin de frecuencias observadas. Mientras que la mediana divide a la distribucin en 2 mitades, los cuartiles la dividen en cuatro cuartos, los deciles la dividen en diez decimos y los percentiles los dividen en cien partes.
Q Cuartiles.
D Deciles Los datos se deben de ordenar en
P Percentiles forma ascendente.
_1207403232.unknown
_1207497356.unknown
_1274523735
_1305552182
_1305552308
_1274528660.unknown
_1274528891.unknown
_1274530588.unknown
_1274523776
_1274523812
_1208068503.unknown
_1208069275.unknown
_1208069893.unknown
_1208070707.unknown
_1208070708.unknown
_1208070590.unknown
_1208069491.unknown
_1208069034.unknown
_1207497640.unknown
_1207497660.unknown
_1207498107.unknown
_1207497556.unknown
_1207497483.unknown
_1207407556.unknown
_1207407899.unknown
_1207496907.unknown
_1207496897.unknown
_1207407592.unknown
_1207404348.unknown
_1207404619.unknown
_1207407359.unknown
_1207407502.unknown
_1207404581.unknown
_1207403358.unknown
_1207404005.unknown
_1207403667.unknown
_1207403301.unknown
_1207402710.unknown
_1207403018.unknown
_1207403099.unknown
_1207402760.unknown
_1207399783.unknown
_1207402328.unknown
_1207402497.unknown
_1207399944.unknown
_1207399745.unknown
_1207399455.unknown