36
ESTADÍSTICA Para la gente común, la estadística significativa números. En el periódico de la mañana se pueden encontrar las estadísticas más recientes sobre los delitos de la ciudad: número de asesinatos, de robos de automóviles, de asaltos y demás delitos que hayan sido denunciados en determinado período de tiempo; o las más recientes estadísticas acerca de la mano de obra en el país: por ejemplo el número de desempleados; o las ultimas estadísticas sobre el número de nacimientos y de muertes que han ocurrido durante cierto período de tiempo; o, en relación con el deporte, el número de partidos ganados y perdidos por los equipos favoritos de la localidad. Aunque estos ejemplos realmente forman parte del concepto total de “estadística”, la palabra tiene un sentido más amplio para aquellas personas cuyo trabajo requiere un conocimiento (sí bien a veces mínimo) de los aspectos más técnicos de la estadística. Para estas personas la palabra “estadística”, tiene relación con aquellos conceptos y técnicas que se emplean en la recopilación, organización, resumen, análisis, interpretación y comunicación de información numérica. Naturalmente, dichos conceptos y técnicas juegan un papel importante en las actividades que cumplen los profesionales de todas las ciencias. Generalmente se diseña una serie de trabajos estadísticos para alcanzar uno de los dos siguientes objetivos, o ambos: 1. Describir cuantitativamente una serie de personas, lugares o cosas. 2. Dar información de la que se puede sacar conclusiones acerca de un grupo grande de personas, lugares o cosas, por medio de la observación de solo una pequeña parte del conjunto total. 46

Six Sigma Estadistica Descriptiva

Embed Size (px)

Citation preview

Page 1: Six Sigma Estadistica Descriptiva

ESTADÍSTICA

Para la gente común, la estadística significativa números. En el periódico de la mañana se pueden encontrar las estadísticas más recientes sobre los delitos de la ciudad: número de asesinatos, de robos de automóviles, de asaltos y demás delitos que hayan sido denunciados en determinado período de tiempo; o las más recientes estadísticas acerca de la mano de obra en el país: por ejemplo el número de desempleados; o las ultimas estadísticas sobre el número de nacimientos y de muertes que han ocurrido durante cierto período de tiempo; o, en relación con el deporte, el número de partidos ganados y perdidos por los equipos favoritos de la localidad.

Aunque estos ejemplos realmente forman parte del concepto total de “estadística”, la palabra tiene un sentido más amplio para aquellas personas cuyo trabajo requiere un conocimiento (sí bien a veces mínimo) de los aspectos más técnicos de la estadística. Para estas personas la palabra “estadística”, tiene relación con aquellos conceptos y técnicas que se emplean en la recopilación, organización, resumen, análisis, interpretación y comunicación de información numérica. Naturalmente, dichos conceptos y técnicas juegan un papel importante en las actividades que cumplen los profesionales de todas las ciencias.

Generalmente se diseña una serie de trabajos estadísticos para alcanzar uno de los dos siguientes objetivos, o ambos:

1. Describir cuantitativamente una serie de personas, lugares o cosas.2. Dar información de la que se puede sacar conclusiones acerca de un grupo

grande de personas, lugares o cosas, por medio de la observación de solo una pequeña parte del conjunto total.

Las actividades estadísticas encaminadas a lograr la primera meta se denominan estadística descriptiva y las que tiene por objeto alcanzar la segunda se llama estadística inferencial.

46

Page 2: Six Sigma Estadistica Descriptiva

¿POR QUÉ UN ADMINISTRADOR NECESITA CONOCER ESTADÍSTICA?

Hace un siglo H.G. Wells comentó “Algún día el pensamiento estadístico será tan necesario como la habilidad para leer y escribir”. Al comienzo del nuevo milenio, el problema que enfrentan los gerentes no es la escasez de información, sino como utilizar la información disponible para tomar las decisiones más adecuadas.Desde la perspectiva de una toma de decisiones informada, cabe preguntar por qué un administrador necesita saber estadística. Los administradores deben comprender la estadística por cuatro razones fundamentales:

1.- Para saber como presentar y describir la información en forma adecuada.2.- Para saber como obtener conclusiones sobre poblaciones grandes basándose solamente en la información obtenida de las muestras.3.- Para saber como mejorar los procesos 4.- Para saber como obtener pronósticos confiables.

47

1

2

Introducción y recopilación de datos, tablas y graficas.Estadística descriptiva.

Probabilidad básica y distribuciones de probabilidad. Estadística Inferencial.

Aplicaciones Estadísticas en la administración de la calidad y productividad

Modelos de Regresión lineal simple y múltipleCorrelación.

3

4

Page 3: Six Sigma Estadistica Descriptiva

AREAS DE APLICACIÓN DE LA METODOLOGIA ESTADISTICA.

Ya hemos observado que los conceptos y la metodología de la estadística se emplean en muchos campos. A continuación mencionaremos algunas áreas solamente en donde ella se utiliza.

Agricultura. Las técnicas estadísticas se emplean en actividades tales como experimentos sobre la reproducción de plantas y animales, estudios de la bondad relativa de diversos fertilizantes, insecticidas, etc. y estudios de métodos para aumentar el rendimiento de las cosechas.

Biología. En biología se emplean los métodos estadísticos para estudiar las reacciones de las plantas y los animales ante diferentes presiones ambientales y para investigar la herencia.

Negocios. Utilizando la estadística, los hombres de negocios pueden predecir los volúmenes de ventas, medir las reacciones de los consumidores ante los nuevos productos, tomar decisiones en cuanto a la forma de invertir el presupuesto para publicidad y determinar el mejor método para utilizar las habilidades y aptitudes de sus empleados.

Salud y medicina. Los resultados que obtienen en las investigaciones sobre fármacos se analizan por medio de los métodos estadísticos. Los técnicos de la salud la utilizan para planear la localización y el tamaño de los hospitales y de otras dependencias de salud. Los médicos investigadores se ayudan del análisis estadístico para evaluar la efectividad de diversos tratamientos.

Industria. La mayor parte de los industriales utilizan algún control de calidad y los conceptos y técnicas estadísticas constituyen la base de casi todos estos programas.

Psicología. Los psicólogos se valen de los conceptos y técnicas y las estadísticas para medir y comparar la conducta, las actitudes, la inteligencia y las aptitudes de hombre.

Sociología. En la sociología las técnicas estadísticas se emplean en los estudios comparativos de diferentes grupos socioeconómicos y culturales y en el estudio del comportamiento y las actitudes del grupo.

48

Page 4: Six Sigma Estadistica Descriptiva

TERMINOLOGIA ESTADISTICA

Daremos solamente el vocabulario estadístico básico de esta sección pues los demás términos se definirán a medida que se vayan presentando.

Entidad. En el análisis estadístico se concentra la atención en un conjunto de personas, lugares o cosas. Un biólogo puede estar interesado en las ardillas que habitan determinada región. Un médico puede interesarse por los pacientes que muestren determinada serie de síntomas. Un educador puede demostrar interés por aquellos estudiantes que han aprendido a leer empleando determinado método. Aun investigador agrícola le llamará la atención cierta variedad de trigo. Aun meteorólogo le interesarán las precipitaciones que ocurren en ciertas regiones. Vamos a utilizar la palabra entidad como término general para referirnos a un miembro individual de un grupo de personas, lugares o cosas.

Variable. Es el conjunto de características de las entidades que interesan en una investigación científica. El médico puede querer investigar el nivel de colesterol de ciertos pacientes. Al educador le puede llamar la atención el rendimiento en la lectura de los estudiantes que han aprendido a leer con un método determinado. El investigador agrícola puede estar interesado en conocer la resistencia a una variedad de trigo ha cierta enfermedad. Al meteorólogo le puede llamar la atención la nieve como una proporción de la precipitación total. En virtud de que cualquiera de estas características, por regla general, presenta un valor diferente cuando se observa ha diferentes entidades, ella recibe el nombre de variable. Además de las variables ya mencionadas, inmediatamente vienen a la mente otras, tales como la estatura de el hombre, la vida de la llantas de automóvil, el color de la piel de los perros y el número de zurdos en una escuela.

Variable aleatoria. Si los valores numéricos que toman una variable provienen de factores fortuitos y si un determinado valor no se puede predecir exactamente con anticipación, esa variable se denomina variable aleatoria.

Para presentar las variables aleatorias utilizamos letras mayúsculas como X,Y y Z. De esta manera, podemos referirnos a la variable aleatoria “edad” como X o a la variable aleatoria “estatura” como Y. Los valores individuales de una variable aleatoria se representan con letras minúsculas tales como x, y, y z. Si por ejemplo, la variable aleatoria X tiene 6 valores, nos referimos a estos valores como x1, x2, x3, x4, x5, y x6. Los subíndices servirán para distinguir un valor de la variable aleatoria de otro.

Fuera de esto, las variables se pueden clasificar según sean continuas o discretas o según sean cuantitativas o cualitativas.

49

Page 5: Six Sigma Estadistica Descriptiva

Variable continúa. Una variable continua es aquella que teóricamente puede tomar cualquier valor dentro de un intervalo de valores. Es decir, una variable continua se mide uniformemente. Otra manera de explicar lo que es una variable continua consiste en decir que, sin importar que tan cerca puedan estar dos valores de una variable, es posible teóricamente hallar otra variable cuyo valor se pueda colocar entre ellos. Un ejemplo de variable continua es la estatura humana sin tener en cuenta qué tan próxima sea la estatura de dos personas, es posible teóricamente encontrar otra persona que sea más alta que la más baja y a la vez más baja que la mas alta de las dos. Nuestra posibilidad de identificar a tal persona en la práctica puede dificultarse por las limitaciones de los instrumentos de medidas disponibles. Otras variables continuas pueden ser aquellas que se miden con una escala de peso, tiempo o temperatura.

Variable discreta. Cuando los valores que puede tomar una variable que está separado entre sí por una determinada cantidad, la variable se denomina variable discreta. Una característica de la variable discreta es la presencia de “vacíos “o “interrupciones “entre los valores que puede tomar. Como ejemplo de variables discreta puede citarse, el número de administraciones en un hospital durante un día determinado, el número de accidentes automovilísticos que se producen dentro de los limites de una ciudad durante un mes, el número de colonias de bacterias en una placa de agar y el número de estudiantes de primer año en un sistema escolar determinado.

Variable cuantitativa. Se dice que una variable es una variable cuantitativa siempre que los valores que puede asumir sean los resultados de medidas numéricas. Ejemplos de variable cuantitativas son la estatura, el peso, la temperatura, el cociente de inteligencia (CI) la presión sanguínea, el número de estudiantes de primer año y el numero de accidentes que se producen en alguna región geográfica en un período de tiempo dado.

Variable cualitativa. Hay muchos casos en que no es posible hacer medidas numéricas. Muchas variables son susceptibles solamente de clasificación. Por ejemplo, la variable “estado civil” puede recibir los valores cualitativos de soltero, casado, divorciado, viudo y, tal ves, todo los demás. Si las entidades de interés son estudiantes universitarios y si la variable de interés es “curso” la variable puede asumir los valores cualitativos de primero, segundo, tercero, etc. Una variable cuyos valores consisten en categorías de calificación se denomina variable cualitativa.

Como la determinación del valor de una variable cuantitativa se lleva a cabo por medio de algún procedimiento de medición, el resultado se denomina medida. Un grupo de tales medidas recibe el nombre datos de medida. Cuando las entidades se clasifican teniendo en cuenta una variable cuantitativa, generalmente es necesario contar el número de entidades que se pueden clasificar en cada una de las categorías. La información de este tipo se denomina datos de conteo. Frecuentemente se usa la palabra observación para hacer referencia a un dato de medida o de conteo.

50

Page 6: Six Sigma Estadistica Descriptiva

Población. el concepto que tiene la gente común de población, es el que se relaciona con un conjunto de personas, como la población de una ciudad, un estado o una nación aunque a veces vamos a emplear este término para referirnos a un conjunto de entidades, lo utilizaremos con más frecuencia para hacer referencia a un conjunto de valores de alguna variable aleatoria relacionada con un conjunto de entidades. Por ejemplo, podemos hablar de una población de pesos, una población de puntajes de pruebas o una población de niveles de colesterol. Podemos entonces definir población como el conjunto más grande de valores (de una variable), por el cual existe algún interés.

Esta definición indica que las poblaciones son definidas por el investigador y no están predeterminadas por algún proceso que exceda el control que este tenga. Supongamos a manera de ejemplo que estamos interesados en los puntajes de rendimiento en la lectura de todos los alumnos del nivel primario de un sistema escolar. La población esta compuesta entonces por todos estos puntajes de rendimiento en la lectura. Pero si solamente estamos interesados en los puntajes de los alumnos de quinto grado, tenemos una población totalmente distinta. Al definir nuestra esfera de interés definimos nuestra población.

Las poblaciones pueden ser finitas o infinitas. Si en realidad nuestro interés se limita a los puntajes de los estudiantes de algún sistema escolar en un determinado momento, estamos definiendo una población finita. Pero si lo que nos interesa son los puntajes de todos los estudiantes de la escuela primaria en el pasado, presente y futuro, la población es infinita para cualquier pronóstico práctico.

Muestra. Una muestra es una parte de una población. el tamaño completo de una población aun siendo finita, puede desanimarnos al intentar investigarla en su totalidad. Puede ser necesario o conveniente examinar solo una fracción (muestra) de la población. a pesar de lo que ya hemos definido la inferencia estadística en términos generales, podemos ahora ser más específicos y decir que la inferencia estadística es el procedimiento por el cual se tienen conclusiones a cerca de una población a partir de la información que se tiene de una muestra de esa población.

51

Page 7: Six Sigma Estadistica Descriptiva

IMPORTANCIA DEL MANEJO DE DATOS

La manera como normalmente conocemos la realidad consiste en observarla, obteniendo de nuestras observaciones el mayor número posible de datos. En esta forma podemos predecir que sucederá en casos semejantes y como será el futuro comportamiento del proceso o de la realidad que hemos observado. Más no siempre nos es posible conocer todos los datos.

Podemos ciertamente saber cuántas toneladas de grano se producen en una determinada hectárea de tierra. Pero sería demasiado difícil y costoso averiguar este dato en todas y cada una de las áreas sembradas con este grano.

Podemos saber la medida exacta de un determinado grupo de tornillos producidos en un mismo día a determinada hora; pero sería tarea casi imposible medir todos los tornillos producidos por esa fábrica durante todos los días del año.

Debido a esto se ha optado por trabajar con unos cuantos datos, seleccionados científicamente, para inferir, a partir de ellos, un comportamiento general. En esta forma de proceder se basa gran parte de nuestros conocimientos.

La necesidad de seleccionar unos cuantos datos y de operar mediante el conocimiento obtenido a través de ellos se deja sentir, sobre todo en el terreno de actividad producida del hombre.

No es posible saber con toda exactitud la cantidad de divisas extranjeras que ingresan por el turismo. Sin embargo, es muy importante para la vida económica saber este dato aunque sea en forma aproximada. Por eso, para evaluar el ingreso que deja el turismo, se calcula al gasto que hace en promedio un visitante y se multiplica este dato por el número de turistas que han ingresado en una determinada época.

Toda empresa saca muestras de las entregas de materia prima que recibe para ver si las piezas que compra responden a las especificaciones que ella a establecido a sus proveedores.

Como gran parte del conocimiento de actividad productiva se basa en los datos y puesto que no es posible conocerlos todos; por eso, cada día cobra mayor importancia el estudio de una ciencia que nos enseña a inferir a partir de unos cuantos datos. Esta ciencia es la estadística.

52

Page 8: Six Sigma Estadistica Descriptiva

QUE ES ESTADISTICA

CONCEPTOS FUNDAMENTALES

Todos tenemos una idea general de lo que es la estadística, pues utilizamos una forma espontánea sus procedimientos.

Constantemente tomamos muestras para ver la calidad de un producto que vamos a comprar; como también hablamos con mucha frecuencia de promedios, por ejemplo, con respecto a nuestro gasto mensual de gasolina.

La estadística es la ciencia que se ocupa de recopilar, organizar, representar, analizar, extraer y generalizar la información contenida en un conjunto de datos.

Llamamos población estadística al conjunto de todos los datos sobre los que versan las actividades de recopilación, organización, etc., que acabamos de mencionar.

Si se tienen 1500 mangueras de gasolina, cuyos diámetros miden entre 14.2 y 15.2 milímetros, la población estadística esta formada por estos 1500 datos.

Si examinamos 550 monoblocks y vemos que el espesor de las paredes oscila entre 3.24 y 3.64 cms., Estos 550 datos integran la población estadística.

En un día determinado se elaboran 750 artículos que se etiquetaron con bueno o defectuoso según que cumplieron, o no, las especificaciones establecidas. La población estadística abarca 750 descripciones.

Dado que en la mayoría de los casos resulta poco práctico o incosteable analizar la totalidad de los elementos de los que se compone la población estadística, se ha optado por seleccionar unos cuantos de éstos para su estudio. Los elementos seleccionados se denominan muestra.

Una muestra, pues, está constituida por algunos elementos de la población estadística.

Para que podamos estudiar la población estadística a través de muestras, es necesario que estas sean respectivas de aquella.

Cuando todos los elementos de la población estadística tienen la misma posibilidad de ser seleccionados y en esas circunstancias se obtienen una muestra, esta se llama muestra representativa. La muestra representativa se llama también muestra aleatoria.

Una empresa va a invertir una fuerte cantidad de dinero en el bienestar de los trabajadores. Supongamos que, para decidir si el dinero se invierte en deportes o en el teatro de la empresa, se toma una muestra de entre los miembros de los equipos de fútbol y béisbol; es claro entonces que esta muestra no es representativa.

53

Page 9: Six Sigma Estadistica Descriptiva

Tampoco son muestras representativas de la producción de una maquina las piezas tomadas al inicio del funcionamiento de dicha máquina cuando, por naturaleza del proceso, las primeras piezas producidas son en su mayoría defectuosas.

La estadística descriptiva es la parte de la estadística que versa sobre la recolección, organización y análisis de datos.

La estadística inductiva o inferencial es la parte de la estadística que hace inferencias o generalizaciones con base en los resultados de las muestras representativas.

Hacemos inferencias o generalizaciones a partir de las muestras de una población, cuando suponemos que las situaciones que hemos observado en las muestras aparecen en toda la población. Estas situaciones pueden ser el grado de variación de los datos, el que gran cantidad de los productos este dentro o fuera de la especificaciones, el que todos los datos se encuentren alrededor de un valor determinado, y observaciones de este tipo.

OBSERVACIONES A TENER EN CUENTA EN LA RECOLECCIÓN DE DATOS

Un buen estudio estadístico comienza con una recolección de datos hecha en forma correcta.

Esto requiere tomar ciertas precauciones. A continuación enumeramos algunas de ellas:

a) Los valores que se registran deben corresponder realmente a lo que hemos observado. Es necesario registrar fielmente los datos.

b) Si los datos son continuos, es muy importante efectuar la medición con la mayor precisión posible, esto es, con el menor error posible.

c) Se debe cuidar que los instrumentos de medición estén bien calibrados.d) Se deben usar adecuadamente los instrumentos de medición.

Si hay errores en la obtención de datos, las conclusiones no serán objetivas a pesar de tener muestras representativas y realizar un buen estudio estadístico

54

Page 10: Six Sigma Estadistica Descriptiva

LA ORGANIZACIÓN DE DATOS EN TABLA DE FRECUENCIA

Para poder analizar los datos, obtener la información que deseamos a partir de ellos, necesitamos ordenarlos. Los datos en desorden no nos dicen nada.

La forma común de ordenarlos consiste en construir con ellos la llamada tabla de frecuencia.

Esta tabla consiste básicamente en organizar los datos por grupos, a fin de poder ver.

Que datos representan los valores más bajos, y cuales los mas altos. Y con que frecuencia.

Procedimiento para elaborar la tabla de frecuencia.

Paso 1: Obtención de rango (R)

Se entiende por rango (R) la diferencia que existe entre el dato mayor (VM) y el menor (Vm) de un conjunto de datos.

Paso 2: Determinación del número de clases (K) en las que se van agrupar los datos.

Se llama clase a cada uno de los subconjuntos en los que se agrupan los datos.

Para determinar en cuantas clases (K) conviene agrupar los datos, se acostumbra tomar en cuenta la siguiente norma:

Paso 3: Determinación de la amplitud (A) de las clases.

Establecido el número de clases en que van a quedar agrupados los datos, se determina dentro de que amplitud se escogerán los datos para cada clase.

Esto se lleva a cabo, primero, dividiendo el rango (R) obteniendo del conjunto de datos entre el número establecido de clase.

A = R

K

55

Cantidad de datos (N) Menos de 50 50 a 100 100 a 250 mas de 250

Cantidad de clases (K) 5 a 7 6 a 10 7 a 12 10 a 20

Page 11: Six Sigma Estadistica Descriptiva

Paso 4: Determinación de las fronteras o limites de cada clase .

Con este resultado (A) pasamos enseguida, a establecer las fronteras inferior (Ll) y superior (Ls) de cada clase

La frontera inferior de la primera clase se establece restando la mitad de una unidad (u) al dato menor de todo el conjunto.

Frontera Inferior:

L l de X* = Vm – ½ (u)

Frontera superior:

LS de X* = (Vm - ½(u)) + A

Paso 5: Identificación del valor medio de cada clase; valor que es llamado marca de clase (Xi).

Para encontrar la marca de clases, se suma la frontera inferior con la frontera superior de dicha clase, dividiendo después el resultado entre 2. También se dice que la marca de clase o punto medio es la semisuma de sus fronteras.

Xi = Ll + Ls

2

56

Cuando se trabaja con números enteros, la unidad (u) equivale a 1.

Cuando se trabaja con números fraccionarios la unidad (u) es de La misma clase que las unidades fraccionarias que se manejan.

Así, si se trabaja con décimas la unidad es una décima (0.1);Si con centésimas, la unidad es una centésima (0.01);

Si con milésimas la unidad es una milésima (0.001). etc.

Page 12: Six Sigma Estadistica Descriptiva

Paso 6: Conteo de datos que pertenecen a cada clase.

Establecidos los límites inferior y superior de cada clase, se cuentan los datos que caen dentro de cada una de las clases establecidas.

Paso 7: Elaboración de la tabla de frecuencias

Puesto que ya tenemos la amplitud de cada clase, el número de datos que pertenece a cada una de las clases y la marca de clase, podemos entonces pasar a elaborar la tabla de frecuencias.

Paso 7: Indicar las suma de datos que va resultando de sumar la cifras de una clase con las cifras de las clases anteriores (frecuencias absolutas ) fi

Paso 8: Indicar el porcentaje que va resultando al sumar el porcentaje de una clase con el porcentaje de las clases anteriores (frecuencias relativas ) hi

Paso 9: Adición de la columna de frecuencias absolutas acumuladas (Fi).

En esta columna se indica el resultado de sumar las frecuencias de cada clase (fi) con las frecuencias de las clases anteriores.

Paso 10: Adición a las frecuencias relativas acumuladas (Hi).

En esta columna se indica el resultado de sumar el porcentaje (hi) de una clase con el porcentaje de las clases anteriores.

Realizar el siguiente ejemplo.

Se desea analizar el tiempo de vida de los focos de las señales direccionales para autos. Para ello, se procede a obtener una muestra de 30 focos registrando el número de horas que duran encendidos. Los resultados obtenidos se recogen por hileras y por columnas en la siguiente forma.

57

237 180 285 225 288 232 290 234 271 295 247 338 315 248 320 255 305 274 284 292 192 318 268 279 261 374 228 358 210 244

Page 13: Six Sigma Estadistica Descriptiva

EJERCICIOS

1.- Los datos que se muestran a continuación representan el costo de la energía eléctrica durante el mes de julio del 2006 para una muestra aleatoria de 50 departamentos con dos recamaras en una ciudad grande.

Costo de energía eléctrica en dólares.

96 171 202 178 147 102 153 197 127 82

157 185 90 116 172 111 148 213 130 165

141 149 206 175 123 128 144 168 109 167

95 163 150 154 130 143 187 166 139 149

108 119 183 15 114 135 191 137 129 158

a) Determine una tabla de frecuencias y obtenga conclusiones.

b) Alrededor de que cantidad parece concentrarse el costo mensual de energía eléctrica.

2.- Con base en los datos de las tablas siguientes, correspondientes a la vida útil en horas de una muestra de 40 focos de 100 watts, producidos por el fabricante A y otra muestra de 40 focos de 100 watts, producidos por el fabricante B. Elabore una tabla de frecuencias para cada fabricante y obtenga conclusiones.

Fabricante A Fabricante B

684 697 720 773 821 819 836 888 897 903

831 835 848 852 852 907 912 918 942 943

859 860 868 870 876 952 959 962 986 992

893 899 905 909 911 994 1004 1005 1007 1015

922 924 926 926 938 1016 1018 1020 1022 1034

939 943 946 954 971 1038 1072 1077 1077 1082

972 977 984 1005 1014 1096 1100 1113 1113 1116

1016 1041 1052 1080 1093 1153 1154 1174 1188 1230

58

Page 14: Six Sigma Estadistica Descriptiva

MEDIDAS DE TENDENCIA CENTRAL

MEDIA ARITMETICA O PROMEDIO (X)

Representa la suma de las observaciones, dividida entre el número total de datos que hay en la serie o conjunto de ellos.

X1 + X2 + X3 +..........+ XnX = n MEDIANA X La mediana es otra medida de tendencia central que puede encontrarse arreglando una serie de medidas o datos en forma ascendente o descendente y localizándose al centro. Es decir: si el numero de observaciones es non, habrá que localizar las dos observaciones del centro, sumarlas y entonces dividir esa suma entre dos y esa será la mediana.

LA MODA XLa moda es el valor que más frecuentemente ocurre en una serie de observaciones.

MEDIDAS DE DISPERSIÓN

Para tener una idea exacta de la forma como se relacionan entre sí los datos de un conjunto, no es suficiente identificar su tendencia central; es necesario, además, examinar qué tanto difieren entre sí, esto es, que grado de dispersión existe entre ellos. las más usuales son el Rango y la desviación estándar.

RANGO REl rango, amplitud u horquilla es la medida de dispersión que se define como la diferencia entre el mayor y el menor de los valores o lecturas de una serie de datos.

LA VARIANZA Y LA DESVIACIÓN ESTÁNDARLa varianza es la medida de dispersión que proporciona el promedio de desviación de un conjunto de datos con respecto a su valor central. El valor central es generalmente su media.La formula mediante la cual se obtiene la varianza es la siguiente.

59

(X1-X) + (X2 – X ) + ........... + (Xn – X )

n

S2 =

2 2

o

Page 15: Six Sigma Estadistica Descriptiva

LA DISTRIBUCIÓN NORMAL

Supongamos que a partir de una serie de datos, construimos un histograma. Si a continuación incrementamos el número de datos y al mismo tiempo disminuimos la longitud de los intervalos, obtendremos, en el límite, una curva suavizada: la curva de la distribución de frecuencias de la población de donde provienen esos datos.Hay muchos tipos de curvas de distribución de frecuencia. La más típica es la curva de distribución normal. Esta curva se estudió por primera vez en el siglo XVIII, cuando se observó que los patrones que se presentaban al medir errores seguían una distribución simétrica y en forma de campana.En el año de 1733, De Moivre la obtuvo en forma matemática, como la forma limite de la distribución binomial. Un error en la historia atribuye a Karl Gauss el descubrimiento de esta distribución, por lo que frecuentemente se le refiere como distribución de Gauss (o Gaussiana). Más adelante, en los siglos XVIII y XIX, se hicieron intentos para tratar de establecer esta distribución como la base de todas las variables aleatorias continuas, por lo que se empezó a utilizar el término normal.

IMPORTANCIA DE LA DISTRIBUCIÓN NORMAL.

I) Cuando la variación es una característica de la calidad, se puede considerar que se debe a un número muy grande de errores infinitesimales independientes, atribuibles a diferentes factores, la distribución de dicha característica en la mayoría de los casos es normal.

II) La distribución de muchos estadísticos (como la media muestral) es aproximadamente normal, independientemente de la distribución de donde provienen las observaciones (Cuando se toman muestras grandes)

III) La distribución normal es una excelente aproximación a muchas otras distribuciones probabilísticas.

CARACTERÍSTICAS DE LA CURVA NORMAL.

1) Simetría respecto a su media2) Forma acampanada ( la frecuencia toma su valor máximo en el centro y

disminuye conforme los valores de la variable se alejan hacia las colas )

La curva normal se expresa matemáticamente como

60

f(x) = e1

2

-1/2 X - 2

Page 16: Six Sigma Estadistica Descriptiva

Gráficamente sería:

Podemos observar, a partir de la ecuación anterior, que se incluyen dos parámetros: y . Estos dos parámetros determinan una curva normal. Si X es una variable aleatoria con distribución normal, media y desviación estándar , utilizamos la notación de X N (, ) para hacer referencia a ello.

El parámetro representa la posición central de la distribución (la media)El parámetro representa la dispersión de la distribución (la desviación estándar), estos parámetros se pueden describir gráficamente, como lo muestra la figura.

61

X

X

Page 17: Six Sigma Estadistica Descriptiva

Es interesante comentar que dada una variable X N (, ), la probabilidad de que observemos un valor de X entre + . Es aproximadamente 68.3 %, entre + 2. 95.4% y entre + 3., 99.7% observamos lo anterior en la siguiente figura.

FORMULA A UTILIZAR SERIA:

62

X

68.3 %

95.4 %

99.7%

+ . + 2.

+ 3.,

X - Z =

Page 18: Six Sigma Estadistica Descriptiva

EJERCICIOS DE DISTRIBUCIÓN NORMAL

1.- Se observó en un largo periodo que la cantidad semanal gastada en el mantenimiento y en las reparaciones en cierta fábrica tiene aproximadamente una distribución normal con una media de $ 400 y una desviación estándar de $20, si el presupuesto para la próxima semana es de $450 ¿Cuál es la probabilidad de que los costos reales sean mayores que la cantidad presupuestada?

2.- En el ejercicio 1, ¿de cuánto tendrá que ser el presupuesto para reparaciones semanales y mantenimiento, para que la cantidad presupuestada solamente se rebasara con una probabilidad de 0.1?

3.- Una empresa metalmecánica produce rodamientos con diámetros que tienen una distribución normal con media de 3.0005 pulgadas y una desviación estándar de 0.0010 pulgadas. Las especificaciones requieren que los diámetros estén en el intervalo 3.000 + 0.0020 pulgadas. Se rechazan los cojinetes que quedan fuera del intervalo y deben volverse a maquinar. ¿ Que fracción de la producción total será rechazada?

4.- Los alambres que se utilizan en cierta computadora deben tener una resistencia entre 0.12 y 0.14 ohms. Las resistencias reales de los alambres producidos por la compañía A tienen una distribución de probabilidad normal con media de 0.13 ohms y una desviación estándar de 0.005 ohms.¿Cuál es la probabilidad de que un alambre seleccionado al azar de la producción de la compañía A satisfaga las especificaciones?

5.- Un método para hacer predicciones económicas es mediante una aproximación por consenso. Se obtiene un pronóstico de cada uno de un gran número de analistas; el promedio de estos pronósticos individuales es él pronóstico general. Suponga que los pronósticos individuales de enero de 1985 con respecto a la tasa de interés mínima de todos los analistas económicos tiene aproximadamente una distribución normal con una media igual de 14 % y una desviación estándar de 2.6 %, si se selecciona al azar a un solo analista de este grupo ¿Cual es la probabilidad de que los pronósticos de la tasa de interés mínima del analista sea.

a) mayor de 18 %b) menor de 16 %

63

Page 19: Six Sigma Estadistica Descriptiva

6.- El diámetro de los pernos de una fábrica tiene una distribución normal con una media de 950 milímetros y una desviación estándar de 10 milímetros.

a) Cual es la probabilidad de que un perno escogido al azar tenga un diámetro entre 947 y 958 milímetros.

b) Cual es el valor apropiado de C tal que un perno escogido al azar tenga un diámetro menor que C con una probabilidad de 0.8531

7.- Se supone que los resultados de un examen tienen una distribución normal con media de 74 y una desviación de 5.

a) Cual es la probabilidad de que una persona que presta el examen obtenga una calificación mayor que 70.

b) Suponga que los estudiantes que se encuentran en el 15 % de la parte superior de la distribución se les asigne una calificación de A. ¿cual es la calificación mínima que debe obtener un estudiante para tener una calificación de A?

c) Cual debe ser la mínima calificación aprobatoria si el evaluador pretende que solamente el 30 % de los estudiantes apruebe?

d) Calcular aproximadamente la porción de los estudiantes que tienen calificaciones que exceden por lo menos en 3 puntos a la calificación reprobatoria del 15 % ( de calificaciones inferiores.)

8.- Se puede ajustar una máquina de refrescos de tal manera que llene los vasos con un promedio onzas de vasos. Si el número de onzas por vaso tiene una distribución normal con una desviación estándar igual a 0.3 onzas, encuentre el valor de de tal manera que los vasos de 8 onzas solamente se derramaran el 2 % del tiempo.

9.- Una empresa ha encontrado que la duración de sus llamadas telefónicas de larga distancia, tienen aproximadamente una distribución normal, con media de 4 minutos y desviación estándar de 1.5 minutos.

a) En que proporción las llamadas a larga distancia tienen una duración de más de 2.5 minutos, pero menor de 3.5 minutos.

b) Que proporción de llamadas se completa en 2 minutos o menosc) Una secretaria va hacer una llamada de larga distancia, cual es la

probabilidad de que dure más de 4.5 minutos.

10.- Un psicólogo descubre que sujetos normales completan una tarea determinada en un promedio de 10 minutos. El tiempo requerido para completar la tarea esta aproximadamente normalmente distribuido con una desviación estándar de 3 minutos. Hallar lo siguiente:

a) la proporción de sujetos normales que completan la tarea en menos de cuatro minutos.

b) La proporción de sujetos que requieren mas de 5 minutos para completar la

tarea.64

Page 20: Six Sigma Estadistica Descriptiva

c) La probabilidad de que un sujeto normal, a quien se la haya asignado la tarea, la complete en 3 minutos.

11.- Si los diámetros de las bolas de los cojinetes están normalmente distribuidos con media de 0.6140 y desviación estándar de 0.0025 pulgadas, determine el porcentaje de ellas con diámetros.

a) entre 0.610 y 0.618b) mayores que 0.617c) menores que 0.608

12.- la nota media en un examen es de 72 y la desviación estándar 9, el 10 % del curso recibirá grado “A” ¿Cual es la nota mínima para optar a él?

12.- El diámetro interno terminado de un aro de pistón está distribuido de manera normal con una media de 4.50 cm y una desviación estándar de 0.005 cm. ¿ que probabilidad hay de obtener un diámetro que exceda de 4.51 cm.?

13.- Si X está distribuida de manera normal con media de 100 y una desviación estándar de 18, calcule la probabilidad de que una observación aleatoria quede dentro de :

a) 115 y 140b) 90 y 120

14.- Metales de Lago S.A. fabrica repuestos de pistones para varios tipos de motores a gasolina y diesel. Cada pistón debe cumplir ciertas tolerancias, pues de otro modo no opera normalmente cuando se coloca en el cilindro. El modelo 3475X está diseñado para un carro de 4 cilindros, que requiere un diámetro del pistón de 4.2 + 0.05 pulgadas. Los tornos automáticos de metales elaboran los pistones con un diámetro medio de 4.18 pulgadas y una desviación estándar de 0.06 pulgadas ¿cual es la probabilidad de que un pistón producido en el torno cumpla las especificaciones?

15.- Producciones Segura S.A. desarrolló y patentó recientemente un detector de humo ultrasensible para usarlo tanto en edificios residenciales como en comerciales. Cada vez que detecta algo de humo en el aire, se enciende una sirena. En una prueba realizada en una habitación, los niveles de humo que activaron el detector promediaron 372 (ppm) con una desviación estándar de 13 (ppm). Si un cigarrillo introduce 75 (ppm) a la atmósfera de la habitación de prueba, ¿ cuál es la probabilidad de que 5 personas fumando simultáneamente accionen la alarma?

16.- Unos expertos agrícolas descubren que el rendimiento por acre de un determinado tipo de grano tiene una distribución aproximadamente normal, con

media y desviación estándar de 40 y 10 toneladas de acre respectivamente.65

Page 21: Six Sigma Estadistica Descriptiva

a) Que proporción del área en acres sembrados de este grano produce más de 50 toneladas por acre

b) Si se elige al azar un acre en la hacienda donde se siembra este grano, cual es la probabilidad de que produzca menos de 15 toneladas?

17.- Los puntajes de una prueba de aptitud escolar están normalmente distribuidos con una media de 600 y una varianza de 10,000.

a) ¿que proporción de los encuestados tiene un puntaje por debajo de 300?b) una persona va a presentar la prueba. ¿Que probabilidad tiene de obtener

un puntaje de 850 o más?c) ¿Que proporción de puntajes estará entre 450 y 700?

18.- En una población determinada, la estructura de los adultos hombres esta más o menos normalmente distribuida con media y desviación estándar de 70 y 3 pulgadas respectivamente:

a) ¿Que proporción de hombres tiene entre 75 y 73 pulgadas de altura?b) Se elige al azar un adulto en esa población. ¿Cual es la probabilidad de que

tenga más de 6 pies de altura?c) ¿Que proporción de adultos tiene menos de 5 pies y 8 pulgadas de altura?

19.- la longitud de los pétalos en una especie de flor esta normalmente distribuida con una media y desviación estándar de 4 y 2 cm respectivamente.

a) ¿Que proporción de pétalos tiene mas de 5 cm?b) ¿ Que proporción tiene menos de 2.5 cm?

20.- La velocidad de los automóviles al pasar por el punto de verificación de una autopista esta más o menos normalmente distribuida con una media de 45 MPH y una varianza de 35.

a) ¿Que proporción de los automóviles que pasan por el punto de verificación viajan a mas de 50 mph ?

b) ¿que proporción de automóviles pasa por el punto de control a una velocidad de menos de 40 mph ?

c) Suponga que la velocidad limite en el control es de 55 mph. ¿ Que proporción de automóviles exceden esta velocidad cuando pasan por el control?

21.- En un sector del país los gastos semanales de una familia están mas o menos

normalmente distribuidos, con media y desviación estándar de $60 y $15 respectivamente.

66

Page 22: Six Sigma Estadistica Descriptiva

a) hallar la proporción de familias que gastan en alimentos mas de $80 por semana

b) Hallar la proporción que gastan menos de $50 por semana.

22.-Los gastos mensuales en alimentación para familias de cuatro miembros en una ciudad grande son en promedio de 420 dólares con una desviación estándar de 80 dólares. Suponga que los gastos mensuales por alimentación se tienen distribución normal.

a) ¿Qué porcentaje de estos gastos es menor a 350 dólares?b) ¿Qué porcentaje de estos gastos esta entre 252 y 350 dólares?c) ¿Qué porcentaje de estos gastos esta entre los 250 y 450 dólares?d) ¿Qué porcentaje de estos gastos es menor que 250 o mayor que 450

dólares?

23.-La compañía de transportes de Toby determino que en un periodo de un año la distancia recorrida por cada camión sigue una distribución normal con una medida de 50 mil millas y desviación estándar de 12 mil millas.a) ¿Qué proporción de camiones se puede esperar que recorra entre 34 y 50

mil millas al año?b) ¿Cuál es la probabilidad de que un camión seleccionado al azar recorra

entre 34 y 38 mil millas al año?c) ¿Qué porcentaje de camiones se puede esperar que recorra ya sea menos

de 30 o más de 60 mil de millas al año?d) ¿Cuántos de los 1000 camiones de la flota se espera que recorran entre 30

y 60 mil millas al año?

24.- Se encontró que un conjunto de calificaciones de exámenes finales en un curso introductorio de estadística tenía distribución normal con medida de 73 y desviación estándar de 8. a) ¿Cuál es la probabilidad de obtener una calificación no mayor de 91 en este

examen?b) ¿Qué porcentaje de estudiantes obtuvo una calificación entre 65 y 89?c) ¿Qué porcentaje de estudiantes obtuvo una calificación entre 81 y 89?d) ¿Cuál fue la calificación superior sólo por el 5% de los estudiantes que

hicieron el examen?

25.- Un análisis estadístico de 1,000 llamadas de larga distancia realizadas en

la oficinas principales de la Jonson & Shurgot Corporation Indica que la 67

Page 23: Six Sigma Estadistica Descriptiva

duración de estas llamadas tiene distribución normal con µ = 240 segundos y σ = 40 segundos.a) ¿Qué porcentaje de estas llamadas duró menos de 180 segundos?b) ¿Cuál es la probabilidad de que cierta llamada dure entre 180 y 300

segundos?c) ¿Cuántas llamadas duraron menos de 180 segundos o más de 300

segundos?d) ¿Qué porcentaje de estas llamadas duró entre 110 y 180 segundos?e) ¿Cuál es la duración de una llamada en particular si solo 1% de las

llamadas son más breves?

26.- Un contratista afirma que puede renovar una cocina y un comedor de 200 pies cuadrados en 40 horas, más o menos 5 horas (media y desviación estándar respectivas). El trabajo incluye plomería, instalación electrónica, gabinetes, piso, pintura, e instalación de accesorios nuevos. Suponga por experiencia, que los tiempos para terminar proyectos semejantes tienen distribución normal con medida y desviación estándar como las que se indican.a) ¿Cuál es la probabilidad de que el proyecto termine en menos de 53 horas?b) ¿Cuál es la probabilidad de que el proyecto termine de 28 a 32 horas?c) ¿Cuál es la probabilidad de que el proyecto termine de 35 a 48 horas?d) ¿Cuántas horas adicionales requieren el 10% de estos proyectos?

27.- Los salarios de los trabajadores en cierta industria son un promedio 11.90 dólares por hora, y la desviación estándar es 0.40 de dólar. Si se supone que los salarios tienen distribución normal.

a) ¿Qué porcentaje de trabajadores recibe salarios entre 10.90 y 11.90 dólares?

b) ¿Qué porcentaje de trabajadores recibe salarios entre 10.80 y 12.40 dólares?

c) ¿Qué porcentaje de trabajadores recibe salarios entre 12.20 y 13.10 dólares?

d) ¿Qué porcentaje de trabajadores recibe salarios inferiores a los 11.00 dólares?

e) ¿Qué porcentaje de trabajadores recibe salarios superiores a 12.95 dólares?

f) ¿Qué porcentaje de trabajadores recibe salarios inferiores a 11.00 o superiores a 12.95 dólares?

g) ¿Cuál debe ser el salario si sólo 10% de los trabajadores de esta industria ganan más?

h) ¿Cuál debe ser el salario si 25% de los trabajadores de esta industria gana menos?

28.-La máquina de coser industrial utiliza cojines cuyos baleros deben tener un

diámetro de 0.75 pulgadas. Los límites de especificación para que los cojines funcionen son de 0.74 pulgadas (inferior) y 0.76 pulgadas (superior). La

68

Page 24: Six Sigma Estadistica Descriptiva

experiencia indica que el diámetro real de los cojines sigue mas o menos una distribución normal con medida de 0.753 pulgadas y desviación estándar de 0.004 pulgadas. ¿Cuál es la probabilidad de que un cojinete esté:a) Entre lo programado y medida real?b) Entre el límite bajo de la especificación y lo programado?c) Arriba del límite superior de la especificación?d) Abajo del límite inferior de la especificación?e) ¿Arriba de que valor del diámetro entra 93% de los cojinetes de Valero?

29.- Suponga se ha encontrado que el nivel de llenado de unas botellas de refrescos tiene una distribución normal con medida de 2.0 litros y desviación estándar de 0.05 litros. Las botellas que contienen menos del 95% del contenido neto anunciado (1.90 litros en este caso) pueden causar una multa al fabricante por parte de la oficina estatal de protección al consumidor, mientras que las botellas que tienen un contenido neto mayor que 2.10 litros pueden provocar un derrame del exceso al abrirlas.a) ¿Qué proporción de botella contendrá…..

1) Entre 1.90 y 2.0 litros?2) Entre 1.90 y 2.10 litros?3) Menos de 1.90 litros?4) Menos de 1.90 litros o mas de 2.10 litros?5) Mas de 2.10 litros?6) Entre 2.05 y 2.10 litros?

b) ¿Qué cantidad mínima de refresco se espera que contenga 99% de la botella?

c) Suponga que en un esfuerzo por reducir el número de botellas que contienen menos de 1.90 litros, el embotellador arregla la máquina de llenado de manera que la medida sea de 2.02 litros. En estas circunstancias, ¿Cuáles serían sus respuestas a las preguntas de los incisos (a) y (b)?

30.- Una oficina de gobierno de la ciudad que procesa permisos para remodelación de edificios tiene una política que indica que el permiso se entregara sin costo si no esta listo al final de 5 días hábiles, a partir de la fecha de solicitud. Se mide el tiempo de procesamiento a partir del momento que recibe la solicitud (me marca el tiempo en la solicitud) hasta completar el procesamiento. Suponga que los tiempos tienen distribución normal.a) Si el proceso tiene una medida de 3 días y una desviación estándar de 1

día, ¿Qué proporción de los permisos será gratis?69

Page 25: Six Sigma Estadistica Descriptiva

b) Si el proceso tiene una medida de 2 días y una desviación estándar de 1.5 días, ¿Qué proporción de servicios será gratis?

c) ¿En cual de los procesos, (a) o (b) resultarán más permisos gratis? Explique.

d) Para el proceso descrito en el inciso (a), ¿Será mejor reducir el promedio a 2 días o la desviación estándar a 0.75 días? Explique.

31.- La duración de cierto tipo de pila sigue una distribución normal con µ = 100 horas y σ = 20 horas.a) ¿Qué proporción de las pilas durará entre 100 y 115 horas?b) ¿Qué proporción de las pilas durará más de 90 horas?c) ¿Cuál será la duración mínima de 90% de las pilas?

32.- Un productor de jugo de naranja compra todas sus naranjas en una tienda. La cantidad de jugo con una medida de 4.70 onzas y una desviación estándar de 0.40 onzas.a) ¿Cuál es la probabilidad de que una naranja seleccionada al azar contenga

entre 4.70 y 5.00 onzas de jugo?b) ¿Cuál es la probabilidad de que una naranja seleccionada al azar contenga

entre 5.00 y 5.50 onzas de jugo?c) ¿Cuál será la mínima cantidad de jugo de 77% de las naranjas?

33.- Suponga que el gobernador piensa que un programa estatal de lotería de fútbol propuesto, aportará en promedio una ganancia semanal de 10.0 millones de dólares (que se asignarán para programas educativos) con una desviación estándar de 2.5 millones de dólares. Suponga además que las ganancias semanales tienen una distribución normal (aproximada). Las preguntas que siguen podrían surgir en la próxima conferencia de prensa del gobernador.a) ¿Cuál es la probabilidad de que, en cualquier semana dada, las ganancias

esten:1) Entre 10.0 y 12.5 millones de dólares?2) Entre 7.5 y 10.0 millones de dólares?3) Entre 7.5 y 12.5 millones de dólares?4) Arriba de 7.5 millones de dólares?5) Debajo de de 7.5 millones de dólares?6) Entre 12.5 y 14.3 millones de dólares?

34.- Se espera que el diámetro de las pelotas de pin – pon fabricadas en una planta grande tenga una distribución normal aproximada con medida de 1.30 pulgadas y desviación estándar de 0.04 pulgadas. ¿Cuál es la probabilidad de que una pelota seleccionada al azar tenga un diámetro:

a) Entre 1.28 y 1.30 pulgadas?b) Entre 1.31 y 1.33 pulgadas?

70

Page 26: Six Sigma Estadistica Descriptiva

c) ¿Entre qué dos valores (simétricos respecto a la medida) estará el 60% de las pelotas de pin – pon (en términos de diámetro)?

35.- Se fabrican bolsa de plástico para empacar verduras de manera que la resistencia a roturas tenga una distribución normal con medida de 5 libras por pulgada cuadrada y desviación estándar 1.5 libras por pulgada cuadrada. Si se selecciona una muestra de 25 bolsas?

a) ¿Cuál es la probabilidad de que la resistencia promedio…1) Esté entre 5 y 5.5 libras por pulgada cuadrada?2) Esté entre 4.2 y 4.5 libras por pulgada cuadrada?3) Sea menor que 4.6 libras por pulgada cuadrada?b) ¿Entre qué dos valores simétricos respecto ala medida estará el 95% de las

resistencias promedio?c) ¿Cuáles serían las respuestas a los incisos (a) y (b) si la desviación

estándar fuera 1.0 libra por pulgada cuadrada?

71