Six Sigma a Descriptiva

Embed Size (px)

Citation preview

ESTADSTICAPara la gente comn, la estadstica significativa nmeros. En el peridico de la maana se pueden encontrar las estadsticas ms recientes sobre los delitos de la ciudad: nmero de asesinatos, de robos de automviles, de asaltos y dems delitos que hayan sido denunciados en determinado perodo de tiempo; o las ms recientes estadsticas acerca de la mano de obra en el pas: por ejemplo el nmero de desempleados; o las ultimas estadsticas sobre el nmero de nacimientos y de muertes que han ocurrido durante cierto perodo de tiempo; o, en relacin con el deporte, el nmero de partidos ganados y perdidos por los equipos favoritos de la localidad. Aunque estos ejemplos realmente forman parte del concepto total de estadstica, la palabra tiene un sentido ms amplio para aquellas personas cuyo trabajo requiere un conocimiento (s bien a veces mnimo) de los aspectos ms tcnicos de la estadstica. Para estas personas la palabra estadstica, tiene relacin con aquellos conceptos y tcnicas que se emplean en la recopilacin, organizacin, resumen, anlisis, interpretacin y comunicacin de informacin numrica. Naturalmente, dichos conceptos y tcnicas juegan un papel importante en las actividades que cumplen los profesionales de todas las ciencias. Generalmente se disea una serie de trabajos estadsticos para alcanzar uno de los dos siguientes objetivos, o ambos: 1. Describir cuantitativamente una serie de personas, lugares o cosas. 2. Dar informacin de la que se puede sacar conclusiones acerca de un grupo grande de personas, lugares o cosas, por medio de la observacin de solo una pequea parte del conjunto total. Las actividades estadsticas encaminadas a lograr la primera meta se denominan estadstica descriptiva y las que tiene por objeto alcanzar la segunda se llama estadstica inferencial.

46

POR QU UN ADMINISTRADOR NECESITA CONOCER ESTADSTICA? Hace un siglo H.G. Wells coment Algn da el pensamiento estadstico ser tan necesario como la habilidad para leer y escribir. Al comienzo del nuevo milenio, el problema que enfrentan los gerentes no es la escasez de informacin, sino como utilizar la informacin disponible para tomar las decisiones ms adecuadas. Desde la perspectiva de una toma de decisiones informada, cabe preguntar por qu un administrador necesita saber estadstica. Los administradores deben comprender la estadstica por cuatro razones fundamentales: 1.- Para saber como presentar y describir la informacin en forma adecuada. 2.- Para saber como obtener conclusiones sobre poblaciones grandes basndose solamente en la informacin obtenida de las muestras. 3.- Para saber como mejorar los procesos 4.- Para saber como obtener pronsticos confiables. Introduccin y recopilacin de datos, tablas y graficas. Estadstica descriptiva.

1

2

Probabilidad bsica y distribuciones de probabilidad. Estadstica Inferencial.

3

Aplicaciones Estadsticas en la administracin de la calidad y productividad

4

Modelos de Regresin lineal simple y mltiple Correlacin.

47

AREAS DE APLICACIN DE LA METODOLOGIA ESTADISTICA.Ya hemos observado que los conceptos y la metodologa de la estadstica se emplean en muchos campos. A continuacin mencionaremos algunas reas solamente en donde ella se utiliza. Agricultura. Las tcnicas estadsticas se emplean en actividades tales como experimentos sobre la reproduccin de plantas y animales, estudios de la bondad relativa de diversos fertilizantes, insecticidas, etc. y estudios de mtodos para aumentar el rendimiento de las cosechas. Biologa. En biologa se emplean los mtodos estadsticos para estudiar las reacciones de las plantas y los animales ante diferentes presiones ambientales y para investigar la herencia. Negocios. Utilizando la estadstica, los hombres de negocios pueden predecir los volmenes de ventas, medir las reacciones de los consumidores ante los nuevos productos, tomar decisiones en cuanto a la forma de invertir el presupuesto para publicidad y determinar el mejor mtodo para utilizar las habilidades y aptitudes de sus empleados. Salud y medicina. Los resultados que obtienen en las investigaciones sobre frmacos se analizan por medio de los mtodos estadsticos. Los tcnicos de la salud la utilizan para planear la localizacin y el tamao de los hospitales y de otras dependencias de salud. Los mdicos investigadores se ayudan del anlisis estadstico para evaluar la efectividad de diversos tratamientos. Industria. La mayor parte de los industriales utilizan algn control de calidad y los conceptos y tcnicas estadsticas constituyen la base de casi todos estos programas. Psicologa. Los psiclogos se valen de los conceptos y tcnicas y las estadsticas para medir y comparar la conducta, las actitudes, la inteligencia y las aptitudes de hombre. Sociologa. En la sociologa las tcnicas estadsticas se emplean en los estudios comparativos de diferentes grupos socioeconmicos y culturales y en el estudio del comportamiento y las actitudes del grupo.

48

TERMINOLOGIA ESTADISTICADaremos solamente el vocabulario estadstico bsico de esta seccin pues los dems trminos se definirn a medida que se vayan presentando. Entidad. En el anlisis estadstico se concentra la atencin en un conjunto de personas, lugares o cosas. Un bilogo puede estar interesado en las ardillas que habitan determinada regin. Un mdico puede interesarse por los pacientes que muestren determinada serie de sntomas. Un educador puede demostrar inters por aquellos estudiantes que han aprendido a leer empleando determinado mtodo. Aun investigador agrcola le llamar la atencin cierta variedad de trigo. Aun meteorlogo le interesarn las precipitaciones que ocurren en ciertas regiones. Vamos a utilizar la palabra entidad como trmino general para referirnos a un miembro individual de un grupo de personas, lugares o cosas. Variable. Es el conjunto de caractersticas de las entidades que interesan en una investigacin cientfica. El mdico puede querer investigar el nivel de colesterol de ciertos pacientes. Al educador le puede llamar la atencin el rendimiento en la lectura de los estudiantes que han aprendido a leer con un mtodo determinado. El investigador agrcola puede estar interesado en conocer la resistencia a una variedad de trigo ha cierta enfermedad. Al meteorlogo le puede llamar la atencin la nieve como una proporcin de la precipitacin total. En virtud de que cualquiera de estas caractersticas, por regla general, presenta un valor diferente cuando se observa ha diferentes entidades, ella recibe el nombre de variable. Adems de las variables ya mencionadas, inmediatamente vienen a la mente otras, tales como la estatura de el hombre, la vida de la llantas de automvil, el color de la piel de los perros y el nmero de zurdos en una escuela. Variable aleatoria. Si los valores numricos que toman una variable provienen de factores fortuitos y si un determinado valor no se puede predecir exactamente con anticipacin, esa variable se denomina variable aleatoria. Para presentar las variables aleatorias utilizamos letras maysculas como X,Y y Z. De esta manera, podemos referirnos a la variable aleatoria edad como X o a la variable aleatoria estatura como Y. Los valores individuales de una variable aleatoria se representan con letras minsculas tales como x, y, y z. Si por ejemplo, la variable aleatoria X tiene 6 valores, nos referimos a estos valores como x1, x2, x3, x4, x5, y x6. Los subndices servirn para distinguir un valor de la variable aleatoria de otro. Fuera de esto, las variables se pueden clasificar segn sean continuas o discretas o segn sean cuantitativas o cualitativas.

49

Variable contina. Una variable continua es aquella que tericamente puede tomar cualquier valor dentro de un intervalo de valores. Es decir, una variable continua se mide uniformemente. Otra manera de explicar lo que es una variable continua consiste en decir que, sin importar que tan cerca puedan estar dos valores de una variable, es posible tericamente hallar otra variable cuyo valor se pueda colocar entre ellos. Un ejemplo de variable continua es la estatura humana sin tener en cuenta qu tan prxima sea la estatura de dos personas, es posible tericamente encontrar otra persona que sea ms alta que la ms baja y a la vez ms baja que la mas alta de las dos. Nuestra posibilidad de identificar a tal persona en la prctica puede dificultarse por las limitaciones de los instrumentos de medidas disponibles. Otras variables continuas pueden ser aquellas que se miden con una escala de peso, tiempo o temperatura. Variable discreta. Cuando los valores que puede tomar una variable que est separado entre s por una determinada cantidad, la variable se denomina variable discreta. Una caracterstica de la variable discreta es la presencia de vacos o interrupciones entre los valores que puede tomar. Como ejemplo de variables discreta puede citarse, el nmero de administraciones en un hospital durante un da determinado, el nmero de accidentes automovilsticos que se producen dentro de los limites de una ciudad durante un mes, el nmero de colonias de bacterias en una placa de agar y el nmero de estudiantes de primer ao en un sistema escolar determinado. Variable cuantitativa. Se dice que una variable es una variable cuantitativa siempre que los valores que puede asumir sean los resultados de medidas numricas. Ejemplos de variable cuantitativas son la estatura, el peso, la temperatura, el cociente de inteligencia (CI) la presin sangunea, el nmero de estudiantes de primer ao y el numero de accidentes que se producen en alguna regin geogrfica en un perodo de tiempo dado. Variable cualitativa. Hay muchos casos en que no es posible hacer medidas numricas. Muchas variables son susceptibles solamente de clasificacin. Por ejemplo, la variable estado civil puede recibir los valores cualitativos de soltero, casado, divorciado, viudo y, tal ves, todo los dems. Si las entidades de inters son estudiantes universitarios y si la variable de inters es curso la variable puede asumir los valores cualitativos de primero, segundo, tercero, etc. Una variable cuyos valores consisten en categoras de calificacin se denomina variable cualitativa. Como la determinacin del valor de una variable cuantitativa se lleva a cabo por medio de algn procedimiento de medicin, el resultado se denomina medida. Un grupo de tales medidas recibe el nombre datos de medida. Cuando las entidades se clasifican teniendo en cuenta una variable cuantitativa, generalmente es necesario contar el nmero de entidades que se pueden clasificar en cada una de las categoras. La informacin de este tipo se denomina datos de conteo. Frecuentemente se usa la palabra observacin para hacer referencia a un dato de medida o de conteo. 50

Poblacin. el concepto que tiene la gente comn de poblacin, es el que se relaciona con un conjunto de personas, como la poblacin de una ciudad, un estado o una nacin aunque a veces vamos a emplear este trmino para referirnos a un conjunto de entidades, lo utilizaremos con ms frecuencia para hacer referencia a un conjunto de valores de alguna variable aleatoria relacionada con un conjunto de entidades. Por ejemplo, podemos hablar de una poblacin de pesos, una poblacin de puntajes de pruebas o una poblacin de niveles de colesterol. Podemos entonces definir poblacin como el conjunto ms grande de valores (de una variable), por el cual existe algn inters. Esta definicin indica que las poblaciones son definidas por el investigador y no estn predeterminadas por algn proceso que exceda el control que este tenga. Supongamos a manera de ejemplo que estamos interesados en los puntajes de rendimiento en la lectura de todos los alumnos del nivel primario de un sistema escolar. La poblacin esta compuesta entonces por todos estos puntajes de rendimiento en la lectura. Pero si solamente estamos interesados en los puntajes de los alumnos de quinto grado, tenemos una poblacin totalmente distinta. Al definir nuestra esfera de inters definimos nuestra poblacin. Las poblaciones pueden ser finitas o infinitas. Si en realidad nuestro inters se limita a los puntajes de los estudiantes de algn sistema escolar en un determinado momento, estamos definiendo una poblacin finita. Pero si lo que nos interesa son los puntajes de todos los estudiantes de la escuela primaria en el pasado, presente y futuro, la poblacin es infinita para cualquier pronstico prctico. Muestra. Una muestra es una parte de una poblacin. el tamao completo de una poblacin aun siendo finita, puede desanimarnos al intentar investigarla en su totalidad. Puede ser necesario o conveniente examinar solo una fraccin (muestra) de la poblacin. a pesar de lo que ya hemos definido la inferencia estadstica en trminos generales, podemos ahora ser ms especficos y decir que la inferencia estadstica es el procedimiento por el cual se tienen conclusiones a cerca de una poblacin a partir de la informacin que se tiene de una muestra de esa poblacin.

51

IMPORTANCIA DEL MANEJO DE DATOSLa manera como normalmente conocemos la realidad consiste en observarla, obteniendo de nuestras observaciones el mayor nmero posible de datos. En esta forma podemos predecir que suceder en casos semejantes y como ser el futuro comportamiento del proceso o de la realidad que hemos observado. Ms no siempre nos es posible conocer todos los datos. Podemos ciertamente saber cuntas toneladas de grano se producen en una determinada hectrea de tierra. Pero sera demasiado difcil y costoso averiguar este dato en todas y cada una de las reas sembradas con este grano. Podemos saber la medida exacta de un determinado grupo de tornillos producidos en un mismo da a determinada hora; pero sera tarea casi imposible medir todos los tornillos producidos por esa fbrica durante todos los das del ao. Debido a esto se ha optado por trabajar con unos cuantos datos, seleccionados cientficamente, para inferir, a partir de ellos, un comportamiento general. En esta forma de proceder se basa gran parte de nuestros conocimientos. La necesidad de seleccionar unos cuantos datos y de operar mediante el conocimiento obtenido a travs de ellos se deja sentir, sobre todo en el terreno de actividad producida del hombre. No es posible saber con toda exactitud la cantidad de divisas extranjeras que ingresan por el turismo. Sin embargo, es muy importante para la vida econmica saber este dato aunque sea en forma aproximada. Por eso, para evaluar el ingreso que deja el turismo, se calcula al gasto que hace en promedio un visitante y se multiplica este dato por el nmero de turistas que han ingresado en una determinada poca. Toda empresa saca muestras de las entregas de materia prima que recibe para ver si las piezas que compra responden a las especificaciones que ella a establecido a sus proveedores. Como gran parte del conocimiento de actividad productiva se basa en los datos y puesto que no es posible conocerlos todos; por eso, cada da cobra mayor importancia el estudio de una ciencia que nos ensea a inferir a partir de unos cuantos datos. Esta ciencia es la estadstica. 52

QUE ES ESTADISTICA CONCEPTOS FUNDAMENTALESTodos tenemos una idea general de lo que es la estadstica, pues utilizamos una forma espontnea sus procedimientos. Constantemente tomamos muestras para ver la calidad de un producto que vamos a comprar; como tambin hablamos con mucha frecuencia de promedios, por ejemplo, con respecto a nuestro gasto mensual de gasolina. La estadstica es la ciencia que se ocupa de recopilar, organizar, representar, analizar, extraer y generalizar la informacin contenida en un conjunto de datos. Llamamos poblacin estadstica al conjunto de todos los datos sobre los que versan las actividades de recopilacin, organizacin, etc., que acabamos de mencionar. Si se tienen 1500 mangueras de gasolina, cuyos dimetros miden entre 14.2 y 15.2 milmetros, la poblacin estadstica esta formada por estos 1500 datos. Si examinamos 550 monoblocks y vemos que el espesor de las paredes oscila entre 3.24 y 3.64 cms., Estos 550 datos integran la poblacin estadstica. En un da determinado se elaboran 750 artculos que se etiquetaron con bueno o defectuoso segn que cumplieron, o no, las especificaciones establecidas. La poblacin estadstica abarca 750 descripciones. Dado que en la mayora de los casos resulta poco prctico o incosteable analizar la totalidad de los elementos de los que se compone la poblacin estadstica, se ha optado por seleccionar unos cuantos de stos para su estudio. Los elementos seleccionados se denominan muestra. Una muestra, pues, est constituida por algunos elementos de la poblacin estadstica. Para que podamos estudiar la poblacin estadstica a travs de muestras, es necesario que estas sean respectivas de aquella. Cuando todos los elementos de la poblacin estadstica tienen la misma posibilidad de ser seleccionados y en esas circunstancias se obtienen una muestra, esta se llama muestra representativa. La muestra representativa se llama tambin muestra aleatoria. Una empresa va a invertir una fuerte cantidad de dinero en el bienestar de los trabajadores. Supongamos que, para decidir si el dinero se invierte en deportes o en el teatro de la empresa, se toma una muestra de entre los miembros de los equipos de ftbol y bisbol; es claro entonces que esta muestra no es representativa.

53

Tampoco son muestras representativas de la produccin de una maquina las piezas tomadas al inicio del funcionamiento de dicha mquina cuando, por naturaleza del proceso, las primeras piezas producidas son en su mayora defectuosas. La estadstica descriptiva es la parte de la estadstica que versa sobre la recoleccin, organizacin y anlisis de datos. La estadstica inductiva o inferencial es la parte de la estadstica que hace inferencias o generalizaciones con base en los resultados de las muestras representativas. Hacemos inferencias o generalizaciones a partir de las muestras de una poblacin, cuando suponemos que las situaciones que hemos observado en las muestras aparecen en toda la poblacin. Estas situaciones pueden ser el grado de variacin de los datos, el que gran cantidad de los productos este dentro o fuera de la especificaciones, el que todos los datos se encuentren alrededor de un valor determinado, y observaciones de este tipo.

OBSERVACIONES A TENER EN CUENTA EN LA RECOLECCIN DE DATOSUn buen estudio estadstico comienza con una recoleccin de datos hecha en forma correcta. Esto requiere tomar ciertas precauciones. A continuacin enumeramos algunas de ellas: a) Los valores que se registran deben corresponder realmente a lo que hemos observado. Es necesario registrar fielmente los datos. b) Si los datos son continuos, es muy importante efectuar la medicin con la mayor precisin posible, esto es, con el menor error posible. c) Se debe cuidar que los instrumentos de medicin estn bien calibrados. d) Se deben usar adecuadamente los instrumentos de medicin. Si hay errores en la obtencin de datos, las conclusiones no sern objetivas a pesar de tener muestras representativas y realizar un buen estudio estadstico

54

LA ORGANIZACIN DE DATOS EN TABLA DE FRECUENCIAPara poder analizar los datos, obtener la informacin que deseamos a partir de ellos, necesitamos ordenarlos. Los datos en desorden no nos dicen nada. La forma comn de ordenarlos consiste en construir con ellos la llamada tabla de frecuencia. Esta tabla consiste bsicamente en organizar los datos por grupos, a fin de poder ver. Que datos representan los valores ms bajos, y cuales los mas altos. Y con que frecuencia.

Procedimiento para elaborar la tabla de frecuencia. Paso 1: Obtencin de rango (R) Se entiende por rango (R) la diferencia que existe entre el dato mayor (VM) y el menor (Vm) de un conjunto de datos. Paso 2: Determinacin del nmero de clases (K) en las que se van agrupar los datos. Se llama clase a cada uno de los subconjuntos en los que se agrupan los datos. Para determinar en cuantas clases (K) conviene agrupar los datos, se acostumbra tomar en cuenta la siguiente norma: Cantidad de datos (N) Menos de 50 50 a 100 100 a 250 mas de 250 Cantidad de clases (K) 5a7 6 a 10 7 a 12 10 a 20

Paso 3: Determinacin de la amplitud (A) de las clases. Establecido el nmero de clases en que van a quedar agrupados los datos, se determina dentro de que amplitud se escogern los datos para cada clase. Esto se lleva a cabo, primero, dividiendo el rango (R) obteniendo del conjunto de datos entre el nmero establecido de clase. A=R K 55

Paso 4: Determinacin de las fronteras o limites de cada clase. Con este resultado (A) pasamos enseguida, a establecer las fronteras inferior (Ll) y superior (Ls) de cada clase La frontera inferior de la primera clase se establece restando la mitad de una unidad (u) al dato menor de todo el conjunto. Cuando se trabaja con nmeros enteros, la unidad (u) equivale a 1. Cuando se trabaja con nmeros fraccionarios la unidad (u) es de La misma clase que las unidades fraccionarias que se manejan. As, si se trabaja con dcimas la unidad es una dcima (0.1); Si con centsimas, la unidad es una centsima (0.01); Si con milsimas la unidad es una milsima (0.001). etc. Frontera Inferior:

L l de X* = Vm (u)

Frontera superior:

LS de X* = (Vm - (u)) + APaso 5: Identificacin del valor medio de cada clase; valor que es llamado marca de clase (Xi). Para encontrar la marca de clases, se suma la frontera inferior con la frontera superior de dicha clase, dividiendo despus el resultado entre 2. Tambin se dice que la marca de clase o punto medio es la semisuma de sus fronteras.

Xi = Ll + Ls 2

56

Paso 6: Conteo de datos que pertenecen a cada clase. Establecidos los lmites inferior y superior de cada clase, se cuentan los datos que caen dentro de cada una de las clases establecidas.

Paso 7: Elaboracin de la tabla de frecuencias Puesto que ya tenemos la amplitud de cada clase, el nmero de datos que pertenece a cada una de las clases y la marca de clase, podemos entonces pasar a elaborar la tabla de frecuencias.

Paso 7: Indicar las suma de datos que va resultando de sumar la cifras de una clase con las cifras de las clases anteriores (frecuencias absolutas ) fi Paso 8: Indicar el porcentaje que va resultando al sumar el porcentaje de una clase con el porcentaje de las clases anteriores (frecuencias relativas ) hi Paso 9: Adicin de la columna de frecuencias absolutas acumuladas (Fi). En esta columna se indica el resultado de sumar las frecuencias de cada clase (fi) con las frecuencias de las clases anteriores. Paso 10: Adicin a las frecuencias relativas acumuladas (Hi).

En esta columna se indica el resultado de sumar el porcentaje (hi) de una clase con el porcentaje de las clases anteriores. Realizar el siguiente ejemplo. Se desea analizar el tiempo de vida de los focos de las seales direccionales para autos. Para ello, se procede a obtener una muestra de 30 focos registrando el nmero de horas que duran encendidos. Los resultados obtenidos se recogen por hileras y por columnas en la siguiente forma.

237 290 315 284 261

180 234 248 292 374

285 271 320 192 228

225 295 255 318 358

288 247 305 268 210

232 338 274 279 24457

EJERCICIOS 1.- Los datos que se muestran a continuacin representan el costo de la energa elctrica durante el mes de julio del 2006 para una muestra aleatoria de 50 departamentos con dos recamaras en una ciudad grande. Costo de energa elctrica en dlares. 96 157 141 95 108 171 185 149 163 119 202 90 206 150 183 178 116 175 154 15 147 172 123 130 114 102 111 128 143 135 153 148 144 187 191 197 213 168 166 137 127 130 109 139 129 82 165 167 149 158

a) Determine una tabla de frecuencias y obtenga conclusiones. b) Alrededor de que cantidad parece concentrarse el costo mensual de energa elctrica. 2.- Con base en los datos de las tablas siguientes, correspondientes a la vida til en horas de una muestra de 40 focos de 100 watts, producidos por el fabricante A y otra muestra de 40 focos de 100 watts, producidos por el fabricante B. Elabore una tabla de frecuencias para cada fabricante y obtenga conclusiones. Fabricante A 684 831 859 893 922 939 972 1016 697 835 860 899 924 943 977 1041 720 848 868 905 926 946 984 1052 773 852 870 909 926 954 1005 1080 821 852 876 911 938 971 1014 1093 819 907 952 994 1016 1038 1096 1153 836 912 959 1004 1018 1072 1100 1154 Fabricante B 888 918 962 1005 1020 1077 1113 1174 897 942 986 1007 1022 1077 1113 1188 903 943 992 1015 1034 1082 1116 1230

58

MEDIDAS DE TENDENCIA CENTRAL MEDIA ARITMETICA O PROMEDIO (X)Representa la suma de las observaciones, dividida entre el nmero total de datos que hay en la serie o conjunto de ellos.

X1 + X2 + X3 +..........+ Xn X= n MEDIANA X La mediana es otra medida de tendencia central que puede encontrarse arreglando una serie de medidas o datos en forma ascendente o descendente y localizndose al centro. Es decir: si el numero de observaciones es non, habr que localizar las dos observaciones del centro, sumarlas y entonces dividir esa suma entre dos y esa ser la mediana. o

LA MODA XLa moda es el valor que ms frecuentemente ocurre en una serie de observaciones.

MEDIDAS DE DISPERSINPara tener una idea exacta de la forma como se relacionan entre s los datos de un conjunto, no es suficiente identificar su tendencia central; es necesario, adems, examinar qu tanto difieren entre s, esto es, que grado de dispersin existe entre ellos. las ms usuales son el Rango y la desviacin estndar.

RANGO REl rango, amplitud u horquilla es la medida de dispersin que se define como la diferencia entre el mayor y el menor de los valores o lecturas de una serie de datos. LA VARIANZA Y LA DESVIACIN ESTNDAR La varianza es la medida de dispersin que proporciona el promedio de desviacin de un conjunto de datos con respecto a su valor central. El valor central es generalmente su media. La formula mediante la cual se obtiene la varianza es la siguiente. 2 2 2 (X1-X) + (X2 X ) + ........... + (Xn X ) S2 = n 59

LA DISTRIBUCIN NORMALSupongamos que a partir de una serie de datos, construimos un histograma. Si a continuacin incrementamos el nmero de datos y al mismo tiempo disminuimos la longitud de los intervalos, obtendremos, en el lmite, una curva suavizada: la curva de la distribucin de frecuencias de la poblacin de donde provienen esos datos. Hay muchos tipos de curvas de distribucin de frecuencia. La ms tpica es la curva de distribucin normal. Esta curva se estudi por primera vez en el siglo XVIII, cuando se observ que los patrones que se presentaban al medir errores seguan una distribucin simtrica y en forma de campana. En el ao de 1733, De Moivre la obtuvo en forma matemtica, como la forma limite de la distribucin binomial. Un error en la historia atribuye a Karl Gauss el descubrimiento de esta distribucin, por lo que frecuentemente se le refiere como distribucin de Gauss (o Gaussiana). Ms adelante, en los siglos XVIII y XIX, se hicieron intentos para tratar de establecer esta distribucin como la base de todas las variables aleatorias continuas, por lo que se empez a utilizar el trmino normal. IMPORTANCIA DE LA DISTRIBUCIN NORMAL. I) Cuando la variacin es una caracterstica de la calidad, se puede considerar que se debe a un nmero muy grande de errores infinitesimales independientes, atribuibles a diferentes factores, la distribucin de dicha caracterstica en la mayora de los casos es normal. II) La distribucin de muchos estadsticos (como la media muestral) es aproximadamente normal, independientemente de la distribucin de donde provienen las observaciones (Cuando se toman muestras grandes) III) La distribucin normal es una excelente aproximacin a muchas otras distribuciones probabilsticas. CARACTERSTICAS DE LA CURVA NORMAL. 1) Simetra respecto a su media 2) Forma acampanada ( la frecuencia toma su valor mximo en el centro y disminuye conforme los valores de la variable se alejan hacia las colas ) La curva normal se expresa matemticamente como 1 f(x) = -1/2 X-2

e

60

2

Grficamente sera:

X

Podemos observar, a partir de la ecuacin anterior, que se incluyen dos parmetros: y . Estos dos parmetros determinan una curva normal. Si X es una variable aleatoria con distribucin normal, media y desviacin estndar , utilizamos la notacin de X N ( , ) para hacer referencia a ello. El parmetro representa la posicin central de la distribucin (la media)

El parmetro representa la dispersin de la distribucin (la desviacin estndar), estos parmetros se pueden describir grficamente, como lo muestra la figura.

X

61

Es interesante comentar que dada una variable X N ( , ), la probabilidad de que observemos un valor de X entre + . Es aproximadamente 68.3 %, entre + 2 . 95.4% y entre + 3 ., 99.7% observamos lo anterior en la siguiente figura.

68.3 % 95.4 %

99.7%

X + . + 2 .

+ 3 .,

FORMULA A UTILIZAR SERIA:X -

62

EJERCICIOS DE DISTRIBUCIN NORMAL1.- Se observ en un largo periodo que la cantidad semanal gastada en el mantenimiento y en las reparaciones en cierta fbrica tiene aproximadamente una distribucin normal con una media de $ 400 y una desviacin estndar de $20, si el presupuesto para la prxima semana es de $450 Cul es la probabilidad de que los costos reales sean mayores que la cantidad presupuestada? 2.- En el ejercicio 1, de cunto tendr que ser el presupuesto para reparaciones semanales y mantenimiento, para que la cantidad presupuestada solamente se rebasara con una probabilidad de 0.1? 3.- Una empresa metalmecnica produce rodamientos con dimetros que tienen una distribucin normal con media de 3.0005 pulgadas y una desviacin estndar de 0.0010 pulgadas. Las especificaciones requieren que los dimetros estn en el intervalo 3.000 + 0.0020 pulgadas. Se rechazan los cojinetes que quedan fuera del intervalo y deben volverse a maquinar. Que fraccin de la produccin total ser rechazada? 4.- Los alambres que se utilizan en cierta computadora deben tener una resistencia entre 0.12 y 0.14 ohms. Las resistencias reales de los alambres producidos por la compaa A tienen una distribucin de probabilidad normal con media de 0.13 ohms y una desviacin estndar de 0.005 ohms. Cul es la probabilidad de que un alambre seleccionado al azar de la produccin de la compaa A satisfaga las especificaciones? 5.- Un mtodo para hacer predicciones econmicas es mediante una aproximacin por consenso. Se obtiene un pronstico de cada uno de un gran nmero de analistas; el promedio de estos pronsticos individuales es l pronstico general. Suponga que los pronsticos individuales de enero de 1985 con respecto a la tasa de inters mnima de todos los analistas econmicos tiene aproximadamente una distribucin normal con una media igual de 14 % y una desviacin estndar de 2.6 %, si se selecciona al azar a un solo analista de este grupo Cual es la probabilidad de que los pronsticos de la tasa de inters mnima del analista sea. a) mayor de 18 % b) menor de 16 %

63

6.- El dimetro de los pernos de una fbrica tiene una distribucin normal con una media de 950 milmetros y una desviacin estndar de 10 milmetros. a) Cual es la probabilidad de que un perno escogido al azar tenga un dimetro entre 947 y 958 milmetros. b) Cual es el valor apropiado de C tal que un perno escogido al azar tenga un dimetro menor que C con una probabilidad de 0.8531 7.- Se supone que los resultados de un examen tienen una distribucin normal con media de 74 y una desviacin de 5. a) Cual es la probabilidad de que una persona que presta el examen obtenga una calificacin mayor que 70. b) Suponga que los estudiantes que se encuentran en el 15 % de la parte superior de la distribucin se les asigne una calificacin de A. cual es la calificacin mnima que debe obtener un estudiante para tener una calificacin de A? c) Cual debe ser la mnima calificacin aprobatoria si el evaluador pretende que solamente el 30 % de los estudiantes apruebe? d) Calcular aproximadamente la porcin de los estudiantes que tienen calificaciones que exceden por lo menos en 3 puntos a la calificacin reprobatoria del 15 % ( de calificaciones inferiores.) 8.- Se puede ajustar una mquina de refrescos de tal manera que llene los vasos con un promedio onzas de vasos. Si el nmero de onzas por vaso tiene una distribucin normal con una desviacin estndar igual a 0.3 onzas, encuentre el valor de de tal manera que los vasos de 8 onzas solamente se derramaran el 2 % del tiempo. 9.- Una empresa ha encontrado que la duracin de sus llamadas telefnicas de larga distancia, tienen aproximadamente una distribucin normal, con media de 4 minutos y desviacin estndar de 1.5 minutos. a) En que proporcin las llamadas a larga distancia tienen una duracin de ms de 2.5 minutos, pero menor de 3.5 minutos. b) Que proporcin de llamadas se completa en 2 minutos o menos c) Una secretaria va hacer una llamada de larga distancia, cual es la probabilidad de que dure ms de 4.5 minutos. 10.- Un psiclogo descubre que sujetos normales completan una tarea determinada en un promedio de 10 minutos. El tiempo requerido para completar la tarea esta aproximadamente normalmente distribuido con una desviacin estndar de 3 minutos. Hallar lo siguiente: a) la proporcin de sujetos normales que completan la tarea en menos de cuatro minutos. b) La proporcin de sujetos que requieren mas de 5 minutos para completar la tarea. c) La probabilidad de que un sujeto normal, a quien se la haya asignado 64 la tarea, la complete en 3 minutos.

11.- Si los dimetros de las bolas de los cojinetes estn normalmente distribuidos con media de 0.6140 y desviacin estndar de 0.0025 pulgadas, determine el porcentaje de ellas con dimetros. a) entre 0.610 y 0.618 b) mayores que 0.617 c) menores que 0.608 12.- la nota media en un examen es de 72 y la desviacin estndar 9, el 10 % del curso recibir grado A Cual es la nota mnima para optar a l? 12.- El dimetro interno terminado de un aro de pistn est distribuido de manera normal con una media de 4.50 cm y una desviacin estndar de 0.005 cm. que probabilidad hay de obtener un dimetro que exceda de 4.51 cm.? 13.- Si X est distribuida de manera normal con media de 100 y una desviacin estndar de 18, calcule la probabilidad de que una observacin aleatoria quede dentro de : a) 115 y 140 b) 90 y 120 14.- Metales de Lago S.A. fabrica repuestos de pistones para varios tipos de motores a gasolina y diesel. Cada pistn debe cumplir ciertas tolerancias, pues de otro modo no opera normalmente cuando se coloca en el cilindro. El modelo 3475X est diseado para un carro de 4 cilindros, que requiere un dimetro del pistn de 4.2 + 0.05 pulgadas. Los tornos automticos de metales elaboran los pistones con un dimetro medio de 4.18 pulgadas y una desviacin estndar de 0.06 pulgadas cual es la probabilidad de que un pistn producido en el torno cumpla las especificaciones? 15.- Producciones Segura S.A. desarroll y patent recientemente un detector de humo ultrasensible para usarlo tanto en edificios residenciales como en comerciales. Cada vez que detecta algo de humo en el aire, se enciende una sirena. En una prueba realizada en una habitacin, los niveles de humo que activaron el detector promediaron 372 (ppm) con una desviacin estndar de 13 (ppm). Si un cigarrillo introduce 75 (ppm) a la atmsfera de la habitacin de prueba, cul es la probabilidad de que 5 personas fumando simultneamente accionen la alarma? 16.- Unos expertos agrcolas descubren que el rendimiento por acre de un determinado tipo de grano tiene una distribucin aproximadamente normal, con media y desviacin estndar de 40 y 10 toneladas de acre respectivamente. a) Que proporcin del rea en acres sembrados de este grano produce ms de 50 toneladas por acre b) Si se elige al azar un acre en la hacienda donde se siembra este grano, 65 cual es la probabilidad de que produzca menos de 15 toneladas?

17.- Los puntajes de una prueba de aptitud escolar estn normalmente distribuidos con una media de 600 y una varianza de 10,000. a) que proporcin de los encuestados tiene un puntaje por debajo de 300? b) una persona va a presentar la prueba. Que probabilidad tiene de obtener un puntaje de 850 o ms? c) Que proporcin de puntajes estar entre 450 y 700? 18.- En una poblacin determinada, la estructura de los adultos hombres esta ms o menos normalmente distribuida con media y desviacin estndar de 70 y 3 pulgadas respectivamente: a) Que proporcin de hombres tiene entre 75 y 73 pulgadas de altura? b) Se elige al azar un adulto en esa poblacin. Cual es la probabilidad de que tenga ms de 6 pies de altura? c) Que proporcin de adultos tiene menos de 5 pies y 8 pulgadas de altura? 19.- la longitud de los ptalos en una especie de flor esta normalmente distribuida con una media y desviacin estndar de 4 y 2 cm respectivamente. a) Que proporcin de ptalos tiene mas de 5 cm? b) Que proporcin tiene menos de 2.5 cm? 20.- La velocidad de los automviles al pasar por el punto de verificacin de una autopista esta ms o menos normalmente distribuida con una media de 45 MPH y una varianza de 35. a) Que proporcin de los automviles que pasan por el punto de verificacin viajan a mas de 50 mph ? b) que proporcin de automviles pasa por el punto de control a una velocidad de menos de 40 mph ? c) Suponga que la velocidad limite en el control es de 55 mph. Que proporcin de automviles exceden esta velocidad cuando pasan por el control? 21.- En un sector del pas los gastos semanales de una familia estn mas o menos normalmente distribuidos, con media y desviacin estndar de $60 y $15 respectivamente. a) hallar la proporcin de familias que gastan en alimentos mas de $80 por semana b) Hallar la proporcin que gastan menos de $50 por semana. 66

22.-Los gastos mensuales en alimentacin para familias de cuatro miembros en una ciudad grande son en promedio de 420 dlares con una desviacin estndar de 80 dlares. Suponga que los gastos mensuales por alimentacin se tienen distribucin normal. a) b) c) d) Qu porcentaje de estos gastos es menor a 350 dlares? Qu porcentaje de estos gastos esta entre 252 y 350 dlares? Qu porcentaje de estos gastos esta entre los 250 y 450 dlares? Qu porcentaje de estos gastos es menor que 250 o mayor que 450 dlares?

23.-La compaa de transportes de Toby determino que en un periodo de un ao la distancia recorrida por cada camin sigue una distribucin normal con una medida de 50 mil millas y desviacin estndar de 12 mil millas. a) Qu proporcin de camiones se puede esperar que recorra entre 34 y 50 mil millas al ao? b) Cul es la probabilidad de que un camin seleccionado al azar recorra entre 34 y 38 mil millas al ao? c) Qu porcentaje de camiones se puede esperar que recorra ya sea menos de 30 o ms de 60 mil de millas al ao? d) Cuntos de los 1000 camiones de la flota se espera que recorran entre 30 y 60 mil millas al ao? 24.- Se encontr que un conjunto de calificaciones de exmenes finales en un curso introductorio de estadstica tena distribucin normal con medida de 73 y desviacin estndar de 8. a) Cul es la probabilidad de obtener una calificacin no mayor de 91 en este examen? b) Qu porcentaje de estudiantes obtuvo una calificacin entre 65 y 89? c) Qu porcentaje de estudiantes obtuvo una calificacin entre 81 y 89? d) Cul fue la calificacin superior slo por el 5% de los estudiantes que hicieron el examen? 25.- Un anlisis estadstico de 1,000 llamadas de larga distancia realizadas en la oficinas principales de la Jonson & Shurgot Corporation Indica que la duracin de estas llamadas tiene distribucin normal con = 240 segundos y = 40 segundos. a) Qu porcentaje de estas llamadas dur menos de 180 segundos? b) Cul es la probabilidad de que cierta llamada dure entre 180 y 300 segundos? c) Cuntas llamadas duraron menos de 180 segundos o ms de 300 segundos? d) Qu porcentaje de estas llamadas dur entre 110 y 180 segundos? 67 e) Cul es la duracin de una llamada en particular si solo 1% de las llamadas son ms breves?

26.- Un contratista afirma que puede renovar una cocina y un comedor de 200 pies cuadrados en 40 horas, ms o menos 5 horas (media y desviacin estndar respectivas). El trabajo incluye plomera, instalacin electrnica, gabinetes, piso, pintura, e instalacin de accesorios nuevos. Suponga por experiencia, que los tiempos para terminar proyectos semejantes tienen distribucin normal con medida y desviacin estndar como las que se indican. a) Cul es la probabilidad de que el proyecto termine en menos de 53 horas? b) Cul es la probabilidad de que el proyecto termine de 28 a 32 horas? c) Cul es la probabilidad de que el proyecto termine de 35 a 48 horas? d) Cuntas horas adicionales requieren el 10% de estos proyectos? 27.- Los salarios de los trabajadores en cierta industria son un promedio 11.90 dlares por hora, y la desviacin estndar es 0.40 de dlar. Si se supone que los salarios tienen distribucin normal. a) Qu porcentaje de trabajadores recibe salarios entre 10.90 y 11.90 dlares? b) Qu porcentaje de trabajadores recibe salarios entre 10.80 y 12.40 dlares? c) Qu porcentaje de trabajadores recibe salarios entre 12.20 y 13.10 dlares? d) Qu porcentaje de trabajadores recibe salarios inferiores a los 11.00 dlares? e) Qu porcentaje de trabajadores recibe salarios superiores a 12.95 dlares? f) Qu porcentaje de trabajadores recibe salarios inferiores a 11.00 o superiores a 12.95 dlares? g) Cul debe ser el salario si slo 10% de los trabajadores de esta industria ganan ms? h) Cul debe ser el salario si 25% de los trabajadores de esta industria gana menos? 28.-La mquina de coser industrial utiliza cojines cuyos baleros deben tener un dimetro de 0.75 pulgadas. Los lmites de especificacin para que los cojines funcionen son de 0.74 pulgadas (inferior) y 0.76 pulgadas (superior). La experiencia indica que el dimetro real de los cojines sigue mas o menos una distribucin normal con medida de 0.753 pulgadas y desviacin estndar de 0.004 pulgadas. Cul es la probabilidad de que un cojinete est: a) Entre lo programado y medida real? b) Entre el lmite bajo de la especificacin y lo programado? c) Arriba del lmite superior de la especificacin? d) Abajo del lmite inferior de la especificacin? e) Arriba de que valor del dimetro entra 93% de los cojinetes de Valero? 68

29.- Suponga se ha encontrado que el nivel de llenado de unas botellas de refrescos tiene una distribucin normal con medida de 2.0 litros y desviacin estndar de 0.05 litros. Las botellas que contienen menos del 95% del contenido neto anunciado (1.90 litros en este caso) pueden causar una multa al fabricante por parte de la oficina estatal de proteccin al consumidor, mientras que las botellas que tienen un contenido neto mayor que 2.10 litros pueden provocar un derrame del exceso al abrirlas. a) Qu proporcin de botella contendr.. 1) 2) 3) 4) 5) 6) Entre 1.90 y 2.0 litros? Entre 1.90 y 2.10 litros? Menos de 1.90 litros? Menos de 1.90 litros o mas de 2.10 litros? Mas de 2.10 litros? Entre 2.05 y 2.10 litros?

b) Qu cantidad mnima de refresco se espera que contenga 99% de la botella? c) Suponga que en un esfuerzo por reducir el nmero de botellas que contienen menos de 1.90 litros, el embotellador arregla la mquina de llenado de manera que la medida sea de 2.02 litros. En estas circunstancias, Cules seran sus respuestas a las preguntas de los incisos (a) y (b)? 30.- Una oficina de gobierno de la ciudad que procesa permisos para remodelacin de edificios tiene una poltica que indica que el permiso se entregara sin costo si no esta listo al final de 5 das hbiles, a partir de la fecha de solicitud. Se mide el tiempo de procesamiento a partir del momento que recibe la solicitud (me marca el tiempo en la solicitud) hasta completar el procesamiento. Suponga que los tiempos tienen distribucin normal. a) Si el proceso tiene una medida de 3 das y una desviacin estndar de 1 da, Qu proporcin de los permisos ser gratis? b) Si el proceso tiene una medida de 2 das y una desviacin estndar de 1.5 das, Qu proporcin de servicios ser gratis? c) En cual de los procesos, (a) o (b) resultarn ms permisos gratis? Explique. d) Para el proceso descrito en el inciso (a), Ser mejor reducir el promedio a 2 das o la desviacin estndar a 0.75 das? Explique. 31.- La duracin de cierto tipo de pila sigue una distribucin normal con = 100 horas y = 20 horas. a) Qu proporcin de las pilas durar entre 100 y 115 horas? b) Qu proporcin de las pilas durar ms de 90 horas? c) Cul ser la duracin mnima de 90% de las pilas? 69

32.- Un productor de jugo de naranja compra todas sus naranjas en una tienda. La cantidad de jugo con una medida de 4.70 onzas y una desviacin estndar de 0.40 onzas. a) Cul es la probabilidad de que una naranja seleccionada al azar contenga entre 4.70 y 5.00 onzas de jugo? b) Cul es la probabilidad de que una naranja seleccionada al azar contenga entre 5.00 y 5.50 onzas de jugo? c) Cul ser la mnima cantidad de jugo de 77% de las naranjas? 33.- Suponga que el gobernador piensa que un programa estatal de lotera de ftbol propuesto, aportar en promedio una ganancia semanal de 10.0 millones de dlares (que se asignarn para programas educativos) con una desviacin estndar de 2.5 millones de dlares. Suponga adems que las ganancias semanales tienen una distribucin normal (aproximada). Las preguntas que siguen podran surgir en la prxima conferencia de prensa del gobernador. a) Cul es la probabilidad de que, en cualquier semana dada, las ganancias esten: 1) Entre 10.0 y 12.5 millones de dlares? 2) Entre 7.5 y 10.0 millones de dlares? 3) Entre 7.5 y 12.5 millones de dlares? 4) Arriba de 7.5 millones de dlares? 5) Debajo de de 7.5 millones de dlares? 6) Entre 12.5 y 14.3 millones de dlares? 34.- Se espera que el dimetro de las pelotas de pin pon fabricadas en una planta grande tenga una distribucin normal aproximada con medida de 1.30 pulgadas y desviacin estndar de 0.04 pulgadas. Cul es la probabilidad de que una pelota seleccionada al azar tenga un dimetro: a) Entre 1.28 y 1.30 pulgadas? b) Entre 1.31 y 1.33 pulgadas? c) Entre qu dos valores (simtricos respecto a la medida) estar el 60% de las pelotas de pin pon (en trminos de dimetro)? 35.- Se fabrican bolsa de plstico para empacar verduras de manera que la resistencia a roturas tenga una distribucin normal con medida de 5 libras por pulgada cuadrada y desviacin estndar 1.5 libras por pulgada cuadrada. Si se selecciona una muestra de 25 bolsas? a) 1) 2) 3) b) Cul es la probabilidad de que la resistencia promedio Est entre 5 y 5.5 libras por pulgada cuadrada? Est entre 4.2 y 4.5 libras por pulgada cuadrada? Sea menor que 4.6 libras por pulgada cuadrada? Entre qu dos valores simtricos respecto ala medida estar el 95% de las 70 resistencias promedio? c) Cules seran las respuestas a los incisos (a) y (b) si la desviacin estndar fuera 1.0 libra por pulgada cuadrada?

71