17

Click here to load reader

Capitulo 1

Embed Size (px)

Citation preview

Page 1: Capitulo 1

MODULO DE ESTADÍSTICA

LA INVESTIGACIÓN ESTADÍSTICA

1.1 DEFINICIÓN DE ESTADÍSTICA

Aunque difícil de lograr un consenso general sobre la definición de estadística, todos los

estadísticos están de acuerdo en clasificar la materia en dos grandes áreas; que son

Estadística descriptiva y Estadística Inferencia.

1.1.1 Estadística descriptiva

En los primeros tiempos de su desarrollo, el estudio de la estadística consistía de

técnicas para recolectar, organizar y presentar datos numéricos. El objetivo de este tipo

de tratamiento, fue el de describir las características principales de los datos reunidos.

1.1.2 Estadística inferencia

El enfoque del término estadística consiste de técnicas para hacer inferencias a partir de

los datos analizados en la estadística descriptiva y a la toma de decisiones en base a los

resultados obtenidos de una muestra.

Una vez consideradas las funciones de las dos áreas en que se clasifica la Estadística, se

puede resumir el concepto de estadística como se menciona a continuación:

1.1.3 Estadística

Page 2: Capitulo 1

La estadística es un conjunto de métodos y teorías que han sido desarrolladas para tratarla recolección, el análisis y la descripción de datos muéstrales con el objeto de tomardecisiones en base a los resultados obtenidos.En los conceptos previamente mencionados se observa como la estadística evolucionó delas técnicas de recolectar, organizar y presentar los datos muéstrales a las técnicas dehacer inferencias en base a los resultados de una muestra. Esta idea que se tiene de laestadística, no quiere decir, que el tema de la estadística se haya vuelto estable einflexible, sino por el contrario, se siguen creando nuevas técnicas estadísticas parasatisfacer necesidades específicas. Por ejemplo, recientemente se han creado algunasnuevas técnicas descriptivas conocidas con el nombre de "análisis exploratorio de losdatos". Estas técnicas permiten antes de efectuar cualquier otro tipo de análisis, examinarde manera preliminar el comportamiento de nuestros datos y de acuerdo con estecomportamiento ajustar a tales datos el modelo más adecuado1.2 CONCEPTOS BÁSICOSEn virtud de que para estudiar los Métodos Estadísticos es de vital importancia elconocimiento del lenguaje estadístico, a continuación se definen algunos de los conceptosbásicos más usuales. (Estas definiciones son de naturaleza descriptiva y nonecesariamente son matemáticamente formales).

1.2.1 PoblaciónUna población es un conjunto de elementos con alguna característica en común.Una lista de los empleados de una fábrica es un ejemplo de una población. El número deelementos de una población generalmente se denota por N.

1.2.2 MuestraUna muestra es un subconjunto de la población. El número de elementos de una muestralo indicaremos con n.1.2.3 Parámetro

Page 3: Capitulo 1

Un parámetro es una característica numérica de una población. Los parámetrosgeneralmente se denotan por letras griegas. Algunos parámetros comúnmente de interésson: el de la media, el total, la proporción, la varianza y la desviación estándar poblacionalque se denotan respectivamente por1.2.4 EstadísticoMedida numérica que describe la característica de una muestra.1.2.5 Variable

Una variable es una característica que puede tomar diferentes valores. De esta manera,el ingreso, la producción y el sexo son variables dado que pueden tomar diferentesvalores cuando se estudian diferentes elementos de una población. Las variables puedenser discretas y continuas. (En métodos estadísticos como en diseños de experimentos yregresión, las variables se clasifican en dependientes e independientes.).

1.2.6 Variable discretaUna variable discreta es aquella para la cuál sus resultados se pueden numerar, porejemplo, el número de clientes atendidos diariamente durante un mes en una instituciónbancaria, el número de ventas efectuadas por 20 agentes de seguros de una compañía, elnúmero de hijos por matrimonio de cierta ciudad, etc. Obsérvese que estos valoresgeneralmente son obtenidos a través de un proceso de contar.

1.2.7 Variable continuaUna variable continua es aquella variable que puede tomar cualquier valor dentro de unrango de valores. Obsérvese que estos valores son obtenidos a través de un proceso demedir, por ejemplo, el tiempo que esperan en ser atendidos 10 personas en un consultoriomédico, el consumo de energía eléctrica de las viviendas de una colonia durante unbimestre, el peso de un grupo de alumnos de secundaria, etc

Page 4: Capitulo 1

1.2.8 ConstanteUna variable se diferencia de una constante ya que al valor de ésta última nunca sepuede alterar. Algunos ejemplos de constantes son: el número de días del mes de mayoindistintamente del año, el número de centímetros que tiene un metro y el número delados que tiene un pentágono.1.2.9 DatoUn dato es un resultado de observar, contar o medir una característica específica deinterés. Generalmente existen dos tipos de datos: Cualitativos y cuantitativos.1.2.10 Dato cualitativo (o atributo)Es el resultado de un proceso que categoriza o describe un elemento de una población(La profesión, el lugar de nacimiento, el estado civil, etc.).1.2.11 Dato cuantitativo (o numérico)Es el resultado de un proceso que cuantifica, es decir que cuenta o mide (Longitud, peso,ingreso, etc.)

1.3 ESCALAS DE MEDICIÓNLos métodos estadísticos que se utilizan para describir un conjunto de datos depende dela forma en que éstos se midieron ya que su desconocimiento conduce a serios errores enla interpretación de los resultados. A continuación se expone la forma de clasificar losdatos de acuerdo a una escala de medición.Por lo general se acepta la existencia de cuatro escalas de medición, ellas son: nominal,ordinal, de intervalo y de razón.

Page 5: Capitulo 1
Page 6: Capitulo 1

1.4 APLICACIONES DE LOS MÉTODOS ESTADÍSTICOSEn años recientes la estadística y desde luego los métodos estadísticos han tenido undesarrollo amplio en las diferentes áreas del conocimiento, de tal manera que es másdifícil mencionar un campo en el que no se haga uso de los métodos estadísticos quemencionar uno en el que si se haga uso de los métodos estadísticos. Con éstosantecedentes, los métodos estadísticos encuentran su aplicación en una variedad tangrande de campos, que es necesario advertir, a manera de comentario, que en elpresente apartado no pretende, ni lejanamente, exponer el tema de manera exhaustiva;sino que el propósito principal es de mencionar, algunos campos de aplicación queestimulen al estudiante para que se compenetre al estudio de los métodos estadísticos.Resumiendo, los métodos estadísticos pueden ser aplicados. En una investigación demercado cuando se desea saber la proporción de compradores potenciales que prefierenun determinado artículo.En ingeniería para conocer el coeficiente de dilatación térmico de un metal o bien paracomparar la resistencia de dos aleaciones.En la Psicología para conocer el coeficiente intelectual promedio de los empleados de unaempresa.En la Pedagogía para comparar la eficiencia de dos métodos de enseñanza.En la Política para predecir el resultado de una cierta elección popular.En la Sociología para conocer la proporción de casas rurales que cuentan con energíaeléctrica.En la Industria para conocer la proporción de artículos producidos que resultandefectuosos.Por el economista que quiere obtener ecuaciones de predicción que servirán en lapredicción del crecimiento económico o de alguna otra medida de sanidad económica.Por el agrónomo al experimentar cual de las diferentes variedades del cultivo de maízrecomienda para obtener una mayor producción.En medicina para comparar la efectividad de dos medicamentos

Page 7: Capitulo 1

1.5 IDENTIFICACIÓN DE PROBLEMAS EN LOS QUE NO SE UTILIZA LAESTADÍSTICA PARA RESOLVERLOSLa estadística no es una panacea que nos sirva para resolver cualquier problema. Laestadística se aplica al estudio de variables; es decir, datos que se caracterizan por suvariación y no tiene sentido cuando la característica es constante.De acuerdo a lo mencionado en el punto anterior, la estadística no es de utilidad enproblemas de física, química, etc., en los que no existe incertidumbre en los resultados, yaque estos generalmente se obtienen al despejar la incógnita de una ecuación.1.6 ETAPAS DE UNA INVESTIGACIÓN ESTADÍSTICALas etapas de una investigación estadística ideal pueden citarse como sigue:1. Asegurarse de que se entienda el problema y de formularlo en términos estadísticos.Aclarar los objetivos de la investigación muy cuidadosamente.2. Planear la investigación y recopilar los datos de una manera apropiada. Es importantelograr un equilibrio adecuado entre el esfuerzo necesario para recopilar los datos yanalizarlos; el método de recolección es esencial para los resultados.3. Evaluar la estructura y calidad de los datos. Revisar los datos en cuanto a errores yvalores faltantes.4. Llevar a cabo un examen inicial de los datos para obtener un resumen de la estadísticadescriptiva y así tal vez, obtener mejores ideas para un análisis más formal.5. Seleccionar y llevar a cabo un procedimiento estadístico formal para analizar los datos;dicho procedimiento con frecuencias asume un modelo particular y puede involucrarestimación de parámetros y efectuar pruebas de hipótesis.6. Comparar los hallazgos con resultados previos y adquirir datos adicionales, si es necesario.

Page 8: Capitulo 1

7. Interpretar y comunicar los resultados. Los hallazgos deben entenderse tanto por losestadísticos como por los no estadísticos y se requiere cuidado extra en la presentaciónde las gráficas, tablas de resumen y salidas de computadora.1.7 HACIA UNA “ESTADÍSTICA INFORMÁTICA”En años recientes la computadora ha tenido un gran efecto en casi todos los aspectos dela vida. El campo de la estadística no es la excepción. Como se verá, en la estadística seemplean muchas técnicas repetitivas: fórmulas utilizadas para calcular magnitudesestadísticas descriptivas, procedimientos para obtener representaciones gráficas dedatos, y métodos para formular inferencias estadísticas. La computadora es muy útil en larealización de tales operaciones repetitivas. Es muy común que alguien que necesiteanalizar un conjunto de datos busque la ayuda de otra persona que sepa emplear unacomputadora. Si en esa computadora está instalado algún programa de análisisestadístico, será fácil llevar a cabo los cálculos deseados. Algunos de los programas másconocidos son: SYSTAT, SPSS, STATA, STATISTICA, JMP, STATGRAPHICS, MINITAB,SYSINFO, R y SAS.La Estadística se puede caracterizar brevemente como la ciencia de la descripción yanálisis de datos. Dentro de la Estadística se pueden distinguir dos grandes vertientes:Estadística Matemática y Estadística Aplicada.Se entiende por Estadística Matemática aquella parte de la matemática que se ocupa delos fundamentos teóricos de la estadística, sin preocuparse de las aplicaciones prácticasque puedan derivarse. Los estudios de esta ciencia suelen cursarse en las Facultades deMatemáticas.

Page 9: Capitulo 1

La Estadística Aplicada, como su nombre indica, se ocupa de las aplicaciones de laestadística a las investigaciones de carácter empírico, se deriva de la estadísticamatemática. Son los investigadores empíricos los que se han preocupado de laestadística aplicada. Por ejemplo, las investigaciones de carácter empírico en CienciasSociales, Psicología, Pedagogía, Economía, Medicina, Biología, etc. Suele recurrir amétodos estadísticos aplicados en la fase de análisis de datos.Los manuales de estadística aplicada suelen exponer los diversos conceptos para que elinvestigador pueda realizar los cálculos manualmente, ayudándose como máximo de unacalculadora de bolsillo. Pero, como ya hemos apuntado, actualmente no se hace así, sinoque se aplican procedimientos informáticos. La estadística aplicada a la investigaciónempírica ha recibido un impulso revolucionario con la generalización del uso de losordenadores. El ordenador libera de las tareas manuales de la mente, de las rutinasrepetitivas; gracia a él la mente queda descargada para aplicarse a las funcionessuperiores de enjuiciar y conocer. La informática realiza el proceso mecánico de cálculo.Así, análisis estadísticos que antes eran impensables, se pueden realizar con ciertafacilidad y rapidez mediante el uso de paquetes estadísticos.En la actualidad nos encontramos con un crecimiento progresivo de cienciasinterdisciplinarias; que armonizan diversas ramas del saber en una sola. Así, se habla depsicolingüística, bioestadística, bioquímica, neurolingüística, psicofisiología, psicologíamatemática, ingeniería genética, etc. Análogamente, proponemos, de forma provisional, elconcepto de Estadística Informática para referirnos al estudio de la estadística aplicada ala investigación empírica mediante paquetes de programas estadísticos, y por ende através de procedimientos informáticos.

Page 10: Capitulo 1

La Estadística Informática trata de los análisis más adecuados para cada investigación, dela forma de realizarlos mediante paquetes de programas estadísticos y de lainterpretación de resultados, sin preocuparse demasiado del proceso mecánico delcálculo ni de la demostración de las fórmulas matemáticas. Es decir, la EstadísticaInformática se ocupa de la informatización de la Estadística. Estos conocimientos son laconfluencia de la estadística aplicada y de la informática.La justificación del uso del término Estadística Informática está en que :a) permite utilizar un concepto distintivo para un nuevo enfoque de la estadística aplicada;b) el cambio de enfoque pone el énfasis más en la interpretación de resultados que no enel proceso mecánico de cálculo;c) supone una ampliación de los métodos estadísticos al incorporar los más modernos ysofisticados análisis multivariables, que antes era impensables.Dentro de la Estadística Informática se pueden distinguir dos grandes vertientes:a) informática: utilización y manejo de paquetes de programas estadísticos;b) interpretativa: interpretación de resultados.La vertiente informática consiste en conocer los paquetes estadísticos existentes,seleccionar el más adecuado para el análisis que se propone y dominar las instruccionesde uso. Estas instrucciones son específicas de cada paquete y varían según el sistemaoperativo que tenga el ordenador que se esta utilizando. Por otra parte, la interpretaciónde resultados es la misma, independientemente del paquete y del ordenador utilizadoEn el estudio de la Estadística Informática se pueden seguir las siguientes fases:1) proceso mecánico de calculo de técnicas elementales (frecuencias, medidas detendencia central y variabilidad, ji-cuadrado, t de Student, ANOVA, correlación dePearson, áreas bajo la curva normal, grado de significación, etc.);2) interpretación de listados de ordenador sobre los temas anteriores para comprender elparalelismo del proceso;

Page 11: Capitulo 1

3) comprensión de las instrucciones sencillas de los paquetes estadísticos

4) ejecución de análisis sencillos por ordenador

5) ejecución de análisis complejos por ordenador

6) dominio de las utilidades de los paquetes

De estas fases, las tres primeras se pueden realizar sin ordenador. De todas formas, un

programa complejo de Estadística Informática es impensable sin prácticas de ordenador.

Imaginemos una autoescuela en al que para enseñar a conducir se explica con todo

detalle lo que es el motor de explosión, de dos y de cuatro movimientos, el funcionamiento

del Carter, el delco, el sistema eléctrico, etc. Pero no se dispone de un coche para

practicar. De esta forma, los que superan el examen teórico consiguen el permiso para

conducir, sin haber conducido nunca. Este programa parecería estar más encaminado a

formar mecánicos, o incluso ingenieros, y no conductores. Algo parecido podría pasar en

investigación educativa si no se dispone de aulas de ordenadores para practicar el

enfoque informático de la estadística.; se estarán formando matemáticos pero no

investigadores en el campo de la educación. El estudio de la Estadística Informática

requiere de unos medios mínimos, que incluyen la utilización de ordenadores y el

disponer de materiales adecuados.

Page 12: Capitulo 1

1.8 COLECTIVOS ESTADISTICOS

Se llama población objetivo o de referencia al colectivo del cual interesa conocer

generalmente una serie de características. Esta puede ser concreta o hipotética.

Una población objetivo es concreta, si está delimitada e identificada en el sentido de

conocer quienes y cuales son sus elementos.

Ejemplo de poblaciones concretas son:

1. Los egresados de la Facultad de Estadística son la población objetivo, si se desea

hacer un estudio sobre la aplicación de la estadística en su centro de trabajo.

2. Los productores del cultivo de maíz del estado de Veracruz son la población objetivo si

se desea hacer un estudio sobre este cultivo

Nótese que en estos ejemplos la población objetivo son finitas, esto es, se conoce el

número de elementos N que la conforman.

Una población objetivo es hipotética si sus elementos se caracterizan a través de las

pro

piedades que los conforman. Esto es, no es necesario otra cosa más que tener una.

definición clara de cómo son los elementos de dicha población.

Ejemplos de poblaciones hipotéticas:

1. Los clientes del supermercado Tía pueden ser la población objetivo si se desea efectuar

un estudio sobre hábitos de consumo.

2. Los ciudadanos en edad de votar pueden ser la población objetivo si se desea efectuar

un estudio sobre sus preferencias electorales.

Page 13: Capitulo 1

Nótese que para estos ejemplos los colectivos se caracterizan como un conjunto: U= x | xes un elemento del colectivo, en el que desconocemos cuántos elementos conforman lapoblación, e incluso no se tiene un conglomerado de elementos ubicados en algún lugar.En general debe decirse que para estas poblaciones, que se denominan hipotéticas loimportante es caracterizar con precisión cuándo un elemento pertenece o no a ella, lo cualestablece los limites de integración. Otro aspecto importante de notar es que en elejemplo 1, no se conoce el número de elementos que conforman el colectivo, tal situaciónes muy común en los estudios de mercado y de opinión pública. En el segundo ejemplo,se hace referencia a un proceso que está funcionando, y se desea conocer elfuncionamiento del proceso.1.9 TIPOS DE ESTUDIOS ESTADÍSTICOSEsencialmente hay tres clases de estudios estadísticos:Estudios observacionales o descriptivosEstudios experimentales.Estudios de muestreo.Estudios prospectivosEn las tres clases de estudio se realiza la fase del diseño, que consiste en la planeaciónde las actividades hasta que se han colectado los datos. En los estudios experimentalesel investigador cuenta con una serie de unidades de estudio a las que asigna un conjuntode tratamientos (estímulos) y observa una serie de variables respuesta. En el caso de losestudios de muestreo el investigador selecciona de una población mayor las unidades aestudiar, y se registran tanto las variables a estudiar. Un estudio experimental se puedecombinar con un muestreo. Este caso se presenta en situaciones en los que las unidadesexperimentales son considerablemente grandes. Por otro lado, los estudiosobservacionales son aquellos en los que las unidades ya están dadas y se observan lascaracterísticas de interés. Típicos ejemplos son aquellos en los que se usan expedientes,sistemas periódicos de información, estudios con voluntarios, etc.

Page 14: Capitulo 1

1.10 EJERCICIOS PROPUESTOS

1.- Un fabricante de medicamentos desea conocer la proporción de personas cuya

hipertensión (aumento de presión sanguínea) puede ser controlada con nuevo producto

fabricado por la compañía. Al realizar un estudio en 5000 individuos hipertensos, se

encontró que el 80% de ellos pudo controlar su hipertensión utilizando el nuevo

medicamento. Suponiendo que esas 5000 personas son representativas del grupo de

pacientes de hipertensión, conteste las siguientes preguntas:

a. ¿Cuál es la población?

b. ¿Cuál es la muestra?

c. Identifique el parámetro de interés.

d. Identifique el estadístico utilizado e indique cuál es su valor.

e. ¿Se conoce el valor del parámetro?.

2.- Un técnico de control de la calidad selecciona partes de una línea de ensamble y anota

para cada una de ellas la siguiente información:

a. Si está o no defectuosa.

b. El número de identificación de la persona que armó la pieza.

c. El peso de la pieza.

Identifica para cada inciso el tipo de dato que se obtiene.

3.- Se quiere saber el costo de la educación. Uno de los gastos que hace un estudiante es

la compra de sus libros de texto. Sea X el costo de todos los libros comprados este

semestre por cada estudiante que ingreso a la Universidad. Describa cuidadosamente:

a. La población.

b. La variable.

Page 15: Capitulo 1

4.- Con respecto al ejercicio anterior, considere que desea evaluar el costo promedio delos libros por estudiante que ingresos a la Universidad.a. Describa el parámetro poblacional.b. Si se seleccionaron 500 estudiantes y se les pidió que tomaran nota en su gastos delibros de texto y que informaran la cantidad total. Las 500 cantidades resultantes formanuna muestra. Mencione el estadístico de interés en el presente estudio.5.- El experimento llamado del "primer siete" consiste en tirar dos dados repetidamentehasta observar que la suma de sus caras sea siete. La variable que interesa es el númerode tiradas necesarias para que caiga el primer siete.a. ¿Cuáles son los valores posibles de la variable respuesta?.b. ¿Tal variable es discreta o continua?.6.- Identifique cada uno de los siguientes casos como ejemplo de variable (1) de atributo,(2) discreta, o (3) continua.a. La resistencia de la ruptura de un determinado tipo de cuerda.b. EL color del cabello de los niños que estén viendo por televisión una película.c. EL número de señales de tránsito en poblados con menos de 500 habitantes.d. Si una llave de lavabo está defectuosa o no.e. El número de preguntas contestadas correctamente en un examen.f. El tiempo que se necesita para contestar una llamada telefónica en una oficina debienes raíces.7.- Identifique cada uno de los siguientes casos como ejemplo de variable: (1) de atributo,(2) discreta o (3) continua.a. El resultado de la encuesta a un votante posible acerca del candidato de supreferencia.b. El tiempo necesario para que una herida cicatrice cuando se utiliza un nuevomedicamento

Page 16: Capitulo 1

c. El número de llamadas telefónicas recibidas en un conmutador cada 10 minutos.d. La distancia a la que puede llegar un balón de fútbol al ser pateado por las jóvenes delprimer grado de la Universidad.e. El número de páginas escritas por cada trabajo en una impresora de computadora.8.- Supóngase que un niño de doce años quiere saber la diferencia entre muestra ypoblación.a. ¿Qué información daría como respuesta?b. ¿Qué razones se le daría sobre el porqué se debe tomar una muestra en ves deestudiar todos los miembros de la población?.9.- Se quiere describir al estudiante típico de cierta Universidad. Describa una variableque mida alguna característica de un estudiante y resulte en:a. Datos de atributo b. Datos discretos. Datos continuos10.- Un candidato a ocupar un cargo público asegura que ganará la elección. Un sondeode opinión indica que 35 de 150 electores votarán por él, 100 favorecerán a su oponente y15 están indecisos.a. ¿Cuál es el parámetro poblacional de interés?.b. ¿Cuál es la estadística muestra que debe utilizarse para estimar el parámetropoblacional?.c. Tomando como base los resultados del sondeo, ¿cree que es cierta la afirmación delcandidato?11.- Una pequeña encuesta consta de tres preguntas:a. ¿Cuál es su religión: cristiana, musulmana u otra?.b. ¿A cuántos ritos religiosos asiste usted anualmente?.c. ¿Cuánto dinero donó a organizaciones religiosas el año pasado?Clasifique las respuestas a estas preguntas como datos cuantitativos o atributos, datos devariable discreta o datos de variable continua

Page 17: Capitulo 1

12.- Describa con sus propias palabras cada uno de los términos siguientes, dando

además un ejemplo diferente de los que se han visto en clase.

a. Variable

b. Dato

c. Muestra

d. Población

e. Estadístico

f. Parámetro