Upload
gabriel-gamas-padilla
View
265
Download
0
Embed Size (px)
DESCRIPTION
investigacion
Citation preview
CONTENIDO 13/JUL
• Día 1
• Aspectos generales y presentación de programas.
• Presentación del curso, del instructor y de los integrantes del taller.
• 1. EL CONOCIMIENTO CIENTÍFICO• 2. CONOCIMIENTO Y MÉTODO• 3. LA INVESTIGACION CIENTIFICA• 4. PLANTEAMIENTO DE LA INVESTIGACION
OBJETIVO
• El curso tiene como objetivo el contribuir al conocimiento de los principios básicos de la metodología, los diseños experimentales y la investigación con fundamentos estadísticos. Por otro lado, con el curso se pretende favorecer el planeamiento y desarrollo de un diseño, recolectar, organizar, analizar e interpretar datos experimentales obtenidos en la investigación de campo y laboratorio, así como interpretar los resultados del análisis.
EVALUACIÓN
• Asistencia mínima del 90% y calificación final mínima de 80%.
• Solución y entrega de problemas asignados y aplicados.
• Un trabajo final de investigación documental y experimentación.
• Prácticas en software especializado.• Entregar portafolio de evidencias.• Cuestionarios de actividades programadas.
EL CONOCIMIENTO CIENTIFICO
CONOCIMIENTO COMÚN
CONOCIMIENTO CIENTÍFICO
- SIMPLE
- ADQUIRIDO Y ACEPTADO SIN > DISCUSIÓN
- COMPLEJO
- SE ADQUIERE A TRAVÉS DEL MÉTODO CIENTÍFICO
-BUSCA RESPONDER INTERROGANTES
-INTERPRETAR LA REALIDAD
-MODIFICAR LA REALIDAD
Distintas formasDistintas formas
Conocimiento vulgar
•Adquirido en el proceso de socialización.
•Superficial
•Sensitivo y subjetivo
Conocimiento mítico-religioso
•Supone la adhesión a una creencia de verdad.
•Dogmática
•No requiere contrastación empírica de sus verdades.CONOCIMIENTO CIENTÍFICOCONOCIMIENTO CIENTÍFICO
Racional: se obtiene a través del uso de la razón.
Metódico: supone procedimientos logico-metodológicos basados en el método científico
Sistemático: sus componentes teóricos y sus observaciones empíricas se articulan en un todo.
Verificable: los postulados teóricos se contrastan con la realidad
Falible: tiene un carácter provisorio.
Busca las regularidades: intenta describir la realidad para comprenderla en sus relaciones invariantes.
Usa como instrumentos: la reflexión, la observación y la experimentación de los fenómenos
Es un producto socio-cultural: se genera en contextos sociales específicos y en procesos históricos determinados.
CONOCIMIENTO CIENTÍFICO
OBSERVA
DESCUBRE
EXPLICA
PREDICE
CONOCIMIENTO SISTEMÁTICO DE LA REALIDAD
REALIDAD
CONOCIMIENTO CIENTÍFICO
CIENCIA
Cuerpo de ideas
NIVEL TEÓRICO
Plantea problemas teóricos. Explica la
realidad independientemente de la
aplicación del conocimiento.
Investigación básica
CIENCIA PURA
NIVEL PRÁCTICO
Estudia problemas prácticos
Investigación aplicada Investigación tecnológica
CIENCIA APLICADA
Genera una actividad teórica
TECNOLOGÍA
Toma teorías científicas y las adapta
para determinados fines.
Producto de la investigación científica es elProducto de la investigación científica es el
Genera nuevos problemas teóricos APLICACIÓN
DEL CONOCIMIENTO
CIENTÍFICO
INFLUYE SOBRE LA SOCIEDAD
El significado etimológico: in (en)
vestigar (hallar, seguir vestigios).
Es un procedimiento reflexivo, sistemático, controlado y crítico que tiene por finalidad descubrir o interpretar los hechos y fenómenos, relaciones y leyes de un determinado ámbito de la realidad.
Investigación constituye una búsqueda de hechos, un camino para conocer la realidad.
¿QUÉ ES UNA INVESTIGACIÓN?
La investigación es un conjunto de fases en la búsqueda de una respuesta a una situación problemática.
El método es el camino a seguir en esa búsqueda, es decir, los procedimientos a utilizar a través de normas y reglas genéricas de actuación científica.
Investigación
Actividades de búsqueda.
Método
Procedimientos para seguir el camino de esa búsqueda.
DIFERENCIA ENTRE INVESTIGACIÓN CIENTÍFICA Y MÉTODO CIENTÍFICO
MÉTODO CIENTÍFICO
CONOCIMIENTO CIENTÍFICO
INVESTIGACIÓN CIENTÍFICA
El método científico es un procedimiento para descubrir las condiciones en que se presentan sucesos específicos, caracterizado generalmente por ser:
•tentativo•verificable•de razonamiento
riguroso y •observación empírica
EL MÉTODO CIENTÍFICO
PERMITE
MEDIANTE
OBTENER
EL PROCESO INVESTIGATIVO
EXPLICACIONES LÓGICAS Y
COHERENTES
analizar y sistematizar información
ESQUEMA
MÉTODO CIENTÍFICO
Característico de la ciencia
PURA
APLICADA
- No infalible ni autosuficiente
- Puede perfeccionarse
- Se sustenta en conocimientos previos
Puede reajustarse y elaborarse
EL MÉTODO CIENTÍFICO
Independencia y objetividad• Al respecto, Barragán dice: «Lo que importa de método
científico es su independencia respecto de aquello (materia) que se estudia. Cada ciencia tendrá sus propios problemas y para ello debe utilizar prácticas o técnicas que se acomoden al objeto de estudio».
(Barragán, H. Epistemología, pág. 101)
METODO CIENTÍFICO
OBJETO DE ESTUDIOINDEPENDENCIA
METODO CIENTÍFICO
• MANIPULACIONES
• PREJUICIOS
• REALIDAD
• OBJETO DE ESTUDIO
RECHAZA
• Paso 1Concebir la idea a investigar
• Paso 2Plantear el problema de investigación- Establecer objetivos de investigación- Desarrollar las preguntas de investigación- Justificar la investigación y su viabilidad
EL PROCESO DE LA INVESTIGACIÓN CIENTÍFICA
EL PROCESO DE LA INVESTIGACIÓN CIENTÍFICA
• Paso 3Elaborar el marco teórico
Revisión de la literatura*Detección de la literatura*Obtención de la literatura*Consulta de la literatura*Extracción y recopilación de la información de
interés
Construcción del marco teórico
EL PROCESO DE LA INVESTIGACIÓN CIENTÍFICA
•Paso 4
Definir si la investigación se indica como exploratoria, descriptiva, correlacional o explicativa y hasta qué nivel llegará.
EL PROCESO DE LA INVESTIGACIÓN CIENTÍFICA
Paso 5
• Establecer la hipótesis o hipótesis• Detectar las variables• Definir conceptualmente las variables• Definir operacionalmente las variables
EL PROCESO DE LA INVESTIGACIÓN CIENTÍFICA
Paso 6Seleccionar el diseño apropiado de
investigación:• Experimental• Cuasiexperimental• No experimental
EL PROCESO DE LA INVESTIGACIÓN CIENTÍFICA
• Paso 7Seleccionar la muestra
- Determinar el universo- Extraer la muestra
EL PROCESO DE LA INVESTIGACIÓN CIENTÍFICA
• Paso 8Recolección de los datos:
- Elaborar el instrumento de medición y aplicarlo
- Calcular validez y confiabilidad del instrumento de medición
- Codificar los datos- Crear un archivo que contenga los datos
EL PROCESO DE LA INVESTIGACIÓN CIENTÍFICA
• Paso 9Analizar los datos:
- Seleccionar las pruebas estadísticas- Elaborar el problema de análisis- Realizar los análisis
EL PROCESO DE LA INVESTIGACIÓN CIENTÍFICA
Paso 10Presentar los resultados:
Elaborar reporte de investigaciónPresentar el reporte de investigación
ESQUEMA: EL PROCESO DE LA INVESTIGACIÓN CIENTÍFICA
ELECCIÓN DEL TEMA
DELIMITACIÓN DEL TEMA
PROBLEMA
OBJETIVOS
MARCO TEÓRICO
METODOLOGÍA
PLANTEAMIENTO
IDENTIFICACIÓN
ALCANCE Y LÍMITES
RECURSOS
REVISIÓN DEL CONOCIMIENT
O
GENERALES
FORMULACIÓN
DESCRIPCIÓN
ANTECEDENTES
ESPECÍFICOS
DEFINICIÓN CONCEPTUAL
HIPÓTESIS
VARIABLES CODIFICACIÓNTABULACIÓN
POBLACIÓN Y MUESTRA
RECOLECCIÓN DE DATOS
PROC. DE DATOS
ENTREGA DE INFORME
OPERACIONES O MOMENTOS DEL PENSAR DE UN INVESTIGADOR
EnumerarDescribirCompararDistinguirClasificar
Definir
Situar Tiempo Espacio
Implicarse
(meterse en el problema)
Hechos
Fenómenos
Formulación del problema.
Complicarse (Hacer suya la
complejidad de la realidad)
Aspectos o facetas del problema.
Puntos de vistas
Contradicciones.
Preocuparse (Abordar la realidad)
Métodos y técnicas de abordaje de la
realidad
Recopilar datos información relativos
al problema
Explicarse (Apropiarse del
saber)
Tratar la información.
Analizar los hechos. Causas.Leyes.Teorías .Consecuencias
Aplicarse (ir a la acción)
Programar
Corto
Mediano Plazo
Largo
Teniendo en cuenta lo posible, lo probable y
lo deseable.
EJECUTAR la decisión tomada.
EVALUAR Y VERIFICAR
resultados.
COMO ESTUDIARLO
EN QUE CONSISTEN
PROCESO ETNOGRÁFICO
CUALES SON TUS ASPECTOS
QUE HACE
R
DE QUE SE TRATASituación problemática
PROCESO DE INVESTIGACIÓN-
ACCIÓN
Paso N° 1
• Concebir la idea a
investigar.
Paso N° 2
• Plantear el problema de
investigación:
• Establecer objetivos de
investigación.
• Desarrollar las preguntas de investigación.
• Justificar la investigación y su viabilidad.
Paso N° 3
• Elaborar el marco teórico:
• Revisión de la literatura:
• Detección de la literatura.
• Obtención de la literatura.
• Consulta de la literatura.
• Extracción y recopilación de la
información de interés.
• Construcción del marco teórico.
ETAPAS DE LA INVESTIGACIÓN
Paso N° 4
•Definir si la investigación se inicia como exploratoria, descriptiva correlacional o explicativa y hasta qué nivel llegará.
Paso N° 5
•Establecer las hipótesis
•Detectar las variables.
•Definir conceptual mente las variables.
•Definir operacional mente las variables.
Paso N°6
•Seleccionar el diseño apropiado de investigación:
•Diseño experimental, preexperi mental o cuasiexperi mental
ETAPAS DE LA INVESTIGACIÓN
Paso N° 9
• Analizar los datos:
• Seleccionar las pruebas
estadísticas.
• Elaborar el problema de
análisis.
• Realizar los análisis.
Paso N° 10
• Presentar los resultados:
• Elaborar el reporte de
investigación.
• Presentar el reporte de
investigación.
Paso N° 8
• Recolección de los datos:
• Elaborar el instrumento de
medición y aplicarlo.
•Calcular validez y confiabilidad del instrumento de
medición
• Codificar los datos
• Crear un archivo que contenga los
datos..
Paso N° 7
• Selección de la
muestra:
•Determinar el universo.
• Extraer la muestra
ETAPAS DE LA INVESTIGACIÓN
Las buenas ideas intrigan, alientan y excitan al investigador de manera personal.
Las buenas ideas de investigación ¨no son necesariamente nuevas pero sí novedosas¨.
Las buenas ideas de investigación pueden servir para elaborar teorías y la solución de problemas.
CRITERIOS PARA GENERAR IDEAS
PREGUNTA INICIAL
FASE EXPLORATORIA
Las lecturas Las entrevistas exploratorias
PLANTEAMIENTO DEL PROBLEMA
ACLARAR PROBLEMÁTICA
MARCO TEÓRICO
ESTRUCTURACIÓN DEL MODELO DE ANÁLISIS
INTERACCIÓN ENTRE LA PREGUNTA INICIAL, LA EXPLORACIÓN Y LA PROBLEMATICA
CARACTERÍSTICAS DE LA PREGUNTA DE INVESTIGACIÓN
Actualidad: La interrogante básica debe ser novedosa y actual. La pregunta de investigación debe ser original.Viabilidad: Antes de proponer un proyecto debemos estar seguros de que disponemos de los recursos materiales, humanos y de tiempo para concretarlo.Pertinencia: La pregunta de investigación tiene que tener importancia para resolver situaciones o problemas de las personas o de la comunidad.Precisión: La pregunta de investigación debe ser precisa, es decir, tiene que estar adecuadamente ubicada en tiempo, espacio y persona.Ética: Toda propuesta de investigación que no sea científicamente sólida, es por tanto, éticamente incorrecta.
ETAPAS DE LA FORMULACIÓN DE LA PREGUNTA
Una vez elegido el tema de investigación y enunciada la cuestión preliminar, el investigador deberá seguir precisando el problema, pensando y escribiendo acerca de las siguientes preguntas:• ¿Qué necesitamos para comprender mejor nuestro tema de investigación?• ¿Qué conocemos acerca del problema? Rescatar conocimiento previo.• ¿Cuál es la situación deseable y cuáles son las sugerencias propuestas para alcanzar dicha situación?• ¿Qué han hecho otros para resolver este problema?• ¿Cuáles son los escenarios y las personas involucradas en el problema?• ¿Qué metodología resultaría más útil para dar respuesta a nuestros interrogantes?• ¿Qué aspectos éticos deben considerarse en el abordaje del problema?
CRITERIOS PARA PLANTEAR UN PROBLEMA DE INVESTIGACIÓN
Según Kerlinger (2002) son:
• El problema debe expresar una relación entre dos o mas variables ( exceptuando que se describa el problema).
• Debe estar formulado claramente y sin ambigüedad como pregunta.
• El planteamiento implica la posibilidad de realizar una prueba empírica..
• Se debe expresar en una dimensión temporal y espacial.
• Debe especificar la población a la cual se inferirán los resultados.
• Se debe especificar la viabilidad del estudio.
ERRORES QUE SUELEN COMETERSE AL PLANTEAR UN PROBLEMA
• Muy amplio, no está delimitado.• Muy específico, intrascendente.• No se puede medir en la práctica.• Ya está resuelto, no hay novedad.• El estudiante no posee los recursos para investigarlo.
• Es un tema filosófico y está expresado con términos valorativos.
FORMULACIÓN O PLANTEAMIENTO DEL PROBLEMA DE INVESTIGACIÓN
• Plantear el problema no es si no afinar y estructurar más formalmente la idea de investigación, en términos concretos y explícitos.
• La génesis de estos problemas se dará por la reflexión surgida con ocasión de las lecturas, de los debates, de las experiencias de aprendizaje; en fin, de la vivencia intelectual dentro del medio de educación superior y en el ambiente científico y cultural.
¿CÓMO CONSTRUIR UN PROBLEMA DE INVESTIGACIÓN?
A) PLANTEAMIENTO INICIAL: en esta etapa se intenta responder a la pregunta ¿qué investigar?
Defino y describo el objeto de estudio, a través del planteamiento de interrogantes entorno al tema escogido.
B) ANTECEDENTES DEL PROBLEMA: es importante definir el contexto de la investigación, es decir, recabar toda la información sobre el tema.
ANTECEDENTES TEÓRICOS: revisión bibliográfica sobre otros estudios con respecto al tema consulta a expertos en la temática evolución histórica de la temática.
ANTECEDENTES EMPÍRICOS: experiencia práctica que se posee sobre el tema experiencia directa del investigador motivaciones personales.
¿CÓMO CONSTRUIR UN PROBLEMA DE INVESTIGACIÓN?
C) PLANTEAMIENTO DEFINITIVO: luego de realizar una descripción de la temática exponiendo los antecedentes teóricos y empíricos, se precisa cual es la finalidad de la investigación.
¿CÓMO CONSTRUIR UN PROBLEMA DE INVESTIGACIÓN?
REDACTAR LA PREGUNTAS DE INVESTIGACIÓN
Se requiere especificidad.
En lugar de decir• ¿Cuál es el impacto de la tecnología en la
educación?
Sería mejor decir• ¿Qué porcentaje de profesores utilizan ejercicios
en los que sus estudiantes utilicen una base de datos electrónica?
REDACTAR LA PREGUNTAS DE INVESTIGACIÓN
Debe evitarse la simplicidad excesiva o un nivel de complejidad que haga poco factible su realización.
¿Existe una norma que regule el desecho de la basura en la industria del estado de SLP?
¿En cuántos municipios del estado de SLP existen normas ambientales que regulen la actividad industrial?.
¿En cuántos municipios de América Latina existen normas ambientales que regulen la actividad industrial?
REDACTAR LA PREGUNTAS DE INVESTIGACIÓN
Se debe apreciar con claridad la variable que se está estudiando.
• En la pregunta planteada anteriormente ¿Cuáles son las condiciones de seguridad e higiene en los restaurantes de SLP?
• La variable en estudio sería: Condiciones de seguridad e higiene
TIPOS DE PREGUNTAS DE INVESTIGACIÓN
Descriptivas: • Se pueden expresar como ¿Qué característica (s) tiene una
determinada unidad o categorías de unidades de observación? o ¿Cuales son las unidades de observación que tienen una característica dada?.
Analíticas:• Se pueden formular como ¿ Qué característica X está
relacionada con la característica Y en cada unidad de observación?.
Diagnostico:• Se pueden enunciar como ¿Qué característica (s) tiene una
determinada unidad de observación (o categorías de unidades) y cuales son los factores de un estado determinado para clasificarlo como bueno, regular o malo (u otra clasificación)?.
REDACTAR LA PREGUNTAS DE INVESTIGACIÓN
Debe permitir visualizar la metodología que probablemente será utilizada.
• ¿Cuáles son las normas ambientales que deben ser cumplidas por las empresas que producen jugos?
• Tipo documental en la que el investigador busca averiguar.• ¿Cuál es la calidad del servicio al cliente que se otorga en las
cafeterías de la ciudad de SLP?• Estudio descriptivo que se podría realizar a través de una
observación, mediante una encuesta o una auditoría de la calidad del servicio.
• ¿Cuáles son los factores que contribuyen a elevar los índices de titulación en la carrera de Ingeniería Agroindustrila?
• Diseño experimental Estamos hablando de un estudio manipulativo en el que seguramente se evaluaran las variables del estudio.
REDACTAR LA PREGUNTAS DE INVESTIGACIÓN
• Al formular una pregunta de investigación se trata de formular el problema con claridad no la solución.
• Una pregunta de investigación apropiadamente redactada debe poder visualizar también el escenario, los sujetos o límites del estudio.
• Finalmente al estructurar la pregunta de investigación debe evaluarse la relevancia de la misma, de manera general es necesario cuestionarse si la respuesta a la pregunta enriquece el conocimiento.
PLANTEO DEL PROBLEMA
OBJETIVOS
¿Qué?
• Claridad.
• Alcanzables.
• PREGUNTAS
• Una o varias.
• Resume lo que será la
investigación.
• Clara.
• Precisa
• Límites temporales y espaciales.
• Manipulable
JUSTIFICACIÓN
¿Para qué?
Finalidad de la investigación
OBJETIVOS DE INVESTIGACIÓN
El o los objetivos establece el sentido, dirección, curso que seguirá la Investigación, constituye la identificación de los elementos de análisis de una investigación.Plantean los propósitos a estudiar y no la metodología.
Objetivo general o principal: es el enunciado claro y preciso del propósito central que se persiguen con la investigación.
Objetivos específicos o secundarios: indica lo que se pretende llevar a cabo en cada etapa, descomposición del objetivo general.
CRITERIOS PARA LA FORMULACIÓN DE OBJETIVOS
• Deben especificar con claridad los resultados prácticos que debe llegar el estudio.
• Deben ser explícitos, claros y precisos.• Deben ser observables y susceptibles de
medir.• Deben ser ordenados según prioridades.• Deben invocar la pregunta de investigación.• Deben estar expresados en el infinitivo de
un verbo.
ASPECTOS FUNDAMENTALES DE LOS OBJETIVOS:
• Claridad: se basa en un lenguaje comprensible y preciso, un lenguaje fácil de identificar.
• Factibilidad: se refiere a la posibilidad de lograr los objetivos con los recursos disponibles, con la metodología adoptada y dentro de los plazos previstos.
• Pertinencia: se conforma de la relación lógica con el tipo de problema que se pretende solucionar.
SEGÚN SU COMPLEJIDAD LOS OBJETIVOS
Perceptual: implica conocimiento externo y superficial del evento, para precisar aquellos elementos que resultan evidentes, por ejemplo describir, explorar. Aprehensivo: implica la búsqueda de aspectos no tan evidentes en el evento de estudio, de aquello que parece oculto y subyace a la organización interna del evento, por ejemplo analizar, comparar.Comprensivo: alude a la explicación de las situaciones que generan el evento, por ejemplo explicar.Integrativo: implica la modificación del evento por parte del investigador, por ejemplo evaluar.
VERBOS SEGÚN CORRESPONDAN CON LA FINALIDAD DE TU INVESTIGACIÓN
Nivel Finalidad – Verbos
Percept
ual
Explorar: indagar, conocer, detectar,
estudiar, reconocer, descubrir.
Describir: caracterizar, tipificar, clasificar,
identificar, diagnosticar.
VERBOS SEGÚN CORRESPONDAN CON LA FINALIDAD DE TU INVESTIGACIÓN
Nivel Finalidad – Verbos
Aprehensi
vo
Analizar: interpretar, criticar.
Comparar: contrastar, asemejar,
diferenciar.
VERBOS SEGÚN CORRESPONDAN CON LA FINALIDAD DE TU INVESTIGACIÓN
Nivel Finalidad – Verbos
Comprensi
vo
Explicar: entender, comprender.
Predecir: proveer, pronosticar.
Proponer: plantear, formular, configurar,
diseñar, crear, proyectar, invertir,
programar.
VERBOS SEGÚN CORRESPONDAN CON LA FINALIDAD DE TU INVESTIGACIÓN
Nivel Finalidad – Verbos
Integrati
vo
Modificar: cambiar, ejecutar, reemplazar,
propiciar, organizar, realizar, aplicar, mejorar,
promover.
Confirmar: verificar, comprobar, demostrar,
probar.
Evaluar: valorar.
HACIÉNDONOS LAS PREGUNTAS CORRECTAS
¿Qué quiero saber? ¿Qué objetivo voy a plantear?
¿Cómo es? ¿Cuáles son sus
características?
¿Cómo varía en el tiempo?
Describir: caracterizar, tipificar,
clasificar, identificar, diagnosticar.
¿En qué medida este evento se
corresponde con ciertos
criterios? ¿Cuáles son los
aspectos ocultos de este evento?
Analizar: interpretar, criticar.
HACIÉNDONOS LAS PREGUNTAS CORRECTAS
¿Qué quiero saber? ¿Qué objetivo voy a plantear?
¿Por qué ocurre este fenómeno?, ¿Cuáles
son sus causas?, ¿Cómo varía este evento
en presencia de otros eventos?, ¿Cómo se
puede explicar?
Explicar: entender, comprender.
¿Cómo se presentará este evento en un
futuro que reúna tales condiciones?,
Dadas tales circunstancias.. ¿Cuáles serán
las situaciones futuras?
Predecir: prever, pronosticar
¿Cuáles serán las actividades de un
aparato, diseño, propuesta, etc., que
permita lograr los objetivos tales,
relacionado con este fenómeno?
Proponer: plantear, formular, configurar,
diseñar, crear, proyectar, invertir, programar.
HACIÉNDONOS LAS PREGUNTAS CORRECTAS
¿Qué quiero saber? ¿Qué objetivo voy a plantear?
¿Cuáles cambios se pueden producir
en este fenómeno, al aplicar este
diseño, programa, plan de acción…?
Modificar: cambiar, ejecutar, propiciar,
motivar, organizar, realizar, aplicar,
mejorar, promover.
¿Existe realmente relación entre
estos dos eventos?
Confirmar: verificar, comprobar,
demostrar, probar.
¿Hasta qué punto el programa,
diseño o propuesta está alcanzando
los objetivos que se propuso?
Evaluar: valorar, estimar.
CRITERIOS DE JUSTIFICACIÓN DEL ESTUDIO
• Conveniencia:¿ Que tan conveniente es la investigación?
¿ para que sirve?
• Relevancia Social:¿ Cual es la Trascendencia para la sociedad?
¿ quienes serán los beneficiarios con la investigación? ….. ¿Cuál es el alcance social?
CRITERIOS DE JUSTIFICACIÓN DEL ESTUDIO
• Implicaciones Practicas:
¿ Contribuirá a solucionar un problema práctico?
• Valor Teórico: Con la investigación ¿ se podrán generalizar los
resultados a principios mas amplios?¿ servirá para desarrollar, comentar o apoyar una
teoría?.. ¿ que se espera saber con los resultados que no se conociera antes?
CRITERIOS DE JUSTIFICACIÓN DEL ESTUDIO
• Utilidad Metodologíca: Investigación ayudara a la definición de un nuevo
concepto, variable o relación entre ellas? ¿ sugiere como estudiar mejor a un tipo de población? ¿ puede ayudar a crear nuevos instrumentos de recolección o análisis de datos?
• Factibilidad:Debemos tener encuenta si contamos realmente con los recursos para poder realizar el estudio o investigación …¿ es factible llevar a cabo esta investigación? ¿ Cuanto tiempo tomara realizarla? ¿ Es competente el equipo de investigación para efectuar el estudio?
CRITERIOS DE JUSTIFICACIÓN DEL ESTUDIO
• Implicancias Éticas:¿Existen implicancias de orden moral? ¿ se cuenta con la autorización de los sujetos mediante el Consentimiento Informado?
ELABORACIÓN DEL MARCO TEÓRICO
Marco Teórico
Implica analizar teorías, investigaciones; Y antecedentes que se consideren válidos Para el encuadre del estudio.
Tenemos ya
El problema de estudio
preguntas
objetivos
relevancia
factibilidad
FUNCIONES PRINCIPALES DEL MARCO TEÓRICO
• Ayuda a prevenir errores
• Orienta sobre cómo analizar el estudio
• Guía al investigador para centrarse en el problema, evitando desviaciones del planteamiento original.
• Conduce al establecimiento de hipótesis o afirmaciones
• Inspira nuevas líneas y áreas de investigación
• Posee un marco de referencia para interpretar los resultados del estudio.
FUENTES DE INFORMACIÓN
PRIMARIAS: (datos de primera mano) libros, antologías, artículos, monografías, tesis, disertaciones documentos oficiales, testimonios de expertos, Internet, “artículos científicos”.
SECUNDARIAS: (listado de fuentes primarias) (reprocesar información) compilaciones, resúmenes y listado de referencias, publicaciones en un área de conocimiento.
TERCIARIAS: compendios de fuentes secundarios, listados de publicaciones boletines, conferencias, simposios, sitios WEB, títulos de reportes, etc.
¿CÓMO SE CONSTITUYE EL MARCO TEÓRICO?
(Kerlinger) TEORÍA: conjunto de conceptos, definiciones y proposiciones relacionados entre sí, que presentan una visión sistemática de fenómenos especificando relaciones entre variables con el objetivo de explicar y predecir fenómenos.
¿Cuáles son las funciones de una Teoría?
- Explicar, decir porqué, cómo, cuando, ocurre un fenómeno.- Sistematizar, ordenar el conocimiento sobre un fenómeno o
una realidad.- Hacer inferencias a futuro, predecir, sobre el comportamiento
de un futuro.
ESTRATEGIAS PARA CONSTRUIR EL MARCO TEÓRICO
1. Existencia de una teoría completamente desarrollada.
2. Existencia de varias teorías aplicables.
3. Existencia de “piezas y trozos” de teorías.
4. Descubrimientos interesantes, pero parciales, que no se ajustan a una teoría.
5. Existencia de guías no investigadas, ideas largamente relacionadas con la investigación.
PARTES O ELEMENTOS QUE CONFORMAN EL MARCO TEÓRICO
• Antecedentes de la Investigación.• Reseña Institucional (si aplica).• Bases Teóricas.• Bases Legales (si aplica).• Sistema de Variables.• Definición de Términos Básicos.
HIPOTESIS
Son explicaciones tentativas del fenómeno investigado y que se formulan como proposiciones. (No siempre son verdaderos; o siempre pueden comprobarse con hechos o experimentalmente).
Sus funciones son:• Guiar el estudio• Proporcionar explicaciones• Apoyar la prueba de teorías
CARACTERÍSTICAS DE UNA HIPÓTESIS
• Deben referirse a una situación real, contexto y universo bien definidos.
• Las variables de la hipótesis deben ser comprensibles, precisas y lo mas concretas posible.
• Relación entre variables debe ser clara y verosímil (lógica).
• Las variables y la relación entre ellas deben ser observables y medibles, tener referentes en la realidad.
• Deben estar relacionadas con técnicas disponibles para probarlas
CLASIFICACIÓN DE LAS HIPOTESIS
INVESTIGACIÓN:
Proposiciones tentativas acerca de las posibles relaciones entre dos o más variables y que cumplen con los requisitos mencionados
Hi H1, H2, H3
NULAS:
Reverso de las anteriores
Refutan o niegan lo que afirma la hipótesis de investigación (la relación entre variables)
Ho
ALTERNATIVAS:
Posibilidades diferentes o alternas entre las hipótesis de investigación y nula.
ESTADISTICAS: (enfoque cuantitativo)
Representan la transformación de las hipótesis de investigación, nulas y alternativas en símbolos estadísticos
VARIABLES
Cualidad o característica de un objeto (o evento) que contenga, al menos, dos atributos en los que pueda clasificarse un objeto o evento
Requisitos básicos:
Exhaustividad: debe comprender el mayor número de atributos posible. Toda observación debe ser clasificada
Exclusividad: los distintos atributos de la variable deben ser mutuamente excluyentes. Una observación solo puede clasificarse en términos de un solo atributo
Precisión: realizar el mayor número de distinciones posibles. Las categorías pueden agruparse más tarde, el camino inverso no es posible...
NIVEL DE MEDICIÓN
Variables Nominales:
Ejemplos: sexo, nacionalidad, estado ocupacional, grupo sanguíneo, partido político, estado civil, religión, plan social al que pertenece, localidad donde reside, etc.
No se puede establecer ningún tipo de relación
Análisis estadístico limitado
NIVEL DE MEDICIÓN
Variables Ordinales:
Ejemplos: estrato social, orden de mérito, nivel educativo, opinión acerca de un hecho/situación/gobierno
Los atributos, además de poseer las características mencionadas, tienen la propiedad de poder establecer un orden
No puede conocerse la magnitud de la diferencia entre un atributo y otro
Son variables no métricas o cualitativas
Análisis estadístico limitado
NIVEL DE MEDICIÓN
Variables Cuantitativas o métricas:
Variables de intervalo:
Además de establecer un orden, la diferencia entre dos atributos puede cuantificarse
La distancia que separa a personas de 15 y 16 años, es la misma que la existente entre personas de 72 y 73 años
Permite realizar la mayoría de las operaciones aritméticas
Ejemplos: temperatura en ºC
No tiene cero absoluto. El cero no implica la ausencia de atributo
NIVEL DE MEDICIÓN
Variables Cuantitativas o métricas:
Variables de razón:
Además de las características de las variables de intervalo, se suma la posibilidad de contar con un cero absoluto
El cero absoluto indica ausencia de la característica
Permite cálculo de proporciones
Permite realizar cualquier operación aritmética
Ejemplos: ingreso, altura, peso, número de habitantes, todas las variables que consideren tiempo y distancia
NIVEL DE MEDICIÓN
Variables Cuantitativas o métricas:
Variables discretas:
Entre dos valores dados, no existen valores intermedios
Ejemplos: número de hijos, número de elementos vendidos, número de beneficiarios de un plan
Variables continuas:
Entre dos valores dados, existen valores intermedios
Ejemplos: edad, peso, altura, ingreso
Variable Dicotómica:
Sólo puede tomar dos valores (sí – no, 0 – 1, hombre – mujer, bueno – malo, encendido – apagado).
VARIABLES DEL DISEÑO EXPERIMENTAL
Tipo Acción
V. Independient
e Manipulación
V. Dependiente Medición
V. Extraña Control Variable Papel
V. Independient
e Causa
V. Dependiente Efecto
V. Extraña Confusión
DISEÑOS EXPERIMENTALES
• El diseño experimental es una estructura de investigación donde al menos se manipula una variable y las unidades son asignadas aleatoriamente a los distintos niveles o categorías de la variable o variables manipuladas.
• Se trata de un diseño estadístico, el mismo debe tener en cuenta la estructura del estudio, y todos los aspectos concernientes a la recolección de datos, incluido el tipo de mediciones a realizar y la frecuencia de las mismas.
DISEÑOS EXPERIMENTALES
• Es el proceso de planear un experimento para obtener datos apropiados, que pueden ser analizados mediante métodos estadísticos, con objeto de producir conclusiones válidas y objetivas.
X’sFactores
De control
Y´s respuestas
Z’s factores no controlables
ELEMENTOS DEL DISEÑO DE EXPERIMENTOS
El diseño de experimentos se refiere a la estructura del experimento considerando:
i) El conjunto de tratamientos incluidos en el estudio.
ii) El conjunto de unidades experimentales utilizadas en el estudio.
iii) Las reglas y procedimientos por los cuales los tratamientos son asignados a las unidades experimentales (o viceversa).
iv) Las medidas o evaluaciones que se hacen a las unidades experimentales luego de aplicar los tratamientos
¿QUÉ ES UN EXPERIMENTO DISEÑADO?
Proceso
Entradas Salidas (Y)
Diseño deProducto
Entradas Salidas (Y)
Cambios deliberados y sistemáticos de las variables de entrada (factores) para observar los cambios correspondientes en la salida (respuesta).
REQUISITOS DE UN EXPERIMENTO
• El primer requisito es la manipulación intencional de una o más variables independientes. Es decir la variable independiente es la que se considera como supuesta causa en una relación entre variables. Al efecto provocado por dicha causa se le denomina variable dependiente.
• Medir el efecto que la variable independiente tiene en la variable dependiente.• Maneras de medir:• Cuestionarios• Escalas• Observación• Entrevistas• Mediciones fisiológicas• Análisis de contenido
• Hay dos requisitos importantes que debemos manejar a la hora de llevar a cabo un experimento.• Control • Validez interna
¿CÓMO SE LOGRAN EL CONTROL Y LA VALIDEZ INTERNA?
• Se logra cuando en un experimento tenemos grupos equivalentes en todo.
• Manipulación de la variable independiente.
• En un experimento se debe de tener por lo menos dos grupos a comparar.
• Esto debe de ser así para poder verificar si existen cambios significativos durante el experimento.
OBJETIVOS CONSECUCIÓN
Maximizar la variancia sistemática primaria
Mediante la adecuada elección de los valores de la variable independiente
Mediante la selección de un diseño adecuadoControl de las fuentes de variación secundarias
Aumentando la precisión en la medida de los registros y selección de sujetos homogéneosMinimizar la variancia del error
OBJETIVOS DE UN EXPERIMENTO
CLASIFICACIÓN POR VALIDEZ
• Pseudo-experimentales:• un grupo con una sola medida
X O• pretest-postest de un solo grupo
O1 X O2• dos grupos NO equivalentes
G1 X O1G2 O2
CLASIFICACIÓN POR VALIDEZ
• Cuasi-experimentales:• Dos grupos no equivalentes con pre-
postest G1 O1 X O2G2 O3 O4
• Dos muestras separadas con pretest-postest
G1 O1 XG2 X O2
CLASIFICACIÓN POR VALIDEZ
• Experimentales:• Dos grupos equivalentes con pretest -
postest G1 X O1G2 O2
CLASIFICACIÓN POR NÚMERO FACTORES
• Simples: una Variable Independiente• Factoriales: más de una V.I.
Estudio de la interacción
V 1
V 2V 2
V 1
EXPERIMENTOS FACTORIALES
• Totalmente aleatorizado: (A x B)• Ejemplo: Conocimiento x Coherencia (2 x 2)
• Efecto Conocimiento (A)• Efecto Coherencia (B)• Efecto Interacción (A*B)
• Medidas Repetidas: • Mismo grupo, medido varias veces
• Mixto: Entre-sujetos e Intra-sujetos
EXPERIMENTOS FACTORIALES
• Bloques al azar:• Variables que influye validez interna• Bloque como factor
• Jerárquicos o anidados• Evitar todas las combinaciones de un factor
A B C D
Procedimiento 1 Procedimiento 2
Centro
DISEÑOS EVOLUTIVOS
-Foco: cambios en el tiempo
-Tipos:
- Longitudinal: cambios de un grupo de participantes
- Transversal: distintos grupos (de diferentes edades)
- Secuencial: combinación longitudinal + transversal
Técnicas de control
Experimental o directo: Diseño
Estadístico o indirecto: Ajuste
Técnicas de control asociadas al diseño
Aleatorización Diseños de grupos completamente al azar
Constancia Diseños de dos grupos apareados y de bloques
El sujeto como control propio
Diseños intra-sujetos o de medidas repetidas
Técnica de control Diseño
CLASIFICACIÓN DEL DISEÑO EXPERIMENTAL CLÁSICO
Diseños experimentales
Diseños entre-grupos
Diseños intra-sujetos o de medidas repetidas
Simple
Factorial
Diseños mixtos
Simple
Factorial
ESTRATEGIA DE COMPARACIÓN
CANTIDAD DE VARIABLES
INDEPENDIENTES
EL DISEÑO DE EXPERIMENTOS TIENE COMO OBJETIVOS DETERMINAR:
• Las X’s con mayor influencia en las Y’s
• El mejor valor de X’s para lograr Y’s nominales
• El mejor valor de X’s de manera que la variabilidad de Y sea pequeña
• El mejor valor de las X’s de manera que se minimizen los efectos de las Z’s – Proceso robusto
DISEÑO DE DOS GRUPOS
• Una de las situaciones más simples de investigación experimental, es la formada por dos grupos, uno de control y otro experimental.
Técnica de control Diseño
Aleatorización Diseño de dos grupos completamente al azar
ConstanciaDiseño de dos grupos apareados Diseño de bloques de dos tratamientos
El sujeto como control propio
Diseños de medidas repetidas (Sujetos x Tratamientos)
FORMATO DEL DISEÑO DE DOS GRUPOS COMPLETAMENTE AL AZAR
SUJETOS
SUJETOS
A2
(Grupo control)
A1
(Grupo experimental)
SUJETOS
SUJETOS
A2
(Grupo control)
A1
(Grupo experimental)
Muestra experimental Asignación al azar
FORMATO DEL DISEÑO DE DOS GRUPOS EMPAREJADOS
SUJETOS
SUJETOS
A2
(Grupo control)
A1
(Grupo experimental)
SUJETOS
SUJETOS
A2
(Grupo control)
A1
(Grupo experimental)
Muestra experimental Asignación al azar
S1, S2
S3, S4
S5, S6
…
DISEÑOS MULTIGRUPO
• Los diseños multigrupo, son estructuras de una sola variable independiente a tres o más valores o niveles. Al seleccionar más de dos valores de la variable independiente o causal, es posible extraer la relación funcional entre la variable independiente y dependiente del experimento.
Técnicas de control Diseño
Aleatorización Diseño multigrupo (de tres o más grupos completamente al azar)
ConstanciaDiseño de bloques de grupos al azar
El sujeto como control propio
Diseño de medidas repetidas con tres o más tratamientos (Sujetos x Tratamientos)
DISEÑO MULTIGRUPO AL AZAR
• El diseño multigrupo completamente al azar requiere la asignación aleatoria de los sujetos de la muestra a los distintos grupos, sin restricción alguna. Se trata de una extensión del diseño de dos grupos, ya que en esta situación se eligen de la variable de tratamiento más de dos valores o condiciones.
DISEÑO MULTIGRUPO AL AZAR
Muestra experimental
Asignación aleatoria
Tratamientos
.…………
A1 A2 … Aj … Aa
Sujetos
Sujetos
Sujetos
Prueba de significación general
Si la V. Independiente es categórica
Si la V. Independiente es cuantitativa
ANOVA unidireccional
Comparaciones múltiples
Análisis de tendencias
DISEÑO MULTIGRUPO AL AZAR
DISEÑO DE BLOQUES DE GRUPOS AL AZAR
• El principal objetivo de la experimentación es el control de las fuentes de variación extrañas. La neutralización o control de las variables extrañas incide directamente en la reducción de la variación del error. Es decir, las unidades varían con respecto a cualquier variable a excepción de la controlada. Siendo esto así, el margen de variación es menor que con la presencia de la variable extraña (o variable no controlada).
TÉCNICA DE BLOQUES
• Mediante la técnica de bloques se pretende conseguir una mayor homogeneidad entre los sujetos o unidades experimentales intra bloque y una reducción del tamaño del error experimental. La formación de bloques homogéneos se realiza a partir de los valores de una variable de carácter industrial, biológico o social, altamente relacionada con la variable dependiente.
Bloques TratamientosA1 A2 ··· Aj ··· Aa
………………………………………..…………………………….………….
n1 n2 nj na··· ···
B1
B2
Bk
n1 n2 nj na··· ···
n1 n2 nj na··· ···
FORMATO DEL DISEÑO DE BLOQUES
VENTAJAS DE LA TÉCNICA DE BLOQUES
• Se neutraliza una potencial fuente de variación extraña que, en caso contrario, incrementaría la variación del error.
• Mediante la técnica de bloques se consigue un material experimental mucho más homogéneo, se reduce la magnitud del error experimental y se incrementa el grado de precisión del experimento.
DISEÑO FACTORIAL
• El diseño factorial, como estructura de investigación, es la combinación de dos o más diseños simples (o unifactoriales); es decir, el diseño factorial requiere la manipulación simultánea de dos o más variables independientes (llamados factores), en un mismo experimento.
Cantidad de niveles por factor 2x2, 2x2x2, 2x3, 2x3x4, etc.
Grado de control
Diseño factorial completamente al azarDiseño factorial de bloques
EFECTOS FACTORIALES ESTIMABLES
1. Efectos simplesEl efecto puntual de una variable independiente o factor para cada valor de la otra.2. Efectos principalesSon el impacto global de cada factor considerado de forma independiente, es decir, el efecto global de un factor se deriva del promedio de los dos efectos simples. 3. Efectos secundariosEl efecto secundario o de interacción se define por la relación entre los factores o variables independientes, es decir, el efecto cruzado.
FORMADO DEL DISEÑO FACTORIAL 2 X 2 COMPLETAMENTE AL AZAR
SUJETOS
A1B1
SUJETOS
A1B2
SUJETOS
SUJETOS
A2B2A2B1
SUJETOS
A1B1
SUJETOS
A1B2
SUJETOS
SUJETOS
A2B2A2B1
Muestra experimental
Asignación al azar
REPRESENTACIÓN GRÁFICA DE LA INTERACCIÓN
A1 A2
B1
B2
Interacción nula
A1 A2
B2
B1
Interacción positiva
A1 A2
B2
B1
Interacción negativa
A1 A2
B1
B2
Interacción inversa
A1 A2
B1
B2
Interacción inversa
A1 A2
B1
B2
Interacción inversa
VENTAJAS DEL DISEÑO FACTORIAL
• La disposición bifactorial aporta información no sólo de cada factor (efectos principales), sino de su acción combinada (efecto de interacción o efecto secundario). De esta forma, con la misma cantidad de sujetos requerida para experimentos de una sola variable independiente o factor, el investigador puede estudiar, simultáneamente, la acción de dos o más variables manipuladas.
• Ello supone un enorme ahorro de tiempo y esfuerzo. Si se tiene en cuenta la posibilidad de analizar la acción conjunto o cruzada de las variables, se concluye que el diseño factorial es una de las mejores herramientas de trabajo.
DISEÑO DE MEDIDAS REPETIDAS
• El diseño de medidas repetidas es una extensión del diseño de bloques, en que el sujeto sustituye al bloque y actúa de control propio. Con este formato, los sujetos de la muestra reciben todos los tratamientos y repiten medidas o registros de respuesta; asimismo, la comparación de los tratamientos es intra-sujeto.
• De este modo, el uso del procedimiento de medidas repetidas proporciona un control más efectivo de las fuentes de variación extrañas asociadas, por lo general, a las características individuales; es decir, se consigue una reducción de la variancia del error.
EFECTOS DE ORDEN
Los efectos de orden se derivan de la propia estructura del diseño de medidas repetidas, y deben ser neutralizados para que no confundan los efectos de los tratamientos.
A) Efecto residualB) Efecto de período
EFECTO RESIDUAL
• El efecto residual, conocido por error progresivo, se caracteriza por la persistencia de la acción de un tratamiento más allá del período o tiempo de aplicación. Representa la progresiva acumulación tanto de los efectos facilitadores de la respuesta (efecto de la práctica, aprendizaje, etc.) como de los efectos obstaculizadores (como la fatiga mental, cansancio físico, etc.)
Solución: ampliar los intervalos entre tratamientos.
EFECTO DE PERÍODO
• Los efectos de período ocurren cuando, independientemente del tratamiento aplicado, el sujeto responde al período o posición que, en la secuencia, ocupa el tratamiento (período de administración). Cabe, por lo tanto, la posibilidad de que el sujeto responda mejor al período que al tratamiento en sí mismo. Cuando esto ocurre, el efecto de período confunde la acción del tratamiento.
Solución: contrabalanceo
DISEÑO DE MEDIDAS REPETIDAS SIMPLE DE UN GRUPO
• El diseño simple de medidas incorpora la estrategia de comparación intra-sujeto. Los sujetos se cruzan o combinan con los tratamientos (Sujetos x Tratamientos). Así mismo, es un diseño simple o unifactorial porque sólo se evalúa la acción de una variable independiente o de tratamientos.
• La principal ventaja del diseño, dada su especial disposición, es la posibilidad de extraer del error una de sus fuentes de variación más importante: la variación atribuida a las diferencias individuales.
ESTRUCTURA DEL DISEÑO
• A diferencia del diseño factorial, la variable de sujetos no es manipulada, ya que se trata de un pseudo-factor. La variable de tratamientos está manipulada por el experimentador y es considerada como un auténtico factor.
DISEÑO DE MEDIDAS REPETIDAS SIMPLE (S X A)
A1 A2 ........ Aa
Sujeto 1 Sujeto 1 ........ Sujeto 1
Sujeto 2 Sujeto 2 ........ Sujeto 2
..........................................................
Sujeto N Sujeto N ........ Sujeto N
DISEÑO DE MEDIDAS REPETIDAS FACTORIAL (S X A X B)
A1B1 A1 B2 A2B1 A2B2
Sujeto 1 Sujeto 1 Sujeto 1 Sujeto 1
Sujeto 2 Sujeto 2 Sujeto 2 Sujeto 2
....................................................................
Sujeto N Sujeto N Sujeto N Sujeto N
DISEÑO DE MEDIDAS REPETIDAS MULTIGRUPO O FACTORIAL MIXTO
• El diseño de medidas repetidas multigrupo, conocido también por diseño factorial mixto, incorpora dos estrategias de inferencia de hipótesis: estrategia de comparación entre grupos y estrategia de comparación intra sujetos. La estructura mixta combina, en un mismo experimento, el procedimiento de grupos independientes y el procedimiento con sujetos de control propio.
DISEÑO DE MEDIDAS REPETIDAS MULTIGRUPO O FACTORIAL MIXTO
• Puesto que el diseño mixto integra, en un mismo estudio, dos enfoques de investigación se aplica a aquellas situaciones donde están presentes, por lo menos, dos variables independientes. Así, los valores o niveles de la primera variable independiente genera grupos separados y su efecto se infiere por la comparación entre grupos o entre sujetos.
DISEÑO DE MEDIDAS REPETIDAS MULTIGRUPO O FACTORIAL MIXTO
• Esta variable independiente es conocida como variable entre. Los valores de la segunda variable se administran a todos los sujetos, en cuyo caso los sujetos repiten medidas. Dado el carácter de repetición, esa segunda variable recibe el nombre de variable intra. De esto se concluye que el diseño mixto requiere siempre una estructura factorial. Por lo tanto, son experimentos donde intervienen como mínimo dos variables.
FORMATO DEL DISEÑO DE MEDIDAS REPETIDAS DE DOS GRUPOS
Muestra experimental
B1 B2 B3
Sujeto 1 Sujeto 1 Sujeto 1
Sujeto 2 Sujeto 2 Sujeto 2
...................................................
Sujeto N Sujeto N Sujeto N
Asi
gnac
ión
al a
zar
Sujeto 1 Sujeto 1 Sujeto 1
Sujeto 2 Sujeto 2 Sujeto 2
...................................................
Sujeto N Sujeto N Sujeto N
A1
A2
FACTOR INTRA
FA
CT
OR
EN
TR
E
MUESTREO
• Población: Conjunto de unidades de las que se desea obtener cierta información.
• Muestra: Selección de unas unidades concretas de la población que representen la característica que se quiere medir.
• Procedimiento por el cual se extrae, de un conjunto de unidades que constituyen el objeto de estudio (población), un número de casos reducido (muestra) elegidos con criterios tales que permitan la generalización a toda la población de los resultados obtenidos al estudiar la muestra.
RAZONES DE MUESTREO
• Disminución de costos ( tiempo, personal, material)
• Al disminuir el número de casos disminuyen también los errores asociados a la manipulación de los datos.
• Puede confiarse en la generalización de los resultados si se ha tenido cuidado al seleccionar la muestra.
CRITERIOS IMPORTANTES PARA LA SELECCIÓN DE LA MUESTRA
• Salvo en poblaciones muy pequeñas y accesibles nunca se observan a todas las unidades de la población.
• Se debe diseñar una muestra que constituya una representación a pequeña escala de la población a la que pertenece.
• Cualquier diseño muestral comienza con la búsqueda de la información que ayude a la identificación de las características de la población bajo estudio
TAMAÑO DE LA MUESTRA
• Es el número de unidades a incluir en la muestra. • Existen varios factores que influyen en el:
• Tiempo y recursos disponibles• Modalidad de Muestreo • Tipo de Análisis Previsto• Varianza o heterogeneidad de la población• Margen de Error máximo admisible• Nivel de confianza de la estimación muestral
TIPOS DE MUESTREOS
PROBABILÍSTICOS NO PROBABILISTICOS
•Todas las unidades tienen igualprobabilidad de participar enla muestra.•La elección de cada unidad muestral es independiente de lasdemás•Se puede calcular el error muestral
•Cada unidad NO tiene igualprobabilidad de participar enla muestra.•No se puede calcular el error muestral•Alto riesgo de invalidez producido por la introducción de sesgos
USOS DE CADA TIPO DE MUESTREO
Muestreo Probabilísticos
• Estimación de Parámetros
• Comprobación de Hipótesis
Muestreos No Probabilísticos
• Estudios Pilotos• Estudios Cualitativos• Investigaciones en
poblaciones de difícil registro o localización ( Ej. Marginales, prostitutas, enfermos de VIH, etc…)
RECORDANDO: TIPOS DE MUESTREOS
PROBABILÍSTICOS NO PROBABILISTICOS
•Todas las unidades tienen igualprobabilidad de participar enla muestra.•La elección de cada unidad muestral es independiente de lasdemás•Se puede calcular el error muestral
•Cada unidad NO tiene igualprobabilidad de participar enla muestra.•No se puede calcular el error muestral•Alto riesgo de invalidez producido por la introducción de sesgos
EJEMPLO: ¿MUESTREO PROBABILÍSTICO?
• Se realiza un muestreo entre los alumnos que van a clases de la Materia Metodología, eligiéndolos al azar a la entrada del salón.
Este diseño es NO probabilístico porque aquellos que no van a clases NO PUEDEN ser elegidos
EJEMPLO: ¿MUESTREO PROBABILÍSTICO?
• Se utiliza la lista de propietarios de líneas telefónicas para elegir a aquellos que serán encuestados.
Este diseño es NO Probabilístico porque aquellos que no tienen teléfono NO PUEDEN ser elegidos
EJEMPLO: ¿MUESTREO PROBABILÍSTICO?
• Un investigador toma muestras del carbón extraído de una mina, tomando al azar trozos de carbón de la parte superior de cada carro.
Este diseño es NO probabilístico porque solo se toma carbón
de la parte superior
FACTORES QUE INFLUYEN EN EL TAMAÑO DE LA MUESTRA
La técnica de análisis influye en el tamaño de la muestra:
• Comparación de Medias• Estimación de Proporciones
( parámetros) • Análisis Univariables• Análisis Multivariables
HETEROGENEIDAD POBLACIONAL
• Cuanto mas heterogénea sea la población mayor será su varianza poblacional lo que implicará mayores tamaños muestrales.
• Cuando se desconoce el valor de la varianza poblacional se recurre al supuesto mas desfavorable, asumiendo una varianza poblacional igual a 0,5.
• 0,5 significa que una unidad seleccionada tiene 50 % de posibilidades de pertenecer o no a un grupo específico dentro de la población.
MUESTREOS PROBABILÍSTICOS: SIMPLE
• Se realiza utilizando alguna fuente de elección aleatoria.
• Supone que cada miembro de la población tiene elemento que lo identifica ( ej. Un número identificador) y mediante el cual puede ser elegido si “sale” sorteado.
• La afirmación anterior implica que hay que tener un listado completo de TODOS los miembros de la población.
MUESTREOS PROBABILÍSTICOS: SIMPLE
• Ventajas• Facilidad en los cálculos
estadísticos
• Elevada probabilidad de lograr “equivalencia” entre las características de la muestra y las correspondientes a la población
• Desventajas• Cada que cada miembro
de la población tiene que ser identificado
• Complicado en poblaciones grandes
• Alto costo
MUESTREOS PROBABILÍSTICOS: MUESTREO ALEATORIO SISTEMÁTICO
Similar al muestro simple salvo que:• Solo la primera unidad de la muestra se elige
al azar siempre que el número seleccionado sea mayor que el coeficiente de elevación.
• Coeficiente de Elevación = N/ n • Donde
• N: Tamaño de la población• n : Tamaño de la muestra
• Los restantes elementos de la muestra se hayan sumando, sucesivamente el coeficiente de elevación.
MUESTREOS PROBABILÍSTICOS: MUESTREO ALEATORIO ESTRATIFICADO
• Presupone el conocimiento de las características de las unidades que forman la población para poder dividirla en grupos ( estratos)
• Se eligen los miembros de la muestra en cada estrato creado siguiendo algún tipo de muestreo de los vistos anteriormente.
EJ. MUESTREO PROBABILÍSTICO POR ESTRATOS
Universidad
Facultad de Ingeniería
Carrera 1
Profesores
Carrera 2
Profesores
Facultad de ciencias
Carrera 1
Profesores
Carrera 2
Profesores
Estrato Primario
MUESTREO ALEATORIO ESTRATIFICADO
El objetivo de este tipo de muestreo es garantizar la representatividad equitativa de los estratos ( que implica representación equitativa de las características de la población).Se logra si:
• Son máximas las diferencias entre los estratos.• Son mínimas las diferencias entre los miembros
de un mismo estrato. • Los criterios de división de la población en
estratos se hallen relacionadas con los objetivos de la investigación.
MUESTREO ALEATORIO ESTRATIFICADO
Los tamaños de cada estrato pueden ser:• Los mismos ( Afiliación simple).• Proporcional al peso relativo ( tamaño)
del estrato dentro de la población (Proporcional).
• En función de la heterogeneidad de cada estrato ( Óptima).
VENTAJAS Y DESVENTAJAS
1. No es necesario disponer de la lista de toda la población sino de las subpoblaciones de orden superior extraídas ( por ej. las escuelas primarias y secundarias)
2. Existe una considerable reducción de costos
• Puede ocurrir que los miembros de una unidad superior se parezcan, reduciendo la representatividad de otros en la muestra final.
Ventajas Desventajas
MUESTREO ALEATORIO POR CONGLOMERADOS
• La unidad muestral es un grupo de elementos de la población que forman una unidad, a la que llamamos conglomerado.
• A diferencia de un estrato, un conglomerado es una unidad de elementos que contienen representantes de toda la población.
Zona Geográfica
Edificio
Una institución
EJEMPLO: MUESTREO POR CONGLOMERADOS
Universidad
Facultad de Ingeniería
Carrera 1 Carrera 2
Facultad de Ciencias
Carrera 1 Carrera 2
Todos los profesores de las Carrera 2 (F. Ingeniería) y Carrera 1 (F. Ciencias) son parte de la muestra
VENTAJAS DEL MUESTREO POR CONGLOMERADOS
• Es ventajoso, desde el punto de vista de costos, si se pueden agrupar los miembros de la población por conglomerados, en los cuales el criterio de agrupación no sea la variable que se estudia.
• No es preciso tener un listado de toda la
población, sino de las unidades ( conglomerados) por los que se agruparán.
TIPOS DE MUESTREOS NO PROBABILÍSTICOS POR CUOTAS
• La población debe ser dividida en estratos definidos por variables cuya distribución dentro de la población sea conocida.
• Se procede a calcular el tamaño de cada estrato siguiendo el mismo procedimiento que si fuese un muestreo probabilístico estratificado. ( proporcional).
• A diferencia del M. Probabilístico Estratificado el entrevistador es libre para escoger a quienes forman parte de cada estrato. (CUOTA)
MUESTREO POR CUOTAS
• Resulta más económico que los muestreos probabilísticos .
• Fácil de ejecutar el trabajo de campo
• No precisa el listado de la población
• Supone mayor error muestral que los diseños probabilísticos.
• No existe un método válido para calcular el error.
• Dificultas para el control del trabajo de campo.
• Limitaciones en la representatividad de la muestra para las características no especificadas en los controles de cuotas.
Ventajas Desventajas
MUESTREO DE BOLA DE NIEVE
• Este modelo es particularmente útil cuando se muestrean poblaciones cuyos componentes, por motivos morales, ideológicos, legales o políticos tienen a ocultar su identidad.
• A partir de unos pocos individuos el entrevistador, con ayuda de los primeros, va “ conociendo” a nuevos miembros de la muestra.
• El riesgo fundamental está asociado a la selección inadecuada de los primeros miembros de la muestra y de quienes dependerá el resto.
• También es posible que ocurran distorsiones si no se tiene en cuenta criterios muy específicos para la selección de la muestra.
TAMAÑO DE LA MUESTRA
• Estimando qué proporción de sujetos poseen una característica al nivel de confianza del 99% (Z=2.56) y un error de admitido del 2%, será: R=4096
• El número óptimo para un estudio de 60.000 personas estableciendo un nivel de confianza de 95%(z=1.96), y el margen de error en el 3%, sería:R=1049
• Es necesario estimar entre 10.000 establos, el número de vacas lecheras por establo con un error de estimación de 4 y un nivel de confianza del 95%. Sabemos que la varianza es 1.000. ¿Cuántos establos deben visitarse para satisfacer estos requerimientos? R=235
TAMAÑO DE LA MUESTRA
• Para analizar el crecimiento de ratas de laboratorio se elige una muestra piloto de 13 ratas y se miden obteniendo una talla promedio de la muestra de 5.3 centímetros y una varianza muestral de 19.2 Pregunta: Un investigador desea determinar el tamaño de muestra mínimo usando un diseño MAS para estimar la talla promedio de las ratas en la población con una confianza de 95% y un error de estimación no mayor a 2 centímetros si en la población hay 200 ratas. ¿Cuántas ratas se debe elegir en la muestra? R=19
TAMAÑO DE LA MUESTRA
• En una fábrica de artículos electrónicos generalmente el 10% de los artículos presenta algún defecto de fabricación. Para analizar la calidad del producto se desea estimar la proporción de artículos electrónicos defectuosos de un lote de 2000 artículos listo para ser embarcado. ¿Cuántos artículos deben ser elegidos del lote si se desea una confianza de 95% y un error de estimación no mayor a 0.05?
TAMAÑO DE LA MUESTRA
• Para estudiar la imagen de diferentes empresas, se pide a los encuestados que los evalúen en una escala (continua) de 0 a 10 puntos. Si se acepta que la varianza de esta variable es de 1.5 puntos, ¿cuántos casos se necesitan para que la semi-amplitud del intervalo de confianza al 95% de la media poblacional sea de 0.05 puntos?
TAMAÑO DE LA MUESTRA
• Una máquina llena cajas con cierto cereal. El supervisor desea conocer con un error de estimación de máximo 0.1 y un nivel de confianza del 90%, una media estimada del peso. Como la varianza era desconocida se procedió a escoger una muestra piloto. Los resultados fueron los siguientes: 11.02, 11.14, 10.78, 11.59, 11.58, 11.19, 11.71, 11.27, 10.93, 10.94. ¿Cuántas cajas debe escoger para que se cumplan los requisitos propuestos?
TAMAÑO DE LA MUESTRA
• Se desea hacer una encuesta para determinar la proporción de familias que carecen de medios económicos para atender los problemas de salud. Existe la impresión de que esta proporción está próxima a 0.35. Se desea determinar un intervalo de confianza del 95% con un error de estimación de 0.05.
TAMAÑO DE LA MUESTRA
• Un productor de semillas desea saber con un error de estimación del 1% el porcentaje de semillas que germinan en la granja de su competidor. ¿Qué tamaño de muestra debe tomarse para obtener un nivel de confianza del 95%?
TAMAÑO DE LA MUESTRA
• Se desea realizar una encuesta entre la población juvenil de una determinada localidad para determinar la proporción de jóvenes que estaría a favor de una nueva zona de ocio. El número de jóvenes de dicha población es N=2,000. Determinar el tamaño de muestra necesario para estimar la proporción de estudiantes que están a favor, con un error de estimación de 0.05 y un nivel de confianza del 95%.
TAMAÑO DE LA MUESTRA
• Determinar el número de profesionales a encuestar en una región donde se estima en 4500 el número de ellos. El objetivo del estudio es determinar entre otras cosas, la intencionalidad de seguir estudios de maestría, con una prueba piloto de 20 profesionales, se determinó que la proporción de profesionales con afán de continuar sus estudios era del 25%. La confiabilidad del estudio, dado que sus resultados serán validados con otras fuentes se definió en el 90%, el error puede estar entre el 4 y el 6%, dependiendo de los costos se definirá cual tamaño seleccionar.
TAMAÑO DE LA MUESTRA
• De una población de 1 176 adolescentes, de la ciudad de SLP, se pretende conocer la aceptación de una barra energetica. Se desea tomar una muestra para saber la cantidad de adolescentes a entrevistar y con ello tener una información adecuada, con un error standard de 1.5% al 90% de confiabilidad.
TAMAÑO DE LA MUESTRA
• Suponga que decide llevar a cabo un estudio comparativo del costo de una comida en un restaurante de una gran ciudad con el de una comida similar en un restaurante fuera de la ciudad. La siguiente tabla muestra los datos de 50 restaurantes citadinos y 50 fuera de la ciudad. Con un intervalo de confianza de 90% y un error de 5 pesos, ¿Cuántos restaurantes debo seleccionar para estimar el costo de los platillos?.
• Para la elección y desarrollo del instrumento de medición se debe tomar en cuenta el objetivo de la investigación.
• La metodología utilizada en la recolección de datos debe estar acorde con el enfoque conceptual que se ha desarrollado en el estudio.
MÉTODOS, TÉCNICAS DE RECOLECCION DE DATOS E INSTRUMENTOS DE MEDICION
• Al momento de definir como se va a abordar la recolección de los datos, se debe definir el tipo de información requerida (cuantitativa, cualitativa o ambas).
• Método: Representa la estrategia concreta e integral de trabajo para el análisis de un problema coherente con la definición teórica del mismo y con los objetivos de la investigación.
• Tipo de Método: observación, entrevista y la encuesta.
MÉTODOS, TÉCNICAS DE RECOLECCION DE DATOS E INSTRUMENTOS DE MEDICION
• Técnica: conjunto de reglas y procedimientos que permiten al investigador establecer la relación con el objeto o sujeto de la investigación.
• Instrumento: mecanismo que usa el investigador para recolectar y registrar la información; formularios,pruebas, test, escalas de opinión, listas de chequeo.
MÉTODOS, TÉCNICAS DE RECOLECCION DE DATOS E INSTRUMENTOS DE MEDICION
• El método orienta la técnica, pueden existir distintas técnicas de recolección de información, pero no varios métodos, sin ser validados como tales.
• En investigación cuantitativa el investigador puede usar varias técnicas; entrevistas y cuestionarios, ayudados por entrevistas grupales, historias de vida y observación etnográfica. (cualitativas)
MÉTODOS, TÉCNICAS DE RECOLECCION DE DATOS E INSTRUMENTOS DE MEDICION
1- Fuentes Primarias: Se obtiene información por contacto directo con el sujeto de estudio; por medio de observación, cuestionarios, entrevistas, etc.
2- Fuentes Secundarias: Información obtenida desde documentos; historia clínica, ficha académica, estadísticas, datos epidemiológicos, Censo, encuestas nacionales, etc.
MÉTODOS, TÉCNICAS DE RECOLECCION DE DATOS E INSTRUMENTOS DE MEDICION
1- LA OBSERVACIÓN: Es el registro visual de lo que ocurre en una situación real, clasificado y consignando los datos de acuerdo con algún esquema previsto y de acuerdo al problema que se estudia.
• Ventajas:• Permite registrar datos cualitativos y cuantitativos.• Se observan características y condiciones de los individuos.• Puede ser utilizada en cualquier tipo de investigación y en
cualquier área del saber.• Es un método que no depende de terceros o de registros.
FUENTES DE INFORMACÌÓN
• Desventajas:• Se requiere de mucha habilidad y agudeza para “ver” los
fenómenos estudiados.• Demanda gran cantidad de tiempo.• Tiene sesgos; el humano ve lo que quiere ver.• Al momento de la interpretación pueden distorsionarse los
hechos e ir más allá de lo que vimos en realidad.
• Para reducir los problemas se utiliza:• Definir claramente los objetivos perseguidos.• Determinar claramente la unidad de observación.• Las condiciones en que se asumirá la observación y las
conductas que deberán registrarse.
LA OBSERVACIÓN
1- La Observación Participante: El investigador se involucra total o parcialmente con la actividad objeto de investigación.• La observación se hace desde el interior del grupo.• Pueden intervenir las emociones del investigador.
2- La Observación NO Participante:El investigador no se involucra en la actividad objeto de estudio.• Los datos pueden ser más objetivos.• Al no integrarse al grupo los datos pueden no ser exactos.
• “Todos los errores de la observación se pueden minimizar por medio de una buena definición operacional de las variables.”
LA OBSERVACIÓN
1-La Observación Simple, No estructurada, No regulada, No controlada: El investigador utiliza lineamientos generales para observar y luego escoge lo que estima relevante a los efectos de la investigación propuesta.Fundamentalmente usada para estudios exploratorios.
2- La Observación Sistemática, estructurada, regulada o controlada: El investigador dispone de un instrumento estructurado y estandarizado para medir las variables en estudio de una manera uniforme.Se utiliza para probar hipótesis en que se especifica claramente que se estudia.Se usan listas de cotejo, grabadoras, filmadoras, etc.
FORMAS DE OBSERVACIÓN
• Cuando los fenómenos a observar no se dan de la misma manera en todos los sujetos de observación.
• Cuando el observador tiene ideas prejuiciadas.
• Cuando el instrumento no es válido, es inexacto o está mal definido.
ERRORES RELACIONADOS CON LA OBSERVACIÓN
• Consiste en obtener información de los sujetos en estudio, proporcionados por ellos mismos, sobre opiniones, conocimientos, actitudes o sugerencias.
• Existen dos maneras de obtener información: 1- La Entrevista: Las respuestas son formuladas
verbalmente y se necesita de la presencia del entrevistador. y
2- El Cuestionario: Las respuestas son formuladas por escrito y no se requiere de la presencia del investigador.
LA ENCUESTA
• Comunicación interpersonal entre el investigador y el sujeto de estudio a fin de obtener respuestas verbales a las interrogantes planteadas sobre el problema propuesto.
• Ventajas:• Es aplicable a toda persona (muy útil con analfabetos, niños o
en aquellos con alguna limitación física o psicológica).• Permite estudiar aspectos psicológicos o de otra índole donde
se desee profundizar en el tema.• Permite obtener información más completa.• A través de ella el investigador puede: Aclarar el propósito del
estudio, especificar claramente la información que necesita, aclarar preguntas y permite usar triangulación.
• Permite captar mejor el fenómeno estudiado ya que permite observar lenguaje no verbal.
LA ENTREVISTA
1- ENTREVISTA ESTRUCTURADA.• Se elabora un formulario estandarizado.• Idénticas preguntas y en el mismo orden a todos los sujetos.• Los sujetos eligen la respuesta de 2, 3 o pocas más alternativas.• Los comentarios y explicaciones son los mismos para todos.
• Ventajas:• Respuestas cortas y precisas.• Información fácil de procesar.• El entrevistador no requiere de gran entrenamiento.• Información uniforme.
• Desventajas:• La información puede ser muy superficial.• Limitada la posibilidad de profundizar en un aspecto
determinado.• Difícil obtener información confidencial.
TIPO DE ENTREVISTA
2- ENTREVISTA NO ESTRUCTURADA.• Es flexible y abierta, pero regida por los objetivos de la
investigación.• Las preguntas, su contenido, orden y formulación es
controlado por el investigador, el que puede adaptarlas dependiendo de las situaciones y características de los sujetos en estudio.
• El entrevistado también cuenta con libertad para dar sus respuestas.
• Se utiliza un instrumento guía que contiene las orientaciones de los temas a tratar.
• Muy útil para estudios exploratorios, descriptivos y cualitativos.
• Ventajas:• Adaptable y aplicable a toda clase de sujetos en diversas
situaciones.• Permite profundizar en los temas de interés.• Orienta posibles hipótesis y variables cuando se exploran
áreas nuevas.
TIPO DE ENTREVISTA
• Desventajas:• Requieren mucho tiempo.• Muy costosos por el tiempo de las entrevistas.• Limitado para personas con problemas de comunicación.• Dificultad para tabular datos que han sido recopilados de
distinta forma.• Se requiere crear confianza y comodidad entre el
entrevistado y el entrevistador.• Se requiere habilidad técnica para obtener la información y
mayor conocimiento respecto del tema.• Debido a que son entrevistas en profundidad habitualmente
se utilizan muestras pequeñas.
TIPO DE ENTREVISTA
• Para evitar el rechazo o atrasos al aplicar entrevistas:• Establecer los contactos necesarios para el buen fin de las
entrevistas.• Entrevistador debe estar bien capacitado. El entrevistador
debe establecer una buena comunicación con el entrevistado, uso de vestuario adecuado, lenguaje adecuado, escuchar adecuadamente, no apresurar al entrevistado, etc.
• Buen registro de la información a fin de poder interpretarla adecuadamente.
• El entrevistador debe:• Dejarle un mensaje positivo al entrevistado.• Jamás dar consejos,• Jamás hacer juicios morales,• Jamás rebatir al entrevistado.
CONSIDERACIONES PARA LAS ENTREVISTAS
• Método que utiliza un instrumento o formulario impreso, destinado a obtener respuestas sobre el problema en estudio y que el sujeto investigado llena por sí mismo.
• El cuestionario puede aplicarse a grupos o individuos estando presente el investigador.
• Incluso puede enviarse por correo a los destinatarios.• Ventajas:
• Costo relativamente bajo.• Proporciona información sobre un mayor número de personas en
un período breve.• Fácil para obtener, cuantificar, analizar e interpretar datos.• Menores requerimientos de personal capacitado.• Mayor posibilidad de mantener anonimato de los encuestados.• Eliminación de los sesgos que introduce el encuestador.
CUESTIONARIO
• Desventajas:• Es poco flexible, la información no puede variar ni profundizarse.• Si el cuestionario se envía por correo, es posible que no sean
devueltos o que no se obtengan respuestas.• No utilizable en personas que no saben leer ni escribir.• No permite aclarar dudas.• Resulta difícil obtener cuestionarios completamente contestados.• Se deben obtener grandes muestras.
En general, el proceso de recolección de información para una investigación, métodos, técnicas e instrumentos y las fuentes de las mismas suelen combinarse, cada uno de ellos con sus ventajas y desventajas.
CUESTIONARIO
Se requiere verificar la calidad de la información con la finalidad que tengamos información real y sin errores (o con el mínimo error posible)
Esto se puede realizar mediante:
Revisión manual: se revisa la información de forma independiente.A pesar que este proceso no ofrece garantías, es mejor que sólo ingresar la información
Revisión de valores inconsistentes: La intención es no contar con valores inverosímiles, es decir, que los datos estén registrados dentro de los rangos reales que esa variable puede asumir
VALIDACIÓN DE LA BASE DE DATOS
Cotejo cruzado de bases independientes: Un capturista ingresa la información y otro ingresa la misma también de forma independiente. Luego de ello se realiza el contraste a través de un software. Se puede observar: inconsistencia entre las bases. Es el más usado.
Imputación de datos: Los procesos de limpieza de base de datos implican el tratamiento para los valores perdidos (el dato no se pudo recolectar pese a todos los esfuerzos)
Imputar es introducir un dato probable a partir de la información que se recolectó. Se necesitan que se cumplan:-Una serie de supuestos-Modelos matemáticos para su estimación-Proporción de datos a imputar muy pequeña.
VALIDACIÓN DE LA BASE DE DATOS
ELEMENTOS DE ESTADÍSTICA
• La Estadística es una ciencia que facilita la solución de problemas en los cuales necesitamos conocer características sobre el comportamiento de algún suceso o evento.
• Nos permite inferir el comportamiento de sucesos iguales o similares sin necesidad de que estos ocurran.
ETAPAS DE UN ESTUDIO ESTADÍSTICO
• Planteamiento del problema: consiste en definir el objetivo de la investigación y precisar el universo o población.
• Recogida de la información: consiste en recolectar los datos necesarios relacionados al problema de investigación.
• Análisis descriptivo: consiste en resumir los datos disponibles para extraer la información relevante en el estudio.
• Inferencia estadística: consiste en suponer un modelo para toda la población partiendo de los datos analizados para obtener conclusiones generales.
• Diagnóstico: consiste en verificar la validez de los supuestos del modelo que nos han permitido interpretar los datos y llegar a conclusiones sobre la población
ETAPAS DE UN ESTUDIO ESTADÍSTICO
Esquema de las etapas de un estudio estadístico
AREA DE INTERES DATOS
Tema de Investigación-Antecedentes Previos -Objetivos-Preguntas de Investigación-Posibles Hipótesis-Unidad de Análisis-Población-Variables
ORGANIZAR Y RESUMIR
ESTADÍSTICA DESCRIPTIVA (Tablas, Gráficos, Medidas Descriptivas, etc.)
INTERPRETACIÓN
INFERENCIA ESTADÍSTICA
¿Población o Muestra?
CONCLUSIONES
Población
Muestra
ProbabilidadINFORMACIÓN
ETAPAS DE UN ESTUDIO ESTADÍSTICO
La Estadística es la Ciencia de la
• Sistematización, recogida, ordenación y presentación de los datos referentes a un fenómeno que presenta variabilidad o incertidumbre para su estudio metódico, con objeto de
• deducir las leyes que rigen esos fenómenos,
• y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones.
Descrip
tiv
a
Probabili
da
d
Infe
rencia
ESTADÍSTICA DESCRIPTIVA
• Centralización o Tendencia central o promedios• Indican valores con respecto a los que los datos
parecen agruparse.• Media, mediana y moda
• Posición• Dividen un conjunto ordenado de datos en grupos con
la misma cantidad de individuos.• Cuantiles, percentiles, cuartiles, deciles, quintiles...
• Forma• Asimetría• Apuntamiento o curtosis
• Dispersión o Variabilidad• Indican la mayor o menor concentración de los datos
con respecto a las medidas de centralización.• Desviación típica, coeficiente de variación, rango, varianza
LA MEDIA ARITMÉTICA[=PROMEDIO(RANGO)]
La media aritmética de una variable se define como la suma ponderada de los valores de la variable por sus frecuencias relativas y lo denotaremos por
y se calcula mediante las expresiones, según el caso:
x
n
i
iin
i
iin
i
i
n
nc
n
nx
n
xx
111
xi representa el valor de la variable; ci representa la marca de clase.
Para TDNA TF TI
LA MEDIANA[=MEDIANA(RANGO)]
Tendremos en cuenta el tamaño de la muestra. Si N es Impar, hay un término central, el término
Cálculo de la mediana en el caso de variables discretas
que será el valor de la mediana.2
1nX
Ejemplo: El conjunto de números 3,4,4,5,6,8,8,8 y 10 tiene mediana 6.
La mediana de un conjunto de números ordenados en magnitud es o el valor central o la media de los dos valores centrales.
LA MEDIANA
Si N es Par, hay dos términos centrales,
la mediana será la media de esos dos valores
Cálculo de la mediana en el caso de variables discretas
122
nXy
nX
2
122 n
Xn
X
Ejemplo: El conjunto de números 5,5,7,9,11,12,15 y18 tiene mediana 10
LA MODA[=MODA(RANGO)]
• La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que más se repite, es la única medida de centralización que tiene sentido estudiar en una variable cualitativa, pues no precisa la realización de ningún cálculo.
• Por su propia definición, la moda no es única, pues puede haber dos o más valores de la variable que tengan la misma frecuencia siendo esta máxima. En cuyo caso tendremos una distribución bimodal o polimodal según el caso.
ESTADÍGRAFOS DE POSICIÓN
• Se define el cuantil de orden a como un valor de la variable por debajo del cual se encuentra una frecuencia acumulada .a
• Casos particulares son los percentiles, cuartiles, deciles, quintiles,...
CUANTIL DE ORDEN Α[=PERCENTIL(RANGO;K)]
Los cuantiles son generalizaciones de la mediana. Los cuartiles dividen a los datos en cuatro partes iguales, los deciles
en diez, los quintiles en cinco, los percentiles en cien.
k
rnC
X
kr
5,314
342
43
X
Q
CUANTIL DE ORDEN
• Cuartiles (Q): Dividen a la muestra en 4 grupos con frecuencias similares.
• Primer cuartil = Percentil 25 = Cuantil 0,25• Segundo cuartil = Percentil 50 = Cuantil 0,50 = mediana• Tercer cuartil = Percentil 75 = Cuantil 0,75
• Quintiles (K): Dividen a la muestra en 5 grupos con frecuencias similares.• Primer quintil = Percentil 20 = Cuantil 0,20• Segundo quintil = Percentil 40 = Cuantil 0,40• Tercer quintil = Percentil 60 = Cuantil 0,60• Cuarto quintil = Percentil 80 = Cuantil 0,80
• Deciles (D): Dividen a la muestra en 10 grupos con frecuencias similares.• Tercer decil = Percentil 30 = Cuantil 0,30• Quinto decil = Percentil 50 = Cuantil 0,50 = mediana• Séptimo decil = Percentil 70 = Cuantil 0,70
• Percentiles (P) : Dividen a la muestra en 100 grupos con frecuencias similares.
• La mediana es el percentil 50• El percentil de orden 15 deja por debajo al 15% de las observaciones. Por
encima queda el 85%
Miden el grado de dispersión (variabilidad) de losdatos, independientemente de su causa.
• Amplitud o Rango [=max(rango)-min(rango)]
• La diferencia entre las observaciones extremas.• 2,1,4,3,8,4. El rango es 8-1=7• Es muy sensible a los valores extremos.
• Rango intercuartílico• [=CUARTIL(rango;3)-CUARTIL(rango;1)]
• Es la distancia entre el primer y tercer cuartil.• Rango intercuartílico = Q3 – Q1 = P75 - P25 = C0.75 – C0,25
• Parecida al rango, pero eliminando las observaciones más extremas inferiores y superiores.
• No es tan sensible a valores extremos.
MEDIDAS DE DISPERSIÓN
25% 25%25%25%
MUESTRA DE EDADES DE CINCO NIÑOS
• En una muestra de cinco niños se observa que éstos tienen las siguientes edades:
• 1, 1, 4, 8 y 9 .• En promedio tienen 4.6 años.• ¿Cuánta variabilidad hay en las edades de los
niños?• ¿A qué distancia quedan las edades observadas
de la media muestral 4.6 años?
DIFERENCIAS DE VALORES OBSERVADOS A LA MEDIA MUESTRAL
Distribucion de cinco observaciones
0
1
2
3
1 2 3 4 5 6 7 8 9 More
Edades observadas
Fre
cu
en
cia
Media muestral-3.6
-3.6
4.4
3.4-.6
DESVIACIÓN ABSOLUTA MEDIA[=DESVPROM(RANGO)]
• -3.6 + -3.6 + -.6 + 3.4 + 4.4 = 0• |-3.6| + |-3.6| + |-.6| + |3.4| + |4.4| = 15.6• Distancia promedio = 15.6 / 5 = 3.12• En general:
n
ii xx
nDAM
1
||1
n
i
i
n
xxDAM
1
||
En estadística la desviación absoluta promedio o, sencillamente desviación media o promedio de un conjunto de datos es la media de las desviaciones absolutas y es un resumen de la dispersión estadística.
VARIANZA
0
1
2
3
1 2 3 4 5 6 7 8 9 More
Area observada
Fre
cu
en
cia
4.4x4.4
3.6x3.6
3.6x3.6
3.4x3.4
.6x.6
Media Muestral
VARIANZA [=VAR(RANGO)]
• -3.6 + -3.6 + -.6 + 3.4 + 4.4 = 0• 3.6(3.6) + 3.6(3.6) + .6(.6) + 3.4(3.4) +
4.4(4.4) = 57.2• área promedio = 57.2 / 4 = 14.3• En general:
n
ii xx
ns
1
22 )(1
1
n
i
i
n
xxs
1
22
1
)(
GRADOS DE LIBERTAD
• ¿Por qué calculamos la varianza dividiendo por n - 1, en lugar de dividir por n?
• Como la suma de las desviaciones es 0, la última desviación es una combinación lineal de las n - 1 desviaciones restantes.
• Por lo tanto, no estamos calculando el promedio de n números independientes (los desvíos). Solo n -1 de las desviaciones al cuadrado pueden variar libremente y por ello, promediamos la suma de los desvíos al cuadrado dividiendo por n -1.
• Al numero n -1 se lo denomina grados de libertad de la varianza o de la desviación típica.
MEDIDAS DE FORMA
Asimetría
• Si bien es fácil tener una idea de si la distribución es simétrica o no tras ver la representación gráfica, es importante cuantificar la posible asimetría de una distribución.
• Recordemos que cuando la distribución de los datos es simétrica, la media, la mediana y la moda coinciden. (Y la distribución tiene la misma forma a la izquierda y la derecha del centro)
ÍNDICES DE ASIMETRÍA
1. Índice de asimetría de PearsonMuy sencillo de calcular. Está basado en la relación entre la media y la moda en distribuciones simétricas y asimétricas:
• Si la distribución es simétrica As será 0
• Si la distribución es asimétrica positiva, As será mayor que 0
• Si la distribución es asimétrica negativa, As será menor que 0
xS S
MoXA
__
ÍNDICES DE ASIMETRÍA
2. Índice de asimetría de Fisher• Está basado en la diferencia de los datos sobre la media, como
la varianza, si bien esta vez se elevan los coeficientes al cubo
• Si la distribución es simétrica As será 0
• Si la distribución es asimétrica positiva, As será mayor que 0
• Si la distribución es asimétrica negativa, As será menor que 0
• Desventaja: Muy influida por puntuaciones atípicas
sA
x
n
i
i
S
nXx
31
3__
)(
ÍNDICES DE ASIMETRÍA
3. Expresión en Excel• En el software Excel, la función
=COEFICIENTE.ASIMETRIA(A3:A14) se basa en la siguiente expresión:
• Si la distribución es simétrica As será 0
• Si la distribución es asimétrica positiva, As será mayor que 0
• Si la distribución es asimétrica negativa, As será menor que 0
• Desventaja: Muy influida por puntuaciones atípicas
sA
x
i
s
Xx
nn
n3
3__
)(
)2()1(
AsimetríaAsimetría hacia la derecha
(asimetría positiva)Asimetría hacia la izquierda
(asimetría negativa)
Al ser positiva significa que la gráfica es asimétrica por la derecha de la media y por tanto los valores mayores que ella están más dispersos que los menores.
Al ser negativa significa que la gráfica es asimétrica por la izquierda de la media y por tanto los valores menores que ella están más dispersos que los mayores.
CURTOSIS O APUNTAMIENTO
• La curtosis representa la elevación o achatamiento de una distribución, comparada con la distribución normal. Una curtosis positiva indica una distribución relativamente elevada, mientras que una curtosis negativa indica una distribución relativamente plana.
• El estándar es la distribución normal: distribución mesocúrtica.
• Si la distribución es más apuntada que la distribución normal tenemos una distribución leptocúrtica.
• Si la distribución es más achatada que la distribución normal tenemos una distribución platicúrtica.
ÍNDICE DE CURTOSIS
• Para una distribución normal (mesocúrtica) sabemos que
• Y esta va a ser la referencia para el índice de curtosis que vamos a emplear
• Si la distribución es normal (mesocúrtica), el índice vale 0
• Si la distribución es leptocúrtica, el índice es superior a 0
• Si la distribución es platicúrtica, el índice es inferior a 0
3)(
41
4__
sx
n
i
i nXx
3)(
41
4__
sC
x
n
i
i
r
nXx
ÍNDICE DE CURTOSIS
• En el software Excel, la función =CURTOSIS(A3:A14) se basa en la siguiente expresión:
• Si la distribución es normal (mesocúrtica), el índice vale 0
• Si la distribución es leptocúrtica, el índice es superior a 0
• Si la distribución es platicúrtica, el índice es inferior a 0
)3)(2(
)1(3)(
)3)(2)(1(
)1( 2
4
4__
nn
nXx
nnn
nn
sC
x
i
r
CurtosisLeptocúrtica Platicúrtica
Al ser negativa significa que la gráfica es menos apuntada que la gráfica de la distribución normal y por tanto los valores alrededor de la media están menosconcentrados que en la Distribución Normal.
Al ser positiva significa que la gráfica es más apuntada que la gráfica de la distribución normal y por tanto los valores alrededor de la media están masconcentrados que en la Distribución Normal.
MEDIDAS DE FORMA
Son aquellos números, que indican la morfología de la distribución de los datos, es decir de la simetría y apuntamiento que tiene el histograma de la variable en estudio. Sólo se pueden calcular en variables medidas en escala intervalar y de razón.
Son el:• SESGO (COEFICIENTE DE ASIMETRIA)• CURTOSIS
Medidas de Forma Page 221
RELACIÓN ENTRE LA MEDIA, MEDIANA Y MODA
X = Me = Mo
Cuando una distribución de frecuencia es simétrica, la media, mediana y moda coinciden en su valor ( X = Me = Mo). En el caso de una distribución binomial simétrica, es necesario calcular el promedio de las modas.
Mo < Me < X
En una distribución sesgada a la izquierda, la moda es menor a la mediana, y esta a su vez menor que la media.
RELACIÓN ENTRE LA MEDIA, MEDIANA Y MODA
• En una distribución sesgada a la derecha la relación se invierte, la moda es mayor a la mediana, y esta a su vez mayor que la media.
Mo > Me > X
EJEMPLO: RELACIÓN ENTRE LA MEDIA, MEDIANA Y MODA
Calcular la media, mediana y moda de los siguientes datos e interpretar surelación.
COEFICIENTE DE ASIMETRÍA
Mide el grado de asimetría de la distribución con respecto a la media. Un valor positivo de este indicador significa que la distribución se encuentra sesgada hacia la izquierda (orientación positiva). Un resultado negativo significa que la distribución se sesga a la derecha.
EJEMPLO: CÁLCULO DEL COEFICIENTE DE ASIMETRÍA
Calcular el coeficiente de asimetría a partir de los siguientes datos obtenidos de una muestra. Realizando el Polígono de Frecuencias.
CURTOSIS
Si los datos están muy concentrado hacia la media, la distribución es leptocúrtica (curtosis mayor a 0).
Si los datos están muy dispersos, la distribución es platicúrtica (curtosis menor a 0).
El comportamiento normal exige que la curtosis sea igual a 0 (distribución mesocúrtica).
Indica que tan apuntada o achatada se encuentra una distribución respecto a un comportamiento normal (distribución normal).
CÁLCULO DE LA CURTOSIS
La fórmula empleada para calcular la Curtosis se muestra a continuación (reemplace el valor de n por N en caso de tratar con datos poblacionales):
EJEMPLO: CÁLCULO DE LA CURTOSIS
• Calcular el coeficiente de asimetría a partir de los siguientes datos obtenidos de una muestra. Realizar el polígono de frecuencias.
IDENTIFICACIÓN DE HIPÓTESIS
• Una hipótesis estadística es una suposición acerca que una característica de la población, que debe ser probada con base en la información porporcionada por una muestra aleatoria.
Hipótesis nula: H0 : Es la que se pretende probar, generalmente se establece con el fin de rechazarla.
Hipótesis alternativa: H1 : Es la negación de la hipótesis nula, establece además la región en la que se tomará la decisión de rechazar o no H0.
DEFINICIONES
Nivel de significación: La probabilidad de rechazar la hipótesis nula cuando en realidad es verdadera.
Error tipo I: Rechazar la nula cuando en realidad es verdadera.
Error tipo II: Aceptar la hipótesis nula cuando en realidad es falsa.
Estadístico de prueba: Es un valor, determinado a partir de la información de la muestra, usado para decidir si rechazar o no la hipótesis nula.
Valor crítico: El punto que divide la región entre el lugar en el que la hipótesis nula es rechazada y y la región donde la hipótesis nula es no rechazada.
¿QUÉ ES UNA PRUEBA DE HIPÓTESIS?
Prueba de hipótesis: es un procedimiento, basado en la evidencia de la muestra y en la teoría de las probabilidades, usado para determinar si la hipótesis es una afirmación razonable y debería no ser rechazada o si no es razonable debería ser rechazada.• Principalmente sus parámetros:
MediaVarianzaProporción/Tasa
• OJO: Si queremos contrastarla, debe establecerse antes del análisis.
PRUEBA DE HIPÓTESIS
N o rech zar la h ip ó tes is n u la R ech azar la n u la y acep ta r la a lte rn a tiva
P aso 5 : Tom ar u n a m u es tra , lleg ar a u n a d ec is ió n
P aso 4 : F o rm u la r u n a reg la d e d ec is ió n
P aso 3 : Id en tifica r e l es tad ís tico d e p ru eb a
P aso 2 : S e lecc ion ar e l n ive l d e s ig n ificac ió n
P aso 1 : E s tab lecer la h ip ó tes is n u la y la a lte rn a tiva
REGIÓN CRÍTICA Y NIVEL DE SIGNIFICACIÓN
Región crítica• Valores ‘improbables’ si...• Es conocida antes de realizar el
experimento: resultados experimentales que refutarían H0
Nivel de significación: a• Número pequeño: 1% , 5%• Fijado de antemano por el
investigador• Es la probabilidad de rechazar
H0 cuando es cierta
No rechazo H0
Reg. Crit.Reg. Crit.
a=0.05
H0: m=40
CONTRASTES: UNILATERAL Y BILATERAL
La posición de la región crítica depende de la hipótesis alternativa
Unilateral Unilateral
Bilateral
H1: m < 40 H1: m>40
H1: m ¹40
SIGNIFICACIÓN: P
43X
No se rechazaH0: m =40
Es la probabilidad que tendría una región crítica que comenzase exactamente en el valor del estadístico obtenido de la muestra. Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0. Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la obtenida.p es conocido después de realizar el experimento aleatorioEl contraste es no significativo cuando p>a
P
P
a
a
SIGNIFICACIÓN : P
Pa
Pa
50X
Se rechaza H0: m=40
Se acepta H1: m>40
El contraste es estadísticamente significativo cuando p < aEs decir, si el resultado experimental discrepa más de “lo tolerado” a priori.
RESUMEN: α, P Y CRITERIO DE RECHAZO
• Sobre a• Es número pequeño,
preelegido al diseñar el experimento
• Conocido a sabemos todo sobre la región crítica
• Sobre p• Es conocido tras realizar
el experimento
• Conocido p sabemos todo sobre el resultado del experimento
Sobre el criterio de rechazo El contraste es significativo si p menor que a
ESTADÍSTICOS PARA DISEÑOS DE DOS GRUPOS
Grupos Datos
Independientes
Relacionados
Paraméticos t Student muestras no relacionadas
t Student muestras
relacionadas
Ordinales U Mann-Whitney T Wilcoxon
Nominales Probabilidad exacta de Fisher
McNemar
PRUEBAS NO-PARAMÉTRICAS
Pruebas estadísticas que no requieren muchas asunciones acerca de la naturaleza de la población de donde proceden las muestras. Son referidos como pruebas de distribución libre.
Pueden usarse con datos de escala nominal y
ordinal. Muestreo independiente o aleatorio.
PRUEBAS PARAMÉTRICAS
Pruebas estadísticas que asumen una serie de propiedades sobre los parámetros de la población de donde proceden la muestras: datos de distribución normal y de igual variancia en la población.
Datos de escala de intervalo y razón. Muestreo independiente o aleatorio.
• Coeficientes de correlación• Regresión lineal• Prueba t• Prueba de diferencia de proporciones• Análisis de varianza• Análisis de covarianza
ANÁLISIS PARAMÉTRICOS
Coeficiente de correlación de Pearson Analiza la relación entre dos variables medidas
en un nivel por intervalos o de razón. Se simboliza con:r Ejemplos: A mayor X, mayor Y. A mayor X,menor Y. La hipótesis de investigación señala que la
correlación es significativa.(No identifica causalidad)
Puede variar de -1.00 a +1.00
ANÁLISIS PARAMÉTRICOS
Regresión lineal• Es un modelo estadístico para estimar el efecto
de una variable sobre otra.• Está asociado con el coeficiente de correlación de
Pearson.• Brinda la oportunidad de predecir las
puntuaciones de una variable tomando las puntuaciones de la otra variable.
ANÁLISIS PARAMÉTRICOS
Prueba t• Es una prueba estadística para evaluar si dos
grupos difieren entre si de manera significativa respecto a sus medias en una variable.
• Se simboliza con :t.• La hipótesis de inv.propone que los dos grupos
difieren de manera significativa,y la hipótesis nula que los dos grupos no difieren.
ANÁLISIS PARAMÉTRICOS
Prueba de diferencia de proporciones• Es una prueba estadística para analizar si dos
proporciones o porcentajes difieren significativamente entre sí, en dos grupos.
• La comparación se realiza con una variable.• Si hay varias variables hay que realizar una
prueba por cada variable.
ANÁLISIS PARAMÉTRICOS
Análisis de varianza(ANOVA- one-way)• Es una prueba estadística para analizar si más de
dos grupos difieren significativamente (son diferentes)entre sí en cuanto a sus medias y varianzas.
• Hay otras a estadísticas relacionadas con anova.
ANÁLISIS PARAMÉTRICOS
Supuestos:1. Aceptan distribuciones no normales.2. Pueden analizar datos medidos con escalas de
intervalos,razón,nominales u ordinales.
ANÁLISIS NO PARAMÉTRICOS
Las pruebas no paramétricas más comunes son:• Chi cuadrada • Coeficientes de correlación e independencia para
tabulaciones cruzadas• Coeficientes de correlación por rangos ordenados
de Spearman y Kendall.
ANÁLISIS NO PARAMÉTRICOS
Chi cuadrada• Es una prueba estadística para evaluar hipótesis
acerca de la relación entre dos variables categóricas.
• Se simboliza :X2• No considera relaciones causales.
ANÁLISIS NO PARAMÉTRICOS
La prueba de t Student para muestras dependientes se utiliza para comparar las medias de un mismo grupo en diferentes etapas. Se utiliza, por ejemplo, para las comparaciones de los resultados de una prueba antes y después para un grupo determinado.
A continuación se explicará la operación de esta prueba a través de un caso para contraste unilateral y otro bilateral.
PRUEBA T DE STUDENTPARA MUESTRAS RELACIONADAS
DIFERENCIA DE MEDIAS GRUPOS RELACIONADOS (T)ejemplo: Se desea saber si el cambio de alimento ha variado
positivamente en el peso de animales. Los datos son los siguientes :
A1 A2
92 94
85 97
74 93
70 99
36 92
85 98
55 77
66 93
88 96
75 100
89 95
66 93
DIFERENCIA DE MEDIAS GRUPOS RELACIONADOS (T)
En este caso se utiliza la prueba t para muestras relacionadas
nDS
t
d
M d
muestra la de sujetos de Número
sdiferencia las deEstándar Desviación
sdiferencia las de aritmética Media
nd
DSd
M
n
ii
ndxxDS
1
21
1
1
2___
1
n
d
n
d
XdDS
DIFERENCIA DE MEDIAS GRUPOS RELACIONADOS (T)
En nuestro caso, se obtienen los siguientes valores:
A1 A2 d
92 94 -2
85 97 -12
74 93 -18
70 99 -29
36 92 -56
85 98 -14
55 77 -23
66 93 -27
88 96 -8
75 100 -25
89 95 -6
66 93 -27
50,20___
dX
39,14sd
12n
DIFERENCIA DE MEDIAS GRUPOS RELACIONADOS (T)
CÁLCULO DEL VALOR T OBSERVADO
50,20dM 39,14DS d12n
SUSTITUYENDO
93,4
1239,14
50,20
Ot
nDS
t
d
M d
DIFERENCIA DE MEDIAS GRUPOS RELACIONADOS (T)
valor critico
a = 0.05 unilateral
Se Rechaza Ho
796,111;05.0 t
Valor calculado
93,4ot
93,4ot
796,111;95.0 t
Al comparar los valores, podemos rechazar la hipótesis nula con un margen de error de 5%, por lo cual podemos afirmar que el peso de los animales ha variado positivamente después del cambio de alimento.
grados de libertad n-1
grados de libertad n-1
DIFERENCIA DE MEDIAS GRUPOS RELACIONADOS (T)
Ejemplo Contraste Bilateral:
Un granjero intentaba encontrar un modo eficaz de extraer leche de su ganado. Con el fin de elegir la técnica más apropiada, probó dos opciones manuales. Los resultados fueron medidos a través de los litros obtenidos.
DIFERENCIA DE MEDIAS GRUPOS RELACIONADOS (T)
En nuestro caso, se obtienen los siguientes valores:
83,4dM
61,5DS d
12n
TÉC. 1 TÉC. 2 d
15 27 -12
12 25 -13
22 17 5
20 30 -10
18 22 -4
16 19 -3
14 15 -1
19 22 -3
17 25 -8
10 19 -9
25 23 2
20 22 -2
DIFERENCIA DE MEDIAS GRUPOS RELACIONADOS (T)
CÁLCULO DEL VALOR T OBSERVADO
83,4dM 61,5DS d12n
SUSTITUYENDO
99,2
1261,5
83,4
Ot
nDS
t
d
M d
DIFERENCIA DE MEDIAS GRUPOS RELACIONADOS (T)
valor critico
a = 0.05 bilateral
201,211;025.0 t
Valor calculado
99,2ot
99,2ot
201,211;975.0 t grados de libertad n-1
Se Rechaza Ho
Al comparar los valores, podemos rechazar la hipótesis nula de la igualdad de las técnicas de ordeña, con un margen de error de 5%, por lo cual podemos afirmar que la existen diferencias entre ellas, a favor de la técnica 2.
EJERCICIO T STUDENT
• Tengamos las siguientes puntuaciones en las variables X (inteligencia) e Y (rendimiento académico):
• X: 105 116 103 124 137 126 112 129 118 105• Y: 4 8 2 7 9 9 3 10 7 6
EJERCICIO T STUDENT
• Los datos de la producción de trigo en toneladas (X) y el precio del kilo de harina en pesos (Y ) en la década de los 80 fueron:
• Producción de trigo 30 28 32 25 25 25 22 24 35 40
• Precio de la harina 25 30 27 40 42 40 50 45 30 25
El contraste de Wilcoxon es la técnica no paramétrica paralela a la T de Student para muestras relacionadas. Al Igual que en esa prueba, disponemos de n parejas de valores que podemos considerar como una variable medida en cada sujeto en dos momentos diferentes.
Se presentará a continuación el proceso de contraste para muestras por aproximación normal.
PRUEBA DE WILCOXON
Caso
Los datos siguientes se refieren a los niveles de tolerancia a la frustración manifestada por un grupo de niños en la casa y en el colegio. Se trabajó con una muestra de 8 niños.
Se midió a través de una escala de manifestaciones de frustración a los niños, tanto en la casa como en el colegio. Se intenta establecer si existen diferencias en los niveles de tolerancia a la frustración manifestada .
DIFERENCIA ENTRE GRUPOS RELACIONADOS (W)
Paso 1) Se recogen y tabulan los datos.
DIFERENCIA ENTRE GRUPOS RELACIONADOS (W)
TF-CASA TF-COLEGIO
82 63
69 42
73 74
43 37
58 51
56 43
76 80
65 82
Paso 2) Se determinan las diferencias Di entre los pares de observaciones realizadas.
DIFERENCIA ENTRE GRUPOS RELACIONADOS (W)
TF-CASA TF-COLEGIO Di
82 63 19
69 42 27
73 74 -1
43 37 6
58 51 7
56 43 13
76 80 -4
65 82 -17
Paso 3) Sin tomar en cuenta el signo, se ordenan en forma creciente las Di y se les asigna el rango de 1 a n. En el caso de haber dos o más diferencias iguales, se considera para cada uno el promedio de los rangos. Las diferencias iguales a 0 se descartan los cálculos y de
n , pues en este modelo no se toman en cuenta los empates.
DIFERENCIA ENTRE GRUPOS RELACIONADOS (W)
TF-CASA TF-COLEGIO Di RANGO (T)
73 74 -1 1
76 80 -4 2
43 37 6 3
58 51 7 4
56 43 13 5
65 82 -17 6
82 63 19 7
69 42 27 8
Paso 4) Se coloca el signo a cada uno de los rangos Ri hallados. Se suman entre sí los rangos de las diferencias positivas calculando su total T1-, y el de las negativas obteniendo T2+, siendo T1 la suma de los rangos en que Y>X (diferencias negativas); y T2 la suma de los rangos en que X>Y (diferencias positivas).
Paso 5) Se elige la menor de ambas sumas y se la define como el estadígrafo W.
DIFERENCIA ENTRE GRUPOS RELACIONADOS (W)
TF-CASA TF-COLEGIO Di RANGO RANGO (T1-) RANGO (T2+)
73 74 -1 1 1
76 80 -4 2 2
43 37 6 3 3
58 51 7 4 4
56 43 13 5 5
65 82 -17 6 6
82 63 19 7 7
69 42 27 8 8
9 27Valor W calculado 9
Paso 5) Está demostrado que cuando n aumenta de tamaño, la distribución W se acerca rápidamente a la distribución normal, con los siguientes parámetros:
4
)1( nnW 24
)12)(1( nnnW
por lo que podemos determinar la significación de un valor observado de W por medio de:
24
)12)(1(4
)1(
nnn
nnW
WZ
W
WWWZ
o
DIFERENCIA ENTRE GRUPOS RELACIONADOS (W)
En nuestro ejemplo, si sustituimos en
4
989
24
17989
Tenemos, entonces, los siguientes valores:
189 141,79
DIFERENCIA ENTRE GRUPOS RELACIONADOS (W)
4
)1( nnW 24
)12)(1( nnnW
Si hay diferencias igual a 0, se excluyen eso pares de n
Una vez establecidos los parámetros, calculamos el valor Z observado para W=9
26,11899 141,7
Z
Alternativas de contraste
Bilateral oHrechazarZW
Z 2/
Unilateral oHrechazarZW
Z
DIFERENCIA ENTRE GRUPOS RELACIONADOS (W)
Los valores críticos para Z se indican a continuación:
Valores Críticos de ± ZNivel de Significación para
Contraste Unilateral
.05 .025 .01 .005 .0005
Contraste Bilateral
.10 .05 .02 .01 .001
z crítico 1.645
1.960
2.326
2.576
3.291
DIFERENCIA ENTRE GRUPOS RELACIONADOS (W)
Paso 6) Comparar el valor crítico con el valor observado para W.
96,126,1
26,1WZ 96,12/05.0 Z
Por lo tanto, no podemos rechazar la hipótesis nula, y debemos aceptar que no existe evidencia empírica suficiente para afirmar que existen diferencias significativas entre los niveles de tolerancia a la frustración manifestada en la casa y en el colegio
Considerando que el contraste para nuestro caso es bilateral, el valor
crítico asociado a una probabilidad a bilateral de 0.05, es de Z = 1.96.
Comparamos :
Paso 7) Se concluye sobre la Hipótesis nula.
DIFERENCIA ENTRE GRUPOS RELACIONADOS (W)
Paso 5) Está demostrado que cuando n aumenta de tamaño, la distribución W se acerca rápidamente a la distribución normal, con los siguientes parámetros:
4
)1( nnW 24
)12)(1( nnnW
por lo que podemos determinar la significación de un valor observado de W por medio de:
24
)12)(1(4
)1(
nnn
nnW
WZ
W
WWWZ
o
DIFERENCIA ENTRE GRUPOS RELACIONADOS (W)
m8= = 394
s8= 24+1) = 12.73 24√
Z8 = 8- 39 = - 2.44 12.73
Valores Críticos de ± Z
Nivel de Significación para
Contraste Unilateral
.05 .025 .01 .005 .0005
Contraste Bilateral
.10 .05 .02 .01 .001
z crítico
1.645
1.960
2.326
2.576
3.291
LOS ANÁLISIS DE REGRESIÓN Y CORRELACIÓN MOSTRARÁ
• La naturaleza de la relación entre las variables• La fuerza de la relación entre variables
Análisis de regresión• Formula matemática que relaciona las variables
conocidas con la varibable desconocidaAnálisis de correlación• Determinar el grado de relación entre las
variables
INDEPENDENCIA - DEPENDENCIA
Cuando se estudian dos características simultáneamente sobre una muestra, se puede considerar que una de ellas influye sobre la otra de alguna manera. Por ejemplo la altura y el peso o las horas de estudio y la calificación en un examen.
El objetivo principal de la regresión es descubrir el modo en que se relacionan.
Dos variables pueden considerarse:
• Variables independientes No tienen relación (una de ellas no sirve para explicar los movimientos de la otra)
• Dependencia funcional Y=f(x)• Dependencia estadística
Independencia estadística Dependencia funcionalDependencia estadística
Grado de asociación entre dos variables- +
GRÁFICOS DE DISPERSIÓN: PERMITE VER SI HAY ASOCIACIÓN
• Dadas dos variables X y Y tomadas sobre el mismo elemento de la población, el diagrama de dispersión es simplemente un gráfico de dos dimensiones, donde en un eje (la abscisa) se sitúa una variable, y en el otro eje (la ordenada) se sitúa la otra variable. Si las variables están correlacionadas, el gráfico mostraría algún nivel de correlación (tendencia) entre las dos variables. Si no hay ninguna correlación, el gráfico presentaría una figura sin forma, una nube de puntos dispersos en el gráfico.
GRÁFICOS DE DISPERSIÓN: PERMITE VER SI HAY ASOCIACIÓN
Estadística Económica 2007-2008. Sara Mateo.
Asociación positiva. Si aumenta X aumenta Y
GRÁFICO DE DISPERSIÓN
Es un gráfico que muestra la intensidad y el sentido de la relación entre dos variables de interés.• Variable dependiente
Respuesta, predicha, endógenaEs la variable que se desea predecir o estimar
• Variables independientesPredictoras, explicativas exógenasSon las variables que proveen las bases para estimar.
• Si X es la variable independiente e Y es la variable dependiente, una relación funcional tiene la forma:
Y=f(X)
La relación entre dos variables métricas puede ser representada mediante la línea de mejor ajuste a los datos. Esta recta se le denomina recta de regresión, que puede ser negativa o positiva, la primera con tendencia decreciente y la segunda creciente.
GRÁFICOS DE DISPERSIÓN / RECTA DE REGRESIÓN
GRÁFICOS DE DISPERSIÓN / RECTA DE REGRESIÓN
• Para el cálculo de la recta de regresión se aplica el método de mínimos cuadrados entre dos variables. Esta línea es la que hace mínima la suma de los cuadrados de los residuos, es decir, es aquella recta en la que las diferencias elevadas al cuadrado entre los valores calculados por la ecuación de la recta y los valores reales de la serie, son las menores posibles.
1x 2x3x ix 1nx nx
1y
2y
3y
iy
1ny
ny
Intercepto
PendienteRecta de regresión
ˆiy
ˆi i iu y y
yi
iii ubxay
3uiu
Error
Llamemos a “u” perturbación o error, siendo la diferencia que hay entre el valor observado de la variable exógena (y) y el valor estimado que obtendremos a través de la recta de regresión .
La metodología para la obtención de la recta será hacer MÍNIMA la suma de los CUADRADOS de las perturbaciones. ¿Por qué se elevan al cuadrado?
2 2ˆ( )i i iu y y 2 2
1 1
ˆ( )n n
i i ii i
u y y
22 2
, 1 1 1
ˆ( )minn n n
i i i i iq p i i i
xpu qy y y
ˆiy
ii bxay
a b
En el modelo de regresión lineal simple la función elegida para aproximar la relación entre las variables es una recta, es decir y=a+bx, donde a,b son los parámetros. A esta recta la llamaremos RECTA DE REGRESIÓN DE Y SOBRE X.
Vamos a deducir su ecuación usando el método de los mínimos cuadrados. Dado un valor de X, tenemos los dos valores de Y, el observado, yi , y el teórico, yi* = a + bxi. Hemos de minimizar los errores cometidos:
n
i
ii
n
i
ii bxaybxay
1
22
1El valor que hemos
aproximado para “y” con la recta de regresión y*
Errores cometidos al aproximar por una recta
MINIMIZAR
02
02
i
i
ii
i
ii
xbxayb
bxaya
xbyaxbyna
i
i
i
i
i i
ii
i
ii
i i i
ii
xbxayx
xbay
2
22
22
2
2
x
xyxxy
i
i
i
ii
i i
iii
i
ii
i i
ii
i
ii
S
SbbSS
xnxbxnyyx
xbxnxbxn
yyx
xbxxbyyx
Estadística Económica 2007-2008. Sara Mateo.
y obtenemos que la recta de regresión de Y sobre X: y = a + bx con los valores a y b anteriormente calculados, o bien la siguiente expresión:
Aplicando el mismo razonamiento llegaríamos a la expresión de la recta de regresión de X sobre Y: x = a’ + b’y con los valores a’ y b’ calculados como:
xxS
Syy
x
xy 2
ybxayS
Sb
y
xy'''
2
Por tanto, se podría expresar como:
yyS
Sxx
y
xy 2
2
2 2ˆ
y
i iu R
y yS S
N
2
21 u
Y
SR
S
Cuando solo exista una variable explicativa o independiente y una sola dependiente se cumple:
22
222 ' xy
yx
xy
y
xy
x
xyr
SS
S
S
S
S
SbbR
Varianza residual: Ayuda a medir la dependencia.
Si es grande, los residuos, por término medio, serán grandes. Dependencia pequeña y viceversa.
Varianza marginal: Es la varianza total de X o de Y. Si dividimos la varianza residual entre esta se elimina el problema de unidades de medida.
2yS
2xS
VR =
yy
u
VT
VR
S
S
2
2
Elevado al cuadrado obtenemos el coeficiente de determinación que sirve como medida del buen ajuste de la recta de regresión
2R
Ayuda a determinar la asociación pero en sentido inverso. La mejor medida es R.
Haciendo unas transformaciones se demuestra que r(xy) Rrxy
Coeficiente de correlación general:
Para el caso de distribuciones bidimensionales: 2 2R r R r
2 21 1 1 1 0 1 0 1r R r R
2 2 2ˆ XY XY XY
i i iX X X
S S Sy y x x y x x
S S S
2ˆ XY Y
i i i iX
X Y Y
Y
Y
X Y X
X
X X
SS Sy y x x y x
S S S
S Sx y x
SS Sr
S Sx
Recta de regresión:
1 0r 0 1r 1r 1r 0r
Pendiente Negativa PositivaNula
2YS
2 2u ryS S
2 2 22
2 21 u Y u
Y Y
S S SR
S S
2 2 2R Y uS S S
2 22R uY SS S
2R Tanto por uno de la Y que viene explicado por la X
SIRVE PARA DETERMINAR SI EL AJUSTE HECHO ES BUENO. ES DECIR, SI LA VARIABLE X EXPLICA LAS VARIACIONES DE LA VARIABLE Y. DEBERÁ SER > 0.75
VEVRVT
VT
VE
VT
VR1
VR
VE
2
2
Y
R
S
S
Se descompone en:
2ˆ XY
i i iX
Sy q px y x x
S
Dado un valor de la variable “X” que no ha sido observado, estimar el correspondiente valor de “Y”
0 0ˆDado x estimar y
0 0 02ˆ XY
X
Sq p y xy x
Sx
a
a
b
b
El objetivo último de la regresión es la predicción de una variable para un valor determinado de la otra. La predicción de Y para X = x0 será simplemente el valor obtenido en la recta de regresión de Y sobre X al sustituir el valor de x por x0. La fiabilidad de esta predicción será tanto mayor cuando mayor sea la correlación entre las variables (es decir mayor sea R2 )
VAR EXPLICATIVA
4003002001000
VA
R R
ES
PU
ES
TA
100
80
60
40
20
0
•Los resultados de la regresión sólo son fiables si el modelo cumple ciertas hipótesis sobre los residuos
•Es preciso realizar una validación del modelo
Validación
Siempre hay una diferencia entre el valor real de la variable respuesta y la estimación a partir de la ecuación de regresión: el residuo
CORRELACIÓN Y REGRESIÓN LINEAL SIMPLE
VALIDACIÓN DEL MODELO
Calidad del modelo:
Para determinar hasta que punto las variables explicativas permiten estimar a la variable respuesta seguimos usando el R2 (COEFICIENTE DE DETERMINACIÓN=VARIANZA EXPLICADA).
Cuanto más cercano a 1 más adecuado es el modelo
Cuanto más cercano a 0 peor resulta el modelo. Es decir, las variables explicativas no se ajustan linealmente a la variable respuesta.
R2 aumenta con muchas VI y en muestras pequeñas R2
ajustado
Un R2 bajo no necesariamente indica que las variables seleccionadas no permiten estimar adecuadamente la
variable respuesta.
Es posible que la relación no sea lineal.
REGRESIÓN LINEAL MÚLTIPLE
CALIDAD DEL MODELO
Contrastes de hipótesis:
Se puede contrastar si cada pendiente individualmente es significativa o no, es decir, si cada variable explicativa influye realmente sobre la variable respuesta (“t”)
Se puede contrastar si globalmente todas las variables explicativas influyen sobre la variable respuesta (“F”).
Las siguientes paradojas pueden darse,
• Individualmente una variable explicativa puede estar significativamente relacionada con la variable respuesta, pero no ser un predictor significativo en el modelo de regresión lineal múltiple
• Una variable individualmente puede NO estar significativamente relacionada con la variable respuesta, pero en un modelo de regresión lineal múltiple SÍ lo está
REGRESIÓN LINEAL MÚLTIPLE
CONTRASTES
Validación del modelo:
Los residuos del modelo debe seguir cumpliendo ciertas hipótesis básicas:
Media cero
Incorrelación
Normalidad
Para poder interpretar adecuadamente los coeficientes estimados y hacer uso de la recta de
regresión es imprescindible que el modelo sea válido.
REGRESIÓN LINEAL MÚLTIPLE
VALIDACIÓN
LIMITACIONES Y ERRORES
• NO DETERMINAN CAUSA Y EFECTO
INTERPRETACION ERRONEA• • INCORRECTO r = .6 la ecuación de regresión
explica el 60% de la variación total en Y• • CORRECTO r² = .36 Solo el 36% de la variación
total se explica por la recta de regresion
CORRELACIÓN
• Al observar la gráfica de puntos dispersos, tenemos una idea de si hay una asociación entre dos variables numéricas.
• Para medir el grado de asociación, calculamos un coeficiente de correlación.
• El método estándar es el coeficiente de correlación de Pearson, r.
COEFICIENTE DE CORRELACIÓN DE PEARSON, R
• Mide la dispersión de los puntos, alrededor de una tendencia lineal subyacente (línea recta).
• Puede tomar cualquier valor entre – 1 y +1.• La fórmula es: Ʃ(x-x)(y-y)r= ---------------- √Ʃ(x-x)2 (y-y)2
COEFICIENTE DE CORRELACIÓN DE PEARSON, R
10 20 30 40 50
1
2
3
4
5
A
Distancia del punto A del promedio de X
Distancia del punto A del promedio de Y
CORRELACIÓN
• Si hay una relación no lineal, la correlación es cero. • Pero hay que tener cuidado, cuando r = 0; puede
haber una relación no lineal fuerte entre las dos variables.
• Siempre examine los datos gráficamente primero
SUPOSICIONES DE LA CORRELACIÓN
• Un coeficiente de correlación puede ser calculado en cualquier grupo de datos.
• Es más significativo cuando las dos variables tienen una distribución aproximadamente Normal.• Datos de este tipo tendrán una forma elíptica.
• Otra suposición para el uso de la correlación, es que todas las observaciones deberán ser independientes, esto significa que sólo una observación por cada variable debería venir de cada individuo en el estudio.
INTERPRETACIÓN DE LA CORRELACIÓN
• El coeficiente de correlación deberá estar entre -1 y +1.• Un valor de +1 indica una correlación perfecta positiva.• Un valor de – 1 indica una correlación perfecta negativa.• Un valor de 0 indica que no hay asociación lineal entre las dos
variables.
• Una correlación elevada puede mostrar una relación débil cuando se examina en una gráfica de puntos dispersos.
• Una correlación de 0 no siempre indica no relación, ya que la relación puede no ser lineal.
• “Buen” coeficiente de correlación(r>0,7)• Coeficiente de determinación: porcentaje de la varianza
que explica el modelo.
PRESENTACIÓN DE CORRELACIÓN
• Hay tres puntos a recordar:• Los datos deberán ser mostrados en una gráfica de
puntos dispersos.• El coeficiente de correlación, r, deberá ser dado a dos
sitios decimales. • El número de observaciones deberá ser señalado.
SIGNIFICACIÓN
• Fórmula:
• Interpretación:• Se rechaza la Hipótesis nula. La
correlación no procede de una población cuyo valor ρxy = 0. Las variables están relacionadas.
• Se acepta la Hipótesis nula. La correlación procede de una población cuyo valor ρxy = 0. Las variables no están relacionadas.
21 2
Nr
rt
XY
XY
)2,( Ntt
)2,( Ntt
OTRAS CUESTIONES A CONSIDERAR
• Correlación no implica causalidad.• La significación estadística depende del tamaño
de la muestra (a mayor N, más probable es encontrar significación).
• Otra posible interpretación la da el coeficiente de determinación , en términos de proporción de variabilidad de Y compartida o explicada por X.
• La proporción de variabilidad no explicada, aquello de Y que queda sin explicar por X, se denomina coeficiente de no determinación:
2XYr
21 XYr
EJERCICIO
• Tengamos las siguientes puntuaciones en las variables X (inteligencia) e Y (rendimiento académico):
• X: 105 116 103 124 137 126 112 129 118 105• Y: 4 8 2 7 9 9 3 10 7 6
EJERCICIO
• Los datos de la producción de trigo en toneladas (X) y el precio del kilo de harina en pesos (Y ) en la década de los 80 fueron:
• Producción de trigo 30 28 32 25 25 25 22 24 35 40
• Precio de la harina 25 30 27 40 42 40 50 45 30 25
¿QUÉ ES LA CHI CUADRADA?
• Es una prueba estadística para evaluar hipótesis acerca de la relación entre dos variables categóricas
• Se simboliza por χ2
• Hipótesis a probar : Correlaciónales ( H0 : no hay asociación y H1 hay asociación)
• Variables involucradas: Dos, esta prueba no considera relaciones causales
• Nivel de medición de las variables: Nominal u ordinal
OTRAS CARACTERÍSTICAS
• Es una distribución asimétrica
• Sólo toma valores positivos y es asintótica con respecto al eje de las x positivas ( 0 < χ2 < +∞)
• Está caracterizada por un único parámetro “ n” llamado “grados de libertad” adoptando formas distintas según el valor de “n”
• El área comprendida entre la curva y el eje de las x es 1 ó 100%
APLICACIONES
1. Entre las aplicaciones más frecuentes de esta distribución en el área de salud, podemos señalar:
2. La prueba de asociación, la cual permite al investigador determinar si existe asociación entre dos variables en escala de medición nominal u ordinal. También aparece en la literatura con el nombre de “tablas de contingencia”
3. La prueba de “bondad de ajuste”
PROCEDIMIENTO
• Se calcula a través de una tabla de contingencia o tabulación cruzada.
• Es una tabla de dos dimensiones y cada dimensión contienen una variable
• Cada variable se subdivide en dos o más categorías.
• Ejemplo: tabla 2x2 => cada dígito indica una variable y el valor de este indica el número de categorías de la variable
EJEMPLO DE UNA TABLA DE CONTINGENCIA
SEXO
MASCULINO
FEMENINO
CANDIDATO “A”CANDIDATO “ B”
Dos variables : voto y sexo
Cada variable con dos categorías VOTO
EJEMPLO TABLA 2X3
Norte Sur
Partido 1 180 100
Partido 2 190 280
Partido 3 170 120
Identificación politica
Zona Distrito electoral
EN ESENCIA LA PRUEBA DE CHI CUADRADO ES .......
“ es una prueba que parte del supuesto de “no relación entre las variables”
“ una comparación entre la “tabla de frecuencias observadas” y la denominada “tabla de frecuencias esperadas”
La lógica es “Si no hay relación entre las variables debe tenerse una tabla como la de frecuencias esperadas, si la hay la tabla que obtengamos como resultado de nuestra investigación debe ser muy diferente respecto de la tabla de frecuencias esperadas”
EJEMPLO 1 : En un juego de Cara y Corona , y una muestra de 200 lanzamientosSe observaron 115 caras y 85 coronas .
Ensayar la hipótesis “ La moneda está bien hecha” con un limite De significación de 0.05
Con la información obtenidaConstruirás un cuadro .Parecido al anterior.
Para llenar la casilla “fe” .Sabemos que la probabilidad al lanzar una Moneda al aire es de 50%, eso quiere decir 100 caras , 100 coronas.
Haz clic en el botón marcado .Te aparecerá un menú
Ahora emergió otro menú.Haz clic , en el botón marcado
Ahora apareció este menú .Harás clic en aceptar
En este cuadro habrás de sombrarDesde C7:C8 y en la siguiente casilla desdeD7:D8
En la casilla B12 esta calculado El valor probabilístico de chi- cuadrado
Para obtener chi calculadoRepetimos el proceso y haz clic en aceptar
Criterios para determinar , si “Ho” se Acepta ó Rechaza
22TC xx
22TC xx
Ho: se Rechaza
Ho: se Acepta
En los experimentos de Mendel con guisantes, observo 315 guisantesLisos y amarillos ;108 lisos y verdes;101 rugosos y amarillos; y 32 rugososY verdes .De acuerdo con su teoría estos números deberán presentarse en la proporción9:3::3:1 ; Hay alguna evidencia que permita dudar de la teoría , con un nivelDe significación de : a) 0.01 b) 0.05
Ho : No hay evidencia que permita dudar de su teoría
CON LA INFORMACION OBTENIDA EN EL ENUNCIADO CONSTRUIMOS UNA TABLA , TAL COMO SE MUESTRA.
PARA LLENAR LAS CELDAS DE “fe” USAREMOS LA RELACION 9:3::3:1 = 16Y HACEMOS (9/16)*556 ; (3/16)*556 ; (3/16)*556Y (1/16)*556 ; SUS RESULTADOS LOS ESCRIBIMOS EN SUS RESPECTIVAS CELDAS.
fose
recuperanno se
recuperan total
grupo A 75 25 100
grupo B 65 35 100
total 140 60 200
fe se recuperan no se recuperan total
grupo A 100
grupo B 100
total 140 60 200
200100*140
200100*140
200100*60
200100*60
70
703030