191
PSIC. GERARDO A. VALDERRAMA M . ESTADÍSTICAS APLICADAS EN PSICOLOGÍA Ciencias sociales y Educación DICIEMBRE 2011

ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

  • Upload
    buidiep

  • View
    213

  • Download
    0

Embed Size (px)

Citation preview

Page 1: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

PSIC. GERARDO A. VALDERRAMA M .

ESTADÍSTICAS APLICADAS EN PSICOLOGÍA Ciencias sociales y Educación

DICIEMBRE 2011

Page 2: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

ESTADÍSTICAS APLICADAS EN

PSICOLOGÍA

Ciencias Sociales y Educación

Psic. Gerardo A. Valderrama M.

Diciembre, 2011

Page 3: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

TABLA DE CONTENIDO

DEDICATORIA

AGRADECIMIENTO

PRÓLOGO

INTRODUCCIÓN

CAPÍTULO 1 ESTADÍSTICAS Y PSICOLOGÍA ........................................................................................ 1

ESTADÍSTICAS E INVESTIGACIÓN ......................................................................................................... 2

Etapa 1 ....................................................................................................................................................... 3

Etapa 2 ....................................................................................................................................................... 3

Etapa 3 ....................................................................................................................................................... 5

CONCEPTOS IMPORTANTES .................................................................................................................... 7

CAPÍTULO 2 LA NATURALEZA DE LAS ESTADÍSTICAS .................................................................... 2

LAS POBLACIONES .................................................................................................................................... 4

MEDICIÓN DE LAS VARIABLES PSICOLÓGICAS ................................................................................. 5

ESCALAS DE MEDICIÓN ........................................................................................................................... 5

CONCEPTOS IMPORTANTES .................................................................................................................... 7

CAPÍTULO 3 ORGANIZACIÓN DE DATOS DISTRIBUCIONES DE FRECUENCIAS ..................... 8

CONCEPTOS IMPORTANTES .................................................................................................................. 13

EJERCICIOS PRÁCTICOS ......................................................................................................................... 14

Problema 1 ............................................................................................................................................... 14

Problema 2 ............................................................................................................................................... 14

Problema 3 ............................................................................................................................................... 14

CAPÍTULO 4 REPRESENTACIONES GRÁFICAS .................................................................................. 15

GRÁFICO DE BARRAS .............................................................................................................................. 16

HISTOGRAMA ........................................................................................................................................... 17

POLÍGONO DE FRECUENCIAS ............................................................................................................... 19

GRÁFICO DE FRECUENCIAS ACUMULADAS U OJIVA ...................................................................... 21

DIAGRAMA DE TALLO Y HOJAS ........................................................................................................... 22

LOS ORDENADORES Y LAS GRÁFICAS ................................................................................................ 23

CONCEPTOS IMPORTANTES .................................................................................................................. 24

EJERCICIOS PRÁCTICOS ......................................................................................................................... 25

Problema 1 ............................................................................................................................................... 25

Problema 2 ............................................................................................................................................... 25

CAPÍTULO 5 MEDIDAS DE TENDENCIA CENTRAL ........................................................................... 26

LA MEDIA ARITMÉTICA ......................................................................................................................... 26

La media aritmética para distribuciones de frecuencias ......................................................................... 27

La media aritmética y los métodos abreviados ........................................................................................ 28

LOS PROMEDIOS DE POSICIÓN ............................................................................................................. 29

La mediana (mdn) .................................................................................................................................... 29

La moda ( ) .......................................................................................................................................... 32

COMPARACION DE LA MEDIA, LA MEDIANA Y LA MODA ............................................................. 34

Page 4: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

CONCEPTOS IMPORTANTES .................................................................................................................. 35

EJERCICIOS PRÁCTICOS ......................................................................................................................... 36

Problema 1 ............................................................................................................................................... 36

CAPÍTULO 6 MEDIDAS DE VARIABILIDAD ......................................................................................... 37

MEDIDAS DE VARIABILIDAD QUE NO SE ASOCIAN CON LA MEDIA ARITMÉTICA .................. 37

La Fluctuación (Amplitud) ....................................................................................................................... 37

Los Percentiles ......................................................................................................................................... 38

MEDIDAS DE VARIABILIDAD QUE SE ASOCIAN CON LA MEDIA ARITMÉTICA ......................... 40

La Desviación Media ............................................................................................................................... 40

Desviación Estándar O Típica ................................................................................................................. 41

La Asimetría ............................................................................................................................................. 43

La Curtosis ............................................................................................................................................... 44

CONCEPTOS IMPORTANTES .................................................................................................................. 45

EJERCICIOS PRÁCTICOS ......................................................................................................................... 46

Problema 1 ............................................................................................................................................... 46

CAPÍTULO 7 MODELOS POBLACIONALES PROBABILÍSTICO ...................................................... 47

VARIABLES DISCRETAS ......................................................................................................................... 48

La Distribución Binomial ......................................................................................................................... 48

VARIABLES CONTÍNUAS ........................................................................................................................ 49

Puntuaciones estándar ............................................................................................................................. 49

La Distribución Normal ........................................................................................................................... 51

Aproximación Normal De La Distribución Binomial .............................................................................. 56

CONCEPTOS IMPORTANTES .................................................................................................................. 58

EJERCICIOS PRÁCTICOS ......................................................................................................................... 59

Problema 1 ............................................................................................................................................... 59

Binomial ................................................................................................................................................... 59

Aproximación Normal A La Binomial ...................................................................................................... 60

CAPÍTULO 8 CORRELACIÓN Y REGRESIÓN ...................................................................................... 61

CORRELACIÓN MÚLTIPLE ..................................................................................................................... 71

Como Interpretar El Coeficiente De Correlación. ................................................................................... 72

REGRESIÓN LINEAL SIMPLE. ................................................................................................................ 73

Error Típico De La Estimación ................................................................................................................ 75

CONCEPTOS IMPORTANTES .................................................................................................................. 77

EJERCICIOS PRÁCTICOS ......................................................................................................................... 78

Problema 1 ............................................................................................................................................... 78

CAPÍTULO 9 ESTADÍSTICA INFERENCIAL Y PROBABILIDADES ................................................. 79

TEORÍA DE LA PROBABILIDAD (TP) ..................................................................................................... 80

El Experimento Aleatorio ......................................................................................................................... 81

Probabilidad ............................................................................................................................................ 83

Axiomas De Probabilidad ........................................................................................................................ 84

ASPECTOS BÁSICOS EN ELCÁLCULO DE PROBABILIDADES ......................................................... 85

CONCEPTOS IMPORTANTES .................................................................................................................. 89

EJERCICIOS PRÁCTICOS ......................................................................................................................... 90

CAPÍTULO 10 DE LA POBLACIÓN A LA MUESTRA ........................................................................... 92

Page 5: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

¿QUÉ ES UNA VARIABLE ALEATORIA? ........................................................................................................... 92

¿QUÉ ES UNA DISTRIBUCIÓN MUESTRAL DE PROBABILIDADES? ................................................................... 94

ESTIMACIÓN ESTADÍSTICA ................................................................................................................... 97

Estimación Puntual: ................................................................................................................................. 97

Estimación Por Intervalos: ...................................................................................................................... 97

MÉTODOS DE MUESTREO ...................................................................................................................... 99

Muestreo No Aleatorio:.......................................................................................................................... 100

Muestreo Aleatorio: ............................................................................................................................... 100

DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA: N .................................................................... 103

Tamaño De Población Desconocido ...................................................................................................... 104

Tamaño De Población Conocido ........................................................................................................... 104

CONCEPTOS IMPORTANTES ................................................................................................................ 105

EJERCICIOS PRÁCTICOS ....................................................................................................................... 106

CAPÍTULO 11 INTRODUCCIÓN A LA PRUEBA DE HIPÓTESIS ..................................................... 109

LA PRUEBA DE HIPÓTESIS ................................................................................................................... 110

PASO 1: Hipótesis Estadística ............................................................................................................... 111

PASO II: Nivel De Significación ............................................................................................................ 112

PASO III: Estadístico De Prueba........................................................................................................... 116

PASO IV: Regla De Decisión ................................................................................................................. 117

PASO V: Aplicación de la Prueba Estadística ....................................................................................... 117

PASO VI: Decisión ................................................................................................................................. 118

CONCEPTOS IMPORTANTES ................................................................................................................ 118

CAPÍTULO 12 PRINCIPALES TIPOS DE PRUEBA DE HIPÓTESIS ................................................. 119

PRUEBAS DE HIPÓTESIS PARA POBLACIONES O DATOS DISTRIBUIDOS NORMALMENTE. . 119

El Caso De Una Media Poblacional ...................................................................................................... 119

El Caso De Dos Medias Poblacionales ................................................................................................. 121

PRUEBA DE HIPÓTESIS PARA MUESTRAS PEQUEÑAS................................................................... 123

Grados De Libertad ............................................................................................................................... 123

La Prueba “t” de Student ...................................................................................................................... 125

Prueba “t” para el caso de una media poblacional .............................................................................. 126

Prueba “t” para el caso de dos medias independientes ........................................................................ 127

Prueba “t” para dos muestras correlacionadas .................................................................................... 129

Prueba “t” para correlaciones .............................................................................................................. 131

CONCEPTOS IMPORTANTES ................................................................................................................ 132

EJERCICIOS PRÁCTICOS ....................................................................................................................... 133

Muestras grandes: pruebas de hipótesis para medias ........................................................................... 133

Muestras pequeñas: pruebas de hipótesis para medias y correlaciones ............................................... 134

CAPÍTULO 13 ANÁLISIS DE LA VARIANZA ....................................................................................... 136

LA DISTRIBUCIÓN F ............................................................................................................................... 136

Principios del ANOVA ........................................................................................................................... 138

Anova Simple o en un solo sentido ......................................................................................................... 139

La Prueba de comparación de dos medias de Tukey. ............................................................................ 143

Anova Factorial (dos o más variables independientes) ......................................................................... 145

CONCEPTOS IMPORTANTES ................................................................................................................ 152

EJERCICIOS PRÁCTICOS ....................................................................................................................... 153

Análisis de la Varianza Simple o de Un Solo factor .............................................................................. 153

Page 6: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

APÉNDICE 1 DISTRIBUCIÓN NORMAL ............................................................................................... 157

APÉNDICE 2 VALORES CRÍTICOS DE LA DISTRIBUCIÓN T DE STUDENT .............................. 158

APÉNDICE 3 VALORES CRÍTICOS DE LA DE DISTRIBUCIÓN F DE FISHER ............................ 159

APÉNDICE 4 PROBABILIDADES BINOMIALES ................................................................................. 163

APÉNDICE 5 DISTRIBUCIÓN T DE STUDENT: SIGNIFICANCIA DE CORRELACIONES DE

PEARSON ..................................................................................................................................................... 168

APÉNDICE 6 VALORES CRÍTICOS DEL ESTADÍSTICO DE Q ........................................................ 169

APÉNDICE 7 TABLA DE NÚMEROS AL AZAR ................................................................................... 170

BIBLIOGRAFÍA .......................................................................................................................................... 174

Page 7: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

DEDICATORIA

Quiero dedicar esta obra, a mi querida esposa

Bedsy Anais, a mis hijas e hijos: Lisbet, Marta,

Gerardo y Juan Carlos, símbolos permanentes

de mi existencia, mis principios y mi amor por

la vida.

Page 8: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

AGRADECIMIENTO

Esta obra no se hubiera podido haber completado, sin la colaboración permanente de la Psicóloga

Elsa I. Fajardo, Magister en Estadísticas Aplicadas, quien colaboró desde un principio con el

desarrollo de este trabajo a través de sus observaciones, críticas y evaluaciones técnicas, de manera

desinteresada, honrada y motivadora.

Es necesario extender este agradecimiento al Psicólogo Rubén Díaz, quien aportó en el desarrollo

de esta obra, además de sus conocimientos en el área, una dimensión técnica de presentación de

gráficos, cuadros y fórmulas, que me ayudaron a enriquecer el objetivo principal de esta obra:

llegar a mis estudiantes con la mayor claridad y objetividad posible.

También deseo expresar mi gratitud, a mis estudiantes de las Escuelas de Psicología de la

Universidad de Panamá y la Universidad Católica Santa María La Antigua, quienes han sido a lo

largo de estos años de docencia, mi fuente de inspiración para transmitir, de la manera más

eficiente, la importancia que tiene una especialidad, considerada por la mayoría como difícil, pero

insustituible en el desarrollo de la investigación del comportamiento: las estadísticas.

Gerardo A. Valderrama M.

Page 9: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

PRÓLOGO

La presente obra es un texto de estadísticas descriptivas e inferenciales dirigida especialmente a los

futuros psicólogos, estudiantes de licenciatura en Psicología. La finalidad principal es ofrecer a los

estudiantes un libro que integre las herramientas de análisis estadísticos y sus aplicaciones a su

quehacer profesional.

Su autor ha dedicado más de 30 años de su vida a la docencia en materia de Estadísticas,

Investigación y Medición Psicológica así como una invaluable experiencia en numerosas

investigaciones a nivel nacional e internacional. Su amplia experiencia y estudios garantizan que la

presente obra cuente con el rigor estadístico y aplicación psicológica necesarias tanto para el

público objetivo de la misma, como para cualquier otro profesional de las Ciencias Sociales que

requiera este nivel de conocimientos.

Este libro permite adentrarse en el ámbito de la ciencia, la psicología, la investigación del

comportamiento humano y a la vez aplicar los modelos y análisis estadísticos pertinentes.

El texto va desde un nivel introductorio sobre la relación inherente de la ciencia, la psicología, la

medición del comportamiento y la naturaleza estadística de los datos hasta llegar a los distintos

análisis estadísticos que aplican desde los más básicos (resumen de datos en tablas, gráficas,

medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

poblaciones de probabilidades y pruebas de hipótesis).

El texto es de fácil manejo y con suficientes definiciones, demostraciones y prácticas para que el

estudiante logre aprehender su contenido. Por su amigable lenguaje y ejemplos aplicados, requiere

una preparación matemática básica.

Esta obra logra abordar temas extremadamente densos y complejos como las pruebas de hipótesis y

el análisis de varianza pero tomando de cada uno lo medular: concepto, aplicación, cálculo e

interpretación de manera inusualmente práctica y manejable. Sin perder, el rigor estadístico

requerido.

En resumen, esta obra académica constituye una alternativa de aproximación para la integración de

la teoría psicológica, la práctica y la investigación.

Elsa Isabel Fajardo

Lcda. en Psicología

Mgtra. en Estadísticas Aplicadas

Page 10: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

INTRODUCCIÓN

Al iniciar un curso de estadísticas aplicadas en psicología, es frecuente que algunos estudiantes se

me aproximen y cuestionen sobre la pertinencia de las matemáticas, específicamente, de las

estadísticas, en los estudios relacionados con las ciencias del comportamiento. Es evidente que aún,

algunos estudiantes conciben a la psicología como una especialidad teórico-práctica, cuyo objetivo

principal es la atención de los problemas de los sujetos, ya sean de carácter individual y/o grupal,

exenta de aspectos cuantitativos que impliquen cuantificación y manipulación matemática.

Además, por lo general los estudiantes que ingresan a psicología no son “fanáticos” de las

matemáticas y mantienen una actitud poco favorable para el estudio sistemático de la misma. Sin

embargo, no puedo negar que hay un cambio de actitud en lo referente a la importancia que se le da

a las estadísticas en la formación profesional del psicólogo; no hay alternativa, si queremos ser

competentes y competitivos.

En la década de los 80, cuando la Escuela de Psicología de la Universidad de Panamá formaba parte

de la Facultad de Filosofía, Letras y Educación, confeccionamos un “folleto” que denominamos:

Estadística Descriptivas Aplicadas en Psicología,, con el cual intentamos aproximarnos

académicamente, a nuestros estudiantes, transmitiéndole nuestros conocimientos, inquietudes y

actitudes hacia esta asignatura, en un lenguaje más amistoso, y más propio de nuestra cultura y de

mi perspectiva personal de la materia. El folleto fue exitoso desde el momento en que muchos

estudiantes lo obtuvieron y lo utilizaron, ya sea como texto o como apoyo bibliográfico para

reforzar su proceso de aprendizaje.

Es importante destacar que siempre han existido excelentes textos de estadísticas al alcance de

nuestros estudiantes, inclusive haciendo énfasis en su aplicabilidad en las ciencias del

comportamiento. Más sin embargo, desde mi punto de vista, los mismos por lo general estaban

polarizados: por un lado, encontramos los cargados en matemáticas que eran un verdadero dolor de

cabeza para los estudiantes; y por otro, aquellos que consideraban a los estudiosos de la psicología,

sujetos incapaces de aproximarse exitosamente a los procesos de razonamiento numérico, y se

caracterizaban por su exagerada simplicidad, convirtiéndolos en textos con muy poco nivel

cuantitativo. El detalle estaba en lograr concebir un texto que, sin caer en exigencias matemáticas

innecesarias, pero respetando su pertinencia, tanto teórica como práctica, favoreciera el estudio

sistemático de las estadísticas y permitiera al estudiante su aplicación, con validez, sistematización

y sustento científico.

A continuación presentamos de manera experimental, nuestra concepción de las estadísticas

básicas que deben ser dominadas por un profesional de la psicología. Está escrito con nuestras

propias palabras, actitudes, sentimientos y emociones; tal y como me dirijo al estudiante en el aula

de clases. Espero que esta forma de comunicación mejore el interés de los estudiantes hacia la

asignatura, reduzca un poco la brecha que hay en términos de razonamiento cuantitativo y

modifique las actitudes hacia esta importante asignatura, cuyo conocimiento es inevitable para todo

aquel profesional de las ciencias del comportamiento, respetuoso de sus obligaciones hacia sus

pacientes y la sociedad…. Pero no olvide esta premisa: mientras más conocimientos tenga en el área

de las matemáticas, y mejor actitud manifieste hacia la utilización de las mismas en la profesión,

indudablemente que será un mejor psicólogo…no le quepa la menor duda.

Page 11: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

El presente texto, que hemos denominado: Estadísticas Aplicadas en Psicología…Ciencias

Sociales y Educación, consta de 13 capítulos de estadísticas aplicadas formales y un capítulo de

problemas y ejercicios. Los 13 capítulos están organizados de tal manera, que permiten dividir los

contenidos en las dos grandes áreas de conocimientos y estudio de las estadísticas: la descriptiva y

la inferencial. Además, antes de adentrarnos en el procesamiento y análisis de datos, intentamos

una importante aproximación a la investigación aplicada en psicología, que en mi opinión

representa el más alto nivel de desarrollo profesional en esta especialidad (junto con la

investigación básica o pura). La estadística es una herramienta fundamental en el desarrollo de la

actividad científica para los psicólogos. Dos aspectos ineludibles de la esta profesión están

fundamentados en las estadísticas: la medición del comportamiento, desde sus perspectivas teóricas

y prácticas, y la investigación científica.

El área de la estadística descriptiva la comprenden los capítulos que se refieren a la naturaleza de

las estadísticas (2), la organización de datos (3), las representaciones gráficas (4), las medidas de

tendencia central (5), las medidas de variabilidad (6), los modelos poblacionales (7) y la correlación

y regresión (8). En estos capítulos presentamos, analizamos, discutimos y desarrollamos ejercicios,

con el objetivo de que el estudiante comprenda de qué manera se le hace frente a la información

cuantitativa que se utiliza en los diversos estudios comportamentales; todo proceso de análisis

estadístico requiere de la descripción de los datos, esto es ineludible.

La estadística inferencial está desarrollada en los capítulos de estadística inferencial y

probabilidades (9), de la población a la muestra (10), introducción a la prueba de hipótesis (11),

principales tipos de pruebas de hipótesis (12) y

análisis de la varianza (13). En esos capítulos compartimos nuestras experiencias y conocimientos

en lo referente al estudio de las poblaciones a través de muestras, que es el procedimiento más

efectivo para investigar los grandes conjuntos de datos. Esta situación obliga al psicólogo a

comprender que entre la población y la muestra hay diferencias, y que si está verdaderamente

interesado en interpretar correctamente los resultados, debe saber comprender e interpretar estas

diferencias, a través de la comprensión del papel que juega en las decisiones de la psicología, la

teoría de la probabilidad; esto es en el fondo, el objetivo que tratamos de alcanzar con estos

capítulos de introducción a la inferencia estadística

Este libro es muy sencillo en comparación con otros, es menos matemático en comparación con

otros, respeta la cuantificación y la importancia de las matemáticas en la actividad del psicólogo en

comparación con otros. Sin embargo está hecho con amor y respeto hacia los estudiantes y hacia

los conocimientos que intento representar. Pedimos disculpas por los errores que encuentren a lo

largo de la lectura y estamos totalmente anuentes a las observaciones que tengan a bien

hacernos……..Y no olviden: más conocimientos y mejor actitud hacia la investigación cuantitativa,

mayores probabilidades de éxito profesional, especialmente en las áreas referentes al

comportamiento humano.

Gerardo Abraham Valderrama Morales.

Page 12: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

1

CAPÍTULO 1

ESTADÍSTICAS Y PSICOLOGÍA

Al iniciar un curso de estadísticas para estudiantes de psicología, es frecuente que algunos de ellos,

intrigados, pregunten la razón por la cual en esta especialidad es necesario estudiar una asignatura

con un contenido cuantitativo importante. La concepción generalizada es que la psicología es una

especialidad teórico-práctica, cuyo objetivo principal es “atender” problemas de conducta, tanto

individuales como grupales, sin la participación de elementos cuantitativos; seamos más objetivos,

sin matemáticas.

Esta actitud de duda, y en algunas ocasiones de rechazo, está relacionada con la experiencia y

formación previa de muchos estudiantes en al área de las matemáticas, la cual con mucha frecuencia

ha sido dolorosa y de aporte limitado, en cuanto al desarrollo del conocimiento. Es común en los

estudiantes una actitud de temor y poco interés hacia esta área científica. La situación anteriormente

descrita no es exclusiva de los estudiantes, al observarse la misma en algunos profesionales del área

del comportamiento en cualquiera de sus especialidades, haciendo más difícil la transmisión del

conocimiento de los temas que involucran la cuantificación al momento de estudiarse el

comportamiento humano.

Sin embargo, a pesar de lo anteriormente señalado, la mayoría de los especialistas en el

comportamiento coinciden en que la psicología dio sus primeros pasos como una ciencia, a partir

del momento en que logró aplicar el método científico. En mi opinión, esto sucedió específicamente

en el momento en que se logró definir los conceptos teóricos presentes en las teorías de manera

operacional, lo cual trajo como consecuencia inevitable: la medición del comportamiento. A partir

de esta situación, la psicología contó con una nueva herramienta que favoreció la transición de la

especulación a la observación más directa y natural de los fenómenos comportamentales, y su

posterior análisis objetivo y preciso. Había nacido la psicología científica.

La medición psicológica, a través de las definiciones operacionales, permitió adscribirle valores

numéricos, no solamente a algunos fenómenos de observación directa asociados con el

comportamiento tales como la estatura, el peso corporal, la presión sanguínea, etc., sino a otros que

no se pueden observar directamente con tanta facilidad, tal y como sucede con factores

comportamentales tales como la inteligencia, las actitudes, las aptitudes, y otros. De esta manera,

las matemáticas se convirtieron en colaboradoras permanentes de la investigación psicológica en la

solución de sus problemas: la comprobación científica, era una realidad.

Las estadísticas aplicadas han resultado ser el conjunto de técnicas matemáticas de mayor eficiencia

en la investigación psicológica. Ya Lun Chou (1972) presentó una definición del término

estadística muy importante para los investigadores en general y en especial, para los psicólogos:

“la estadística es un método empleado en la toma de decisiones frente a la

incertidumbre, partiendo de datos numéricos y calculando los riesgos”

Page 13: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

2

Esta definición cuenta con cuatro elementos fundamentales, a través de los cuales se justifica

plenamente la pertinencia de las estadísticas en la investigación psicológica: toma de decisiones,

incertidumbre, datos numéricos y riesgos; veamos su relación con la psicología.

La psicología es una ciencia muy especial. No cuenta con un cuerpo único y universal de teorías e

hipótesis; por el contrario, cuenta con un número plural de éstas, a través de los cuales se intenta

describir, explicar, analizar e interpretar la conducta del hombre; la psicología cuenta con muchas

corrientes o escuelas. Lo importante de esta situación es que todas funcionan a niveles teóricos y

que requieren, constantemente de comprobación y evaluación de sus postulados teóricos y

epistemológicos. En otras palabras, el psicólogo se enfrenta constantemente a la toma de

decisiones sin importar a que corriente psicológica pertenezca o en qué área de la psicología esté

laborando. Todo problema del comportamiento, ya sea individual o grupal, requiere de una toma de

decisión, y muchos de ellos necesitan la cuantificación de sus variables y el análisis estadístico

requerido para lograr una solución científicamente acertada.

Los problemas asociados con el comportamiento no son estáticos, muy por el contrario, son muy

dinámicos. Son universales pero pueden diferir de sujeto a sujeto, de sociedad a sociedad, de

población a población, de muestra a muestra; lo que es válido para un grupo no lo es para otros, lo

que se logró demostrar hoy, no se repite en las mismas condiciones mañana, y así sucesivamente. El

psicólogo se enfrenta a la incertidumbre propia de los fenómenos conductuales, la cual ha

encontrado en la teoría de la probabilidad un modelo de explicación, evaluación e investigación; la

conducta no es exacta en su medición y evaluación, sino aproximada. La conducta es

probabilística.

La psicología, a través de las escalas de medición, ha logrado asignarle valores numéricos a sus

constructos teóricos cuando éstos se han definido operacionalmente, favoreciendo de esta manera la

evaluación del comportamiento con niveles de objetividad muy satisfactorios. Partiendo de la

premisa de que la medición del comportamiento no es exacta sino aproximada, las estadísticas

aplicadas a la investigación del comportamiento han logrado incorporar el concepto de

probabilidad a la medición y evaluación comportamental. El análisis estadístico ha permitido

calcular los riesgos propios de esta actividad, favoreciendo la minimización de los errores y la

disminución de la incertidumbre al momento de la toma de decisiones.

Las estadísticas están estrechamente ligadas con la psicología, en la medida en que los estudiantes,

profesores y especialistas del comportamiento, en cualquiera de sus áreas e independientes de su

formación, le den relevancia a la investigación científica y consideren esta actividad, el método más

adecuado para conocer y comprender el comportamiento humano. En tal caso, las estadísticas serán

la mejor herramienta para la evaluación comportamental precisa., válida y confiable.

E S T A D Í S T I C A S E I N V E S T I G A C I Ó N

Partiendo de la premisa de que la investigación científica es una actividad fundamental en el

desarrollo de la psicología, y de que las estadísticas son herramientas básicas en la investigación del

comportamiento, a continuación presentamos un resumen de los principales pasos a seguir en el

proceso de investigación. Además, intentaremos ir señalando los momentos en que el investigador

Page 14: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

3

debe ir tomando en consideración los procedimientos estadísticos requeridos para la ejecución

exitosa de una investigación.

E t a p a 1

1. Planteamiento del problema

Toda investigación nace a partir del planteamiento de un problema que requiere una solución. En el

caso de los estudiantes, y principalmente por falta de experiencia, el problema nace de la intuición,

de sus intereses personales o sencillamente porque se le ocurrió. Con mucha frecuencia, cuando los

problemas a investigar nacen de alguna de las formas anteriormente señaladas, se presentan

problemas de orden metodológico que dificultan el desarrollo del estudio.

Los problemas a investigar no se inventan, ellos existen; el detalle está en tener la habilidad para

detectarlo y definirlo con claridad y objetividad, evitando confusiones y tratando de hacerlo lo más

sencillo posible: el principio de la parsimonia. La observación, la lectura especializada, el estudio

constante y sistemático y la discusión científica objetiva y desapasionada, son fuentes inagotables

de ideas que pueden cristalizar en problemas de investigación genuinos.

2. Revisión Bibliográfica

Una vez planteado el problema, es necesaria una revisión exhaustiva de la información científica

recabada sobre el problema planteado: investigaciones previas, teorías, ensayos, conferencias,

entrevistas personales, y toda fuente de información que brinde información objetiva y científica. El

objetivo principal de esta revisión, es el de encontrar (descubrir) posibles soluciones, variables y sus

relaciones, explicaciones teóricas (modelos), que permitan al investigador desarrollar una

explicación coherente y científica de los factores que inciden en el problema planteado y que a la

vez favorezcan el desarrollo de un modelo teórico aplicable a dicho problema; a esta estructura se le

llama con frecuencia Fundamentación Teórica del Problema. A través de esta figura, el

investigador crea un modelo teórico que debe explicar de manera organizada la estructura dinámica

del problema (variables y relaciones) y debe plantear una posible solución al mismo. De aquí se

desprenden las hipótesis de investigación.

En la actualidad, gracias al desarrollo de la tecnología, el conocimiento es más fácil de obtener que

en décadas pasadas, en las cuales los investigadores sólo dependían de las bibliotecas, librerías,

congresos, etc., para la consecución de los últimos conocimientos científicos. Con el desarrollo de

los ordenadores y el advenimiento del Internet, el conocimiento está a la vuelta de un “click”, que

permite accesar fuentes inagotables de información al servicio de la investigación científica.

E t a p a 2

Metodología

Luego de planteado el problema, fundamentado teóricamente tras una revisión bibliográfica

efectiva, y planteadas las correspondientes hipótesis, la siguiente etapa consiste en establecer

sistemáticamente los procedimientos, las técnicas, la logística y los controles requeridos para llevar

adelante el estudio, preferiblemente en una muestra de sujetos seleccionados de la población

Page 15: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

4

pertinente al problema de investigación. Esta fase se conoce como metodología y a continuación

presentamos algunas características de la misma.

1. Tipo de Investigación

Las investigaciones deben definirse dentro de ciertos parámetros que permitan identificar con

claridad los elementos propios del problema y las condiciones requeridas para la solución del

mismo. Las investigaciones pueden clasificarse como básicas cuando tienen como objetivo crear o

alimentar las teorías ya existentes; también se les conoce como puras. Las investigaciones también

pueden ser definidas como aplicadas, cuando su objetivo es la solución de un problema dentro de

un contexto social. Atendiendo a las dos definiciones señaladas anteriormente, las investigaciones

que se desarrollan en nuestro contexto científico pueden ser básicas o aplicadas, siendo las más

frecuentes, éstas últimas.

Las investigaciones también se pueden clasificar como de campo cuando se desarrollan en un

contexto social específico, y de laboratorio cuando las condiciones de control son muy rigurosas y

por lo general las variables no se manifiestan naturalmente.

2. Diseño de Investigación

La tarea de diseñar corresponde a la definición y delimitación de las condiciones de control a través

de las cuales se va a investigar un problema específico. El objetivo fundamental del diseño es el de

aislar la variable independiente a tal punto que los resultados obtenidos se deban, presumiblemente,

a la acción de dicha variable y no de otras variables rivales. Los diseños pueden ser experimentales,

cuasiexperimentales, no experimentales, correlacionales, etc., atendiendo a las situaciones de

manipulación de las variables involucradas.

3. Variables

Las variables corresponden a ciertas propiedades que se dan en los sujetos, tomando en

consideración, las diferencias individuales. Estas son susceptibles de ser manipuladas por el

investigador. Las tres variables identificadas como las más importantes en todo proceso de

investigación son: la independiente, la dependiente y las extrañas. De acuerdo a Aroldo

Rodríguez (1977), estas variables se pueden definir de la siguiente manera:

Variable Independiente: es la propiedad manipulada por el experimentador y que se supone

será responsable de las modificaciones de la propiedad observada mediante la investigación

experimental.

Variable dependiente es la propiedad afectada por la variable independiente; es la que se

supone debe modificarse y esta modificación debe ser susceptible de ser medida y evaluada por

el investigador.

Variables extrañas son aquellas que pueden influir en los resultados del experimento sin que

en el modelo su efecto esté considerado. Las variables extrañas compiten con la variable

independiente y por lo general son las que el investigador intenta controlar en su diseño.

Page 16: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

5

4. Muestras

Se refieren a conjuntos o grupos de sujetos seleccionados de las poblaciones en las cuales se

desarrollan las investigaciones. Las muestras pueden ser representativas o no representativas de una

población, y estas condiciones son importantes al momento de analizar estadísticamente los

resultados, en vista de que la elección del modelo estadístico está determinada por la

representatividad o no de la muestra con respecto de una determinada población.

5. Técnicas de Medición

En psicología, los resultados obtenidos en una investigación son recabados a través de instrumentos

de medición especiales denominados, por lo general, test psicológicos. Los psicólogos cuentan con

una pluralidad de organizaciones internacionales que se responsabilizan por la construcción de tests,

aplicables en casi todas las situaciones de medición y evaluación del comportamiento. Estos tests

son construidos siguiendo teorías y métodos muy especializados, lo que permite que dichos

instrumentos sean objetivos, válidos y confiables. Sin embargo, los psicólogos deben estar

preparados para hacerle frente a situaciones en las cuales los instrumentos utilizados no satisfacen

plenamente los criterios científicos de construcción de pruebas pero sus resultados deben ser

utilizados a pesar de estas deficiencias. En otras ocasiones, los psicólogos deben construir los

instrumentos de medición requeridos para sus estudios.

En cualquiera de estos casos, los psicólogos deben estar en capacidad de construir los instrumentos

de evaluación psicológica que requieran para sus estudios e investigaciones. Es una obligación del

psicólogo conocer con rigurosidad las teorías y técnicas propias de la medición psicológica, ya sea

para interpretar resultados provenientes de pruebas de calidad indiscutible, como para construir los

test que necesite en situaciones específicas. En el caso de la medición psicológica, la estadística es

una herramienta crucial en la elaboración de test.

6. Modelo Estadíst ico

Se refiere a los procedimientos de procesamiento y análisis estadístico de los datos que provienen

de las investigaciones. Incluye los supuestos, modelos, metodología y pruebas estadísticas

requeridas en la investigación. Los modelos estadísticos pueden ser paramétricos o no paramétricos

y los mismos están apoyados por supuestos de carácter probabilísticos.

Los modelos estadísticos que se utilizan en las investigaciones están previamente determinados por

el problema planteado, las hipótesis de investigación, el tipo y diseño de investigación, el tipo de

medición de las variables involucradas y los instrumentos o test psicológicos aplicados en el estudio

E t a p a 3

1. Análisis Estadíst ico

Una vez recogida la data proveniente de las mediciones psicológicas, el paso siguiente sería la

organización y análisis estadístico de los resultados obtenidos, utilizando los modelos, metodología

y procedimientos estadísticos previamente señalados. Básicamente se desarrollan dos tipos de

análisis: descriptivos y/o inferenciales.

Page 17: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

6

2. Discusión

Concluido los análisis estadísticos, los resultados deben ser discutidos y analizados a la luz de los

objetivos del estudio y/o las hipótesis planteadas. En esta sección, el investigador no se circunscribe

únicamente a verificar sus objetivos y/o hipótesis, sino que observa el comportamiento de los datos

y analiza elementos adicionales y complementarios, que permiten enriquecer y profundizar en la

información obtenida, en muchas ocasiones, más allá de sus objetivos e hipótesis originales.

3. Conclusiones y recomendaciones

Finalmente, atendiendo a los resultados obtenidos en el análisis estadístico, el investigador está en

condiciones de concluir si los objetivos del estudio se alcanzaron plenamente, medianamente o no

se alcanzaron, y si las hipótesis planteadas fueron verificadas o no.

Las tres Etapas presentadas anteriormente, son un esbozo general de los principales pasos que se

siguen en el desarrollo de una investigación. El objetivo principal de la presentación de las mismas

ha sido el de establecer, con la mayor claridad posible, en qué momento de la investigación las

estadísticas son pertinentes. Como se observó, el modelo estadístico es el último punto de la Etapa 2

y el análisis estadístico es el primero de la Etapa 3. Esto debe ser así, porque las estadísticas están

condicionadas a los fundamentos teóricos del problema y a los aspectos metodológicos inherentes al

mismo. Para ser más específico, en una investigación, las estadísticas están determinadas por las

siguientes condiciones:

1. Los objetivos de la investigación

2. Las hipótesis de la investigación

3. El tipo de investigación y el diseño de investigación a desarrollar

4. El nivel de manipulación de las variables independientes

5. Los sujetos participantes del estudio: puede tratarse de una población o una muestra. Si se trata

de una muestra es determinante si la misma es aleatoria o no, si es una muestra grande o

pequeña, si se trata de una sola muestra o de varias muestras.

6. Las técnicas de medición que se utilizaron para recabar la información. Esto incluye las

características psicométricas de los instrumentos de medición, la escala de medición de las

variables, etc.

Las estadísticas aplicadas en una investigación no deben ser una improvisación de última hora,

como se observa frecuentemente en algunos trabajos de graduación. El modelo estadístico debe ser

planificado al momento de diseñarse la investigación. Es común observar a estudiantes e inclusive a

profesionales de la psicología solicitar asesoría estadística después de haber desarrollado la

investigación (recogido la data) casi en su totalidad. Cuando esto sucede, se corre el riesgo de que la

estructura metodológica del estudio no coincida con los objetivos e inclusive, las hipótesis del

estudio. En muchos casos, las investigaciones no se pueden concluir tal y como fueron diseñadas y

los investigadores deben hacer profundas modificaciones a las mismas o, inclusive, desistir del

estudio.

Page 18: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

7

C O N C E P T O S I M P O R T A N T E S

Desarrolle cada uno de los conceptos presentados en la columna anterior. Intente establecer el

significado técnico de cada uno de ellos e interrelacionarlos en la actividad de la investigación

psicológica. Es importante que trate de alcanzar un nivel de comprensión importante para cada uno

de ellos. Como verá posteriormente, son básicos para el diseño de investigaciones psicológicas.

Estadística

Incertidumbre

Riesgos

Parsimonia

Metodología

Diseño

Variables

Población

Muestra

Test psicológico

Medición psicológica

Modelo estadístico

Estadística descriptiva

Estadística inferencial

Page 19: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

2

CAPÍTULO 2

LA NATURALEZA DE LAS ESTADÍSTICAS

La estadística se puede definir como el conjunto de métodos que se emplean para la toma de

decisiones. Los problemas psicológicos que se tratan de resolver a través de la investigación

científica, en especial aquellos en los que el análisis estadístico es pertinente, están afectados por la

“incertidumbre”, la cual proviene de la capacidad que tienen los datos numéricos de reflejar, con

cierta precisión, los fenómenos comportamentales que se analizan para determinada población.

FIGURA 2—1

Los fenómenos psicológicos se dan en poblaciones de sujetos. En algunas ocasiones estos

problemas se pueden investigar directamente sobre la población (censo), pero en la mayoría de las

situaciones, es imposible analizar la totalidad de la población, y el estudio se desarrolla entonces

con una parte de la misma a la que se denomina muestra. Las muestras, que son sub conjuntos de

las poblaciones mayores, están constituidas por un número mucho menor de sujetos, situación que

determina que los resultados numéricos o estadísticos de éstas no sean iguales a los de la población;

por lo que se produce, lo que en estadísticas se denomina error de muestreo.

Como el interés está centrado en tomar una decisión sobre una población a partir de una muestra

que está afectada de errores, los investigadores están en la obligación de analizar los errores de las

muestras para tomar una decisión con relación a la población partiendo de los datos de la muestra

(ver Figura 2—1).

Para que las decisiones estadísticas sean lo más acertadas posibles, los errores cometidos se

analizan a través de teorías y métodos estadísticos que permiten establecer hasta qué punto los

errores son significativos o no; en otras palabras, lo que se trata de establecer es si la muestra, a

pesar de los errores que presenta en comparación con la población, es lo suficientemente

representativa de la misma como para considerarse que sus resultados son “semejantes” a los que se

hubieran obtenido en la población de haberse analizado estadísticamente esta última.

Para llegar a este nivel de precisión estadística, se debe hacer uso de la Teoría de la Probabilidad,

que analiza y evalúa las diferencias entre muestras y poblaciones en términos de probabilidad (ver

Figura 2—2)

POBLACIÓN

MUESTRA

RIESGO ERROR

DECISIÓN

Page 20: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

3

FIGURA 2—2

Es importante destacar la trascendencia que tiene el concepto de “incertidumbre” en el análisis

estadístico. Hay una fuente de incertidumbre que corresponde a aquellas situaciones en las que el

estado natural del fenómeno se puede conocer; este es el caso de la incertidumbre que se genera en

los juegos de azar; lotería, dados, cartas, etc. En estas situaciones se conoce de antemano cuáles son

los eventos que se pueden dar en cualquier experimento e inclusive cuáles son las probabilidades

correspondientes a cada uno de ellos; veamos un ejemplo:

TABLA 2-1:

Experimento denominado lanzamiento de un dado de seis caras

Eventos 1 2 3 4 5 6

Probabilidad 1/6 1/6 1/6 1/6 1/6 1/6

Al lanzarse un dado común, sabemos de antemano qué eventos se pueden producir e inclusive

conocemos las probabilidades de cada uno de ellos; la incertidumbre nace del desconocimiento de

cuál será el evento que se presentará en un acto específico, dado que todos tienen las mismas

probabilidades. Nosotros conocemos el estado natural del dado y por lo tanto podemos hipotetizar

sobre los posibles resultados a obtener. Veamos otro ejemplo.

TABLA 2-2:

Experimento denominado lanzamiento de dos dados de seis caras

Evento 2 3 4 5 6 7 8 9 10 11 12

Probabilidad 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

Al lanzarse los dos dados, independientemente de las veces que sean lanzados, la suma de los

puntos de las caras superiores daría resultados entre 2 y 12. Se observa, además, que las

probabilidades varían para cada uno de estos posibles resultados: el 2 tiene 1/36 de ocurrir, el 5

tiene 4/36, el 7 tiene 6/36, etc. Esto significa que al arrojarse los dos dados, potencialmente

conocemos los eventos que pueden suceder, e inclusive, las probabilidades para cada uno de ellos.

TEORÍAS Y

MÉTODOS

ESTADÍSTICOS

ERRORES

DECISIONES

ACERTADAS

Riesgos

calculados

Probabilidad

Page 21: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

4

En este caso, la incertidumbre nace de las distintas probabilidades asignadas a cada evento: hay

eventos con más probabilidades y otros con menos.

En los dos experimentos anteriormente analizados, se conoce el estado natural de cada fenómeno y

sus probabilidades, siendo esto último la fuente de la incertidumbre.

El problema para los psicólogos radica en que no se conoce, con tanta facilidad, el estado natural de

los fenómenos comportamentales, ni tampoco las probabilidades asignadas a cada uno de ellos. Este

desconocimiento a priori de los hechos y sus probabilidades, es la fuente de incertidumbre para el

investigador del comportamiento.

Veamos un ejemplo. Supongamos que estamos interesados en investigar las actitudes de los

estudiantes universitarios hacia la apertura del denominado Tapón del Darién. Supongamos además,

que esta actitud va a ser evaluada en una escala de 1 a 5, en la que 1 significa totalmente en

desacuerdo y 5 significa totalmente de acuerdo. Al aplicarse el instrumento de medición, sabemos

de antemano que los resultados numéricos para cada encuestado puede ser numéricamente entre 1 y

5, pero no sabemos a priori, el estado natural de cada uno de estos eventos en la población de

estudiantes; no sabemos cuáles son sus probabilidades, tal y como sucede con los dados. Esto

significa que en psicología, la fuente principal de incertidumbre es el desconocimiento del estado

natural de los fenómenos conductuales en las poblaciones. Solamente se logra disminuir esta

condición de incertidumbre, desarrollando observaciones empíricas en las poblaciones

(investigaciones), analizando los resultados obtenidos y estableciendo de manera a posteriori, cuales

son los eventos que se dan y las probabilidades de cada uno de ellos.

L A S P O B L A C I O N E S

Una población se puede definir como un conjunto completo de elementos individuales, definidos

dentro de un problema específico. Por lo general, las poblaciones se definen como un conjunto de

cosas o sujetos, que se manifiestan, por lo general, en grandes cantidades. La cantidad no es lo

importante en este momento, porque hay poblaciones constituidas por pequeñas cantidades de

unidades individuales como también las hay constituidas por grandes cantidades. Lo importante es

tener claro que para la investigación, una población existe a la luz de un problema específico y que

contiene la totalidad de unidades que se desean investigar.

Sobre cada una de estas unidades individuales se hacen observaciones directas que son las que en

última instancia ofrecen la información cuantitativa referente al problema psicológico a investigar.

Por ejemplo, si estamos interesados en investigar las aptitudes numéricas de los aspirantes a

ingresar a Psicología, las puntuaciones obtenidas por cada uno de ellos en la prueba de aptitud es

considerada como una observación, y todas las observaciones (puntuaciones) obtenidas de la

totalidad de aspirantes constituye la población.

El número de sujetos que conforman una población también permite definir a las mismas como:

infinitas si el número de sujetos es muy grande y finitas si el número es pequeño. En la

investigación psicológica, por lo general las poblaciones a investigar se consideran finitas.

Page 22: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

5

M E D I C I Ó N D E L A S V A R I A B L E S P S I C O L Ó G I C A S

Los atributos, características o propiedades psicológicas susceptibles de ser definidas

numéricamente se denominan variables. La característica principal de una variable es que puede

adquirir distintos valores atendiendo a las diferencias individuales. Algunos ejemplos de variables

psicológicas son: la inteligencia, el autoritarismo, la ansiedad, el liderazgo, el aprovechamiento, los

intereses, las aptitudes, la tolerancia, etc. Supuestamente, cada una de estas variables es susceptible

de ser medida y esto debe reflejar las diferencias que se pueden dar de sujeto a sujeto atendiendo a

las individualidades.

Al respecto de definir una variable, Kerlinger (1979) dice:

“Los científicos designan de manera un tanto vaga con el término de variable a las

construcciones hipotéticas o propiedades que estudian. Podemos afirmar que una

variable es una propiedad que adquiere distintos valores; diremos que una variable es

algo que varía”

Las variables pueden ser continuas o discretas. Una variable continua es aquella que puede asumir

cualquier valor dentro de un intervalo; puede asumir valores fraccionales. Una variable discreta es

aquella en la que las mediciones no pueden asumir valores fraccionales tales como el sexo, número

de hijos, correcto-incorrecto, etc. Chou (1972) hace algunos señalamientos al respecto de variables

continuas y discretas:

“Una serie continua es una variable que puede asumir cualquier valor numérico dentro

de un recorrido específico. Por otro lado, la naturaleza de cierto tipo de datos es tal que

la unidad de medida se puede definir solamente en términos enteros; una serie en la que

las medidas no pueden darse entre las unidades de escala se llama serie discreta”

E S C A L A S D E M E D I C I Ó N

Hasta este punto de la lectura se puede observar que hay un aspecto importante en lo referente a la

aplicación de las estadísticas en la investigación científica: la medición de los fenómenos

naturales, en nuestro caso, de los fenómenos comportamentales. Por esta razón, es necesario

discutir cuáles son las alternativas con las que se enfrenta un investigador al momento de definir o

decidirse por una escala de medición para sus observaciones.

Las mediciones se pueden dar en uno de cuatro niveles y cada uno de ellos corresponde a una escala

de medición determinada: nominal, ordinal, de intervalos y de razones. Además, es necesario

destacar que cada escala satisface ciertas condiciones que favorecen la realización de ciertas

operaciones matemáticas. Estas condiciones están satisfechas por una serie de postulados básicos de

la medición, los cuales presentamos a continuación.

Postulado #1: ( ) ( ) . Este postulado es básico para establecer

clasificaciones y señalar si los objetos son iguales o diferentes de acuerdo a una característica

especial.

Page 23: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

6

Postulado #2: ( ) ( ) ( ). Este postulado, de tipo transitivo, es

importante para determinar la igualdad de dos o más eventos atendiendo a una o más

características comunes.

Postulado #3: ( ) ( ) ( ). Este postulado también es de

transitividad, e incorpora un concepto de mucha importancia en la medición psicológica como

lo es “mayor que” y “menor que”, en el que se basan la mayoría de las mediciones que se

hacen en psicología.

Al respecto Kerlinger señala:

“en dicho postulado se fundan la mayoría de las mediciones psicológicas y pedagógicas.

Hemos de estar en condiciones de hacer enunciados de tipo ordinal o de ordenación por

rangos”

1. Escala Nominal

Corresponde al nivel más bajo de medición y con la misma se alcanza únicamente la

identificación de sujetos u objetos, ya sea por el nombre o por un número. Por ejemplo: los

números con los que identifican a los jugadores de un equipo de baloncesto, las clasificaciones

por categorías tales como altos o bajos, masculinos o femeninos, etc.

2. Escala Ordinal

Representa un avance en comparación con la nominal, porque requiere de la ordenación de los

objetos o sujetos por rangos, atendiendo a cierta condición o característica en particular; los

operadores mayor que (>) y menor que (< ) son fundamentales. Esta escala demuestra quién es

mayor o menor, quién está por encima o quién por debajo, qué es más duro o más blando, etc. A

pesar de que brinda información sobre quién posee más o menos del atributo, no brinda

información sobre la cantidad de atributo de cada sujeto u objeto.

3. Escala de Intervalos:

Tiene sus propias características, pero además posee las de la escala nominal y la ordinal. Su

característica principal es que las unidades de medición son iguales, situación ésta que le permite

una manipulación algebraica mucho más amplia que los casos anteriores. Las escalas de

temperatura, el tiempo, las escalas de medición psicológicas, etc., son ejemplos de esta situación.

Presentamos un ejemplo:

a b c d e

1 2 3 4 5

La escala que se presenta con anterioridad, supuestamente mide una propiedad (X) en cinco

posibles alternativas. Se supone que las unidades de medición entre cada alternativa son iguales

y por lo tanto también representan distancias iguales con respecto a la propiedad investigada. La

diferencia entre e – d, o sea, 5 – 4 = 1, es la misma diferencia que hay entre b – a, 2 – 1 =1.

Page 24: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

7

Ambas representan las mismas distancias con respecto a la propiedad evaluada. Otra ventaja es

que se pueden combinar procesos matemáticos diferentes, como por ejemplo:

, lo cual se puede representar también así:

( ) ( ), donde,

( ) ( ), donde,

( ) ( )

4. Escala de Razones o Proporciones:

Corresponde al más alto nivel de medición; posee todas las características de las escalas

discutidas anteriormente, pero a diferencia de ellas, es la única que posee un cero natural. El cero

representa ausencia absoluta de la propiedad en mención y esto permite aplicar operaciones

matemáticas que no se podían aplicar en las escalas anteriores (multiplicación y división). Se

considera que en esta escala, una medición que representa numéricamente el doble que otra,

también representa el doble de la propiedad medida.

La utilización de las escalas de medición en la investigación aplicada en psicología, es muy

importante porque determina el tipo de estadísticas que se deben utilizar para el análisis de los

resultados. Cuando la medición se da en una escala nominal u ordinal, el procesamiento

estadístico es diferente a los casos en que la medición se hace en escala de intervalos o de razón.

Por ejemplo, las investigaciones en escala nominal u ordinal, por lo general se procesan con

estadísticos no paramétricos, mientras que si se utilizan escalas de intervalos o razón, las

estadísticas a utilizar son de tipo paramétricas.

C O N C E P T O S I M P O R T A N T E S

Incertidumbre

Variable continua

Probabilidad

Acto o Prueba

Experimento

Variable discreta

Escala de medición

Nominal

Ordinal

Intervalos

De razón o proporción

Page 25: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

8

CAPÍTULO 3

ORGANIZACIÓN DE DATOS

DISTRIBUCIONES DE FRECUENCIAS

Los análisis estadísticos comienzan, por lo general, en el momento en que se recogen los datos.

Estos datos son los resultados de mediciones y/o evaluaciones realizadas con instrumentos

psicológicos muy específicos y que por lo general dan información cuantitativa (o cualitativa) sobre

ciertos aspectos del comportamiento que son objeto de investigación en momentos determinados. A

continuación presentamos un ejemplo:

TABLA 3-1:

Resultados de la medición de las aptitudes en una muestra de

70 estudiantes de los cursos de capacitación en una universidad.

Los puntajes resumidos en la tabla anterior no presentan ninguna información sistematizada, ni

organizada sobre la variable aptitudes: el investigador no podría, a partir de dichos puntajes, ofrecer

ningún tipo de información sobre el fenómeno psicológico en mención y su incidencia en la muestra

de estudiantes. Los puntajes deben ser organizados de tal manera que faciliten su posterior

utilización en los análisis estadísticos necesarios para la interpretación de los resultados.

Un primer método de organización de los datos es el denominado: distribución en una tabla de

frecuencias simples. Esta tabla se caracteriza porque los datos se ordenan, preferiblemente de menor

a mayor, indicándose para cada uno de los puntajes la frecuencia correspondiente; o sea, el número

de sujetos que obtuvo dicho puntaje. A continuación se presenta la tabla correspondiente.

95 101 92 67 118 105 76

104 84 122 86 87 97 87

94 94 79 94 89 90 103

101 81 94 91 77 107 94

100 102 93 94 105 68 82

117 94 119 117 89 106 111

107 92 91 89 83 73 97

99 91 120 103 90 89 112

93 100 117 78 99 111 91

83 84 81 88 84 81 110

Page 26: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

9

TABLA 3-2:

Distribución de frecuencias simples de los promedios de las aptitudes de

70 estudiantes de los cursos de capacitación

X f X f X f X f

67 1 81 3 95 1 109 0

68 1 82 1 96 0 110 1

69 0 83 2 97 2 111 2

70 0 84 3 98 0 112 1

71 0 85 0 99 2 113 0

72 0 86 1 100 2 114 0

73 1 87 2 101 2 115 0

74 0 88 1 102 1 116 0

75 0 89 4 103 2 117 3

76 1 90 2 104 1 118 1

77 1 91 4 105 2 119 1

78 1 92 2 106 1 120 1

79 1 93 2 107 2 121 0

80 0 94 7 108 0 122 1

La tabla anterior representa un gran adelanto en comparación con la Tabla 3-1, en vista que presenta

la información mejor organizada y sistematizada: los puntajes se ordenaron de menor a mayor

(podría haber sido a la inversa), cada puntaje tiene asignada una frecuencia, o sea, el número de

sujetos que obtuvieron dicha puntuación. Se observa un primer indicio de agrupamiento hacia los

puntajes centrales en comparación con los valores extremos.

La organización de los datos en distribuciones de frecuencias simples, a pesar de la ventaja que

presenta, tampoco es el procedimiento más adecuado, especialmente si el tamaño de la muestra es

muy grande al igual que su amplitud. En tales casos, la información tiende a verse muy disgregada

y no se dramatizan las características particulares de la muestra, que pueden resultar muy

importantes para el análisis de los resultados. En el caso de muestras pequeñas, este tipo de

organización es bastante efectiva.

Una segunda forma de organizar los resultados, especialmente si la muestra es grande, es la Tabla

de Frecuencia por intervalos. Bajo este método, se logra que los puntajes se presenten de manera

más compacta en la distribución, lo cual facilita la observación clara de las principales

características estadísticas de los puntajes de la muestra. Este método se caracteriza por la creación

de intervalos, distancias entre puntajes, que facilita la distribución de todos los puntajes de la

muestra en dichos intervalos. Para el uso de este tipo de distribución, el investigador debe tener

claro algunos aspectos que pasamos a discutir:

1. El agrupamiento de los puntajes en algunas ocasiones puede favorecer la pérdida de

información.

2. El tamaño del intervalo y el número de los mismos se darán a criterio del investigador.

Page 27: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

10

3. Se acepta, generalmente, que el número de intervalos debe oscilar entre 10 y 20.

4. El tamaño del intervalo puede ser par o impar, aunque se sugiere un tamaño impar porque de

esta manera se reduce la probabilidad de trabajar con datos fraccionales.

Los pasos para construir una distribución de frecuencias por intervalos son los siguientes:

1. Se calcula el “rango” o “amplitud” de la distribución, lo que corresponde a la diferencia entre

el puntaje más alto y el más bajo de la muestra más uno:

,

En donde, es amplitud, es puntaje mayor y es puntaje menor. La amplitud

identifica los valores que están dentro de este intervalo, lo cual facilita la

identificación de los puntajes particulares dentro del mismo. Para el caso de la

Tabla 3-1,

.

2. Divida la amplitud entre el número de intervalos que se han considerado adecuados, recordando

que preferiblemente deben ser entre 10 y 20. Se recomienda que se utilice un número de

intervalos tal, que al dividir la amplitud entre el número de intervalos, el número resultante sea

un valor impar, el cual va a representar el tamaño de cada uno de los intervalos; este tamaño es

constante para todos. Para nuestro ejemplo, hemos decidido que sean 12 intervalos; para

calcular el tamaño del intervalo se lleva a cabo la siguiente operación:

Amplitud = 56

No. de intervalos estimado (No.i) = 12; con esta información se calcula el

tamaño del intervalo (Ti):

, que redondeado al entero más próximo corresponde

a 5.

3. A partir de estos datos, se construye la Tabla de frecuencias por intervalos que para este caso

será de menor a mayor. En el primer intervalo debe quedar incluido el valor más pequeño de la

distribución y en el último se incluirá el valor más grande. La estructura de cada intervalo se

caracteriza por las siguientes condiciones:

Los intervalos tendrán un puntaje inferior que se denominará límite inferior, y

un puntaje superior que se denominará límite superior; el recorrido entre ambos

extremos debe ser igual al Ti, incluidos estos dos valores. Por ejemplo:

Para escoger el límite inferior del primer intervalo, debe utilizarse la siguiente

regla: “debe corresponder al número más cercano al puntaje más pequeño

de la distribución, y que a su vez sea un múltiplo del tamaño del

intervalo”. Para efectos de este ejemplo, el límite inferior del primer intervalo

corresponde a 65 y el mayor a 69.

65 ----------------------- 69

Límite inferior Límite superior

Page 28: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

11

4. A partir de esta información, construya la Tabla de frecuencias partiendo del intervalo 65 – 69,

en el cual está incluido el puntaje más bajo que es 67, hasta llegar al último intervalo que debe

incluir el puntaje más alto: 122. Todos los intervalos deben ser de tamaño 5 para efectos de este

problema.

5. Una vez confeccionada la columna de intervalos, se determina el número de casos de la muestra

que caen dentro de cada uno de ellos. Para facilitar esta información, se crea una columna

adyacente a la de los intervalos y se van asignando marcas a cada valor encontrado en la

muestra, tal y como lo presenta el siguiente ejemplo:

Intervalo Tabulación Frecuencia

65 – 69 / / 2

6. Se procede de esta manera con todos los intervalos hasta obtener toda la información

correspondiente a las frecuencias simples. Se completa la tabla con el resto de las columnas que

contendrán la información requerida para adelantar los primeros análisis estadísticos. Las otras

columnas más frecuentes son: tabulación (tab), frecuencias (f), frecuencias acumuladas (fa),

puntos medios (Pm), proporciones (p), y porcentajes (%).

A continuación se presenta la Tabla de Frecuencias por intervalos correspondiente a los datos

presentados en la Tabla 3-1.

TABLA 3-3:

Distribución de frecuencias por intervalos

correspondientes a las aptitudes de una muestra de 70 estudiantes

i f fa Pm p %

65-69 2 2 67 0.03 2.86

70-74 1 3 72 0.01 1.43

75-79 4 7 77 0.06 5.71

80-84 9 16 82 0.13 12.86

85-89 8 24 87 0.11 11.43

90-94 17 41 92 0.24 24.29

95-99 5 46 97 0.07 7.14

100-104 8 54 102 0.11 11.43

105-109 5 59 107 0.07 7.14

110-114 4 63 112 0.06 5.71

115-119 5 68 117 0.07 7.14

120-124 2 70 122 0.03 2.86

∑ 0 ∑ 0.99a ∑ 00.00 a La sumatoria de p es <1.00 por efectos de redondeo

Page 29: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

12

La Tabla anteriormente presentada, no toma en consideración los denominados “límites

verdaderos o reales” de cada intervalo. Por ejemplo, los límites verdaderos de 65 serían: 64.5 y

65.5; de igual manera, los límites verdaderos de 69 serían 68.5 y 69.5. Si se construye la Tabla de

frecuencias utilizando este concepto, en el caso del primer intervalo, el intervalo real sería: 64.5 –

69.5, y el resto de los intervalos se construirían de la misma manera. Este concepto de los límites

verdaderos, es importante para el cálculo de ciertos estadísticos tales como la mediana, los

percentiles y otros.

El resto de los elementos de la Tabla de Frecuencias por intervalos se determinarían de la siguiente

manera:

Frecuencias acumuladas (fa): a partir de la frecuencia del intervalo más pequeño, se van

sumando de manera acumulativa las frecuencias de los intervalos posteriores y se van indicando

en la Tabla. Para verificar, debe observarse que en el primer intervalo está acumulada la

frecuencia de este intervalo y que en el último intervalo debe estar acumulada la totalidad de las

frecuencias de la muestra. Ejemplo: (ver Tabla 3-3)

Primer intervalo = 65 – 69 Frecuencia = 2

Último intervalo = 120 – 124 Frecuencia = 70

Punto medio (Pm): se refiere al puntaje que se ubica en la mitad de cada intervalo y se calcula

a través de la siguiente operación:

o ( )

, en donde, Li representa al límite inferior del intervalo y Ls, al límite

superior.

o Para efectos del primer intervalo, el Pm sería igual a: ( )

, tal y como se

puede verificar en la Tabla 3-3.

o Esta operación se debe desarrollar para todos los intervalos de la distribución y señalar

el resultado en su correspondiente columna.

Otro procedimiento para construir una Tabla de Frecuencias es La Regla de Sturges. En el mismo

se aplica una regla (fórmula) especial, a través de la cual se puede determinar (K), que representa el

número aproximado de intervalos en la distribución: ( ), en donde:

K: número aproximado de intervalos

n: número de sujetos de la muestra

log: logaritmo ordinario de base 10.

Si aplicamos dicha regla a los datos de nuestra muestra, los resultados serían los siguientes:

( )( 0) 0

Tamaño de intervalos ( )

Page 30: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

13

Como se puede observar el número de intervalos es menor que en el procedimiento anterior;

además, el tamaño del intervalo tiende a ser mayor. A continuación se presenta la Tabla

desarrollada con la Regla de Sturges.

TABLA 3-4:

Distribución de frecuencias por intervalos correspondientes

a las aptitudes de una muestra de 70 estudiantes.

i f fa Pm p %

63 - 69 2 2 67 0.03 2.86

70 - 76 2 4 72 0.03 2.86

77 - 83 9 13 77 0.13 12.86

84 - 90 13 26 82 0.19 18.57

91 - 97 18 44 87 0.26 25.71

98- 104 10 54 92 0.14 14.29

105 - 111 8 62 97 0.11 11.43

112 - 118 5 67 102 0.07 7.14

119 - 125 3 70 107 0.04 4.29

∑ 0 ∑ .00 ∑ 00.01a

a La sumatoria de % es >100.00 por efectos de redondeo

Como se puede observar, la distribución de frecuencias por intervalos generada a través de la Regla

de Sturges, tiende a producir distribuciones más compactas que en el primer caso, por el hecho de

que genera menor número de intervalos pero con un tamaño mayor, lo cual hace que dentro de los

mismos haya un mayor número de sujetos. Ahora, no existe ninguna regla que señale que Sturges

produce resultados superiores que el primer método estudiado. Nada supera el buen juicio del

investigador para determinar cuál es la distribución más conveniente.

C O N C E P T O S I M P O R T A N T E S

Distribución de frecuencias

Simples

Por Intervalos

Intervalos

Amplitud o Rango

Límites de intervalos

Frecuencias simples

Frecuencias acumuladas

Proporciones

Porcentajes

Page 31: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

14

E J E R C I C I O S P R Á C T I C O S

P r o b l e m a 1

110 113 111 108 113 134 124 80 112 106

133 119 115 117 110 104 125 85 120 135

116 103 103 121 109 147 103 113 107 98

128 93 93 105 118 119 89 143 108 142

85 108 108 136 115 117 110 128 145 127

100 100 100 123 126 119 113 102 100 93

105 111 122 100 114 91 123 132 97 110

150 130 130 89 108 137 121 142 111 123

118 104 104 94 115 112 125 129 131 110

97 135 135 139 133 107 115 83 109 116

154 131 113 82 106 101 122 96 145 101

Los datos anteriores corresponden a los puntajes obtenidos en una prueba de admisión universitaria,

por una muestra de estudiantes graduados de escuela secundaria. Organice los datos en una Tabla de

Frecuencias por intervalos, satisfaciendo los siguientes requisitos:

1. Calcule la amplitud de la distribución de datos.

2. La tabla debe ser construida de menos a más.

3. El tamaño del intervalo debe ser de 5.

4. La Tabla debe incluir las siguientes columnas: intervalos, puntos medios, frecuencias simples,

frecuencias acumuladas, proporciones y porcentajes.

P r o b l e m a 2

Con los mismos datos, del problema construya una Tabla de Frecuencias utilizando un tamaño de

intervalo igual a 4. Repita el mismo procedimiento que en el problema anterior. Observe, analice y

discuta las diferencias entre una distribución y la otra.

P r o b l e m a 3

Elimine de forma aleatoria (por azar) un dato de cada columna del problema 1; esto creará una

nueva distribución de datos. Para la misma, construya dos Tablas de frecuencias utilizando las

recomendaciones brindadas en este Texto. Una de las tablas debe tener un tamaño de intervalo

impar y la otra, un tamaño par. Complete ambas tablas con los elementos solicitados anteriormente;

analice y discuta los resultados obtenidos.

Si desea practicar más, puede eliminar columnas de la distribución de datos y desarrollar sus

correspondientes tablas. También puede revisar los textos señalados en la bibliografía y hacer otros

problemas.

Page 32: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

15

CAPÍTULO 4

REPRESENTACIONES GRÁFICAS

En el capítulo anterior se inició un proceso de organización de los datos tendiente a sistematizarlos,

lo cual facilitaría el posterior análisis de los mismos. Se observa que dicho proceso de organización

se caracteriza por una cuidadosa reorganización de la data (Tabla 3-1), a través de las denominadas

Tablas de Frecuencias, especialmente la de intervalos (Tabla 3-3 y Tabla 3-4).

Otro aspecto importante en la organización de datos lo constituyen las representaciones gráficas,

las cuales se caracterizan por lo siguiente:

1. Facilitan la observación de hechos esenciales en las distribuciones.

2. Permiten la comparación de diferentes distribuciones al mismo tiempo.

3. Son de fácil comprensión para el lector porque facilita la percepción de los hechos.

Existen diferentes tipos de representaciones gráficas utilizadas para diferentes objetivos. Para

efectos de este capítulo, se analizarán tres tipos de gráficas, las cuales son básicas para el análisis

científico de la data proveniente de la medición comportamental: el gráfico de barra (histogramas),

el polígono de frecuencias y la ojiva. Pero antes de iniciar este estudio formalmente, es necesario

señalar algunos detalles importantes en la construcción de las mismas y que son comunes en todas

ellas. Los gráficos serán construidos en el cuadrante cartesiano en que los ejes X e Y son positivos.

Al eje X se le denominará abscisa y al Y ordenada.

FIGURA 4—1

En el eje de las ordenadas (Y) se colocan las frecuencias, porcentajes, etc, mientras que en el

eje de las abscisas (X) se colocarán los puntajes, los cuales pueden estar representados por los

valores correspondientes a los puntos medios, los límites de los intervalos ya sean los superiores

o los inferiores; no se deben combinar estos en un mismo gráfico. También se considera que en

el eje de X se coloca la variable independiente y en el de la Y la variable dependiente.

Cuando los gráficos se construyen manualmente, se sugiere la regla de los tres cuartos, la

cual se caracteriza por lo siguiente: “en la representación gráfica de las frecuencias,

el eje vertical debe hacerse de tal forma que la altura del punto máximo (que

representa el resultado asociado con la frecuencia más alta) debe ser

aproximadamente igual a tres cuartos de la longitud del eje horizontal”.

X

Y X e Y son positivos

Page 33: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

16

En la práctica, esta es una condición difícil de cumplir, por lo cual se sugiere que tanto

X como Y sean más o menos proporcionales. Este problema ha sido superado con la

utilización de ordenadores para la construcción de los gráficos.

G R Á F I C O D E B A R R A S

Se refiere a un gráfico diseñado para variables medidas en escalas nominales y ordinales; o sea, que

los datos no están relacionados numéricamente entre ellos. Cada categoría o intervalo se representa

por una barra y la frecuencia determina la altura de la misma; además, las barras son independientes

una de otras. Para la construcción de un gráfico de este tipo, se sugieren los siguientes pasos:

1. En el eje de Y se representan las frecuencias dentro de cada categoría; esto determina

la altura de la barra. En el eje de las X se ubican las categorías o estratos. A

continuación presentamos un ejemplo.

TABLA 4-1:

Frecuencias De Las Carreras A Las Que Aplican 70 Aspirantes A La Universidad

Facultad f

Admón de Empresas 8

Arquitectura 9

Ciencias Agropecuarias 8

Ciencias de la Educación 4

Ciencias Exactas y Tecnología 4

Comunicación Social 8

Derecho y Ciencias Políticas 6

Economía 2

Enfermería 2

Humanidades 6

Medicina 1

Odontología 6

Psicología 6

∑ 0

Page 34: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

17

GRÁFICO 4-1

Como se puede observar, el gráfico representa cada intervalo con su correspondiente altura

(frecuencia), la cual está identificada por la barra. Este tipo de gráfico también puede representarse

de manera horizontal, tal y como se demuestra a continuación.

GRÁFICO 4-2

H I S T O G R A M A

El histograma también es un gráfico de barras, pero a diferencia del anterior, se utiliza en el caso en

que las distribuciones de frecuencias corresponden, por lo menos a una escala de intervalos. Desde

el punto de vista estadístico, las barras comparten información en vista de que se construyen con los

0123456789

10F

recu

enci

a

Facultad a la que aplican 70 aspirantes universitarios

0 1 2 3 4 5 6 7 8 9 10

Admón de Empresas

Arquitectura

Ciencias Agropecuarias

Ciencias de la Educación

Ciencias Exactas y Tecnología

Comunicación Social

Derecho y Ciencias Políticas

Economía

Enfermería

Humanidades

Medicina

Odontología

Psicología

Frecuencia

Facultad a la que aplican 70 aspirantes universitarios

Page 35: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

18

límites reales de cada una de ellas. El límite superior de cada barra se convierte en el límite inferior

de la siguiente, apoyados en el concepto de continuidad de la variable. A continuación se presenta

un ejemplo.

TABLA 4-2:

Distribución De Frecuencias Por Intervalos

Correspondientes A Las Aptitudes De Una Muestra De 70 Estudiantes

i f

65-69 2

70-74 1

75-79 4

80-84 9

85-89 8

90-94 17

95-99 5

100-104 8

105-109 5

110-114 4

115-119 5

120-124 2

∑ 0

GRÁFICO 4-3

0

2

4

6

8

10

12

14

16

18

Fre

cuen

cia

Aptitudes

Aptitudes de n=70 aspirantes universitarios

Page 36: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

19

P O L Í G O N O D E F R E C U E N C I A S

El Polígono de Frecuencias es otra alternativa de representación gráfica de las distribuciones de

frecuencias. Al igual que los gráficos de barras, se construye sobre un eje de coordenadas (X,Y),

con la diferencia que no se utilizan los intervalos completos, sino que éstos están representados por:

los límites superiores, los límites inferiores, o, los puntos medios de cada intervalo. Se genera un

gráfico lineal que se traza sobre cada uno de los puntos que representan a los intervalos. A

continuación presentamos un ejemplo.

TABLA 4-3:

Distribución De Frecuencias Por Intervalos

Correspondientes A Las Aptitudes De Una Muestra De 70 Estudiantes

i f

65-69 2

70-74 1

75-79 4

80-84 9

85-89 8

90-94 17

95-99 5

100-104 8

105-109 5

110-114 4

115-119 5

120-124 2

∑ 0

GRÁFICO 4-4

02468

1012141618

Fre

cuen

cia

s

Polígono de frecuencias de las aptitudes en una muestra de n=70

aspirantes universitarios

Page 37: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

20

El polígono anterior utiliza como representativo de los datos, cada uno de los intervalos. Sin

embargo, por lo general, se utilizan los puntos medios de los intervalos, lo cual facilita la

descripción de los datos. A continuación presentamos un ejemplo.

TABLA 4-4:

Distribución De Frecuencias Por Intervalos

Correspondientes A Las Aptitudes De Una Muestra De 70 Estudiantes

pm f

67 2

72 1

77 4

82 9

87 8

92 17

97 5

102 8

107 5

112 4

117 5

122 2

∑ 0

GRÁFICO 4-5

Para construir un Polígono de Frecuencias sugerimos los siguientes pasos:

0

2

4

6

8

10

12

14

16

18

67 72 77 82 87 92 97 102 107 112 117 122

Fre

cuen

cia

s

Puntos medios

Polígono de frecuencias de las aptitudes en una muestra de n=70

aspirantes universitarios

Page 38: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

21

1. Represente el eje de coordenadas (X, Y) en el cual se va a construir el gráfico; recuerde que

estamos utilizando el cuadrante de valores positivos. En X deben estar identificados los valores

de los sujetos, representados por los puntos medios de los intervalos (o por los límites

superiores o los inferiores). En Y deben estar identificadas las frecuencias de cada intervalo.

2. Señale en el cuadrante los pares ordenados para cada X e Y con un punto. En otras palabras, la

intersección de cada valor X con su correspondiente Y, se marca con un punto. Repita esta

acción para cada intervalo y una vez terminado, una los puntos con rectas hasta que se dibuje la

figura del polígono.

3. Los extremos del polígono quedan suspendidos (no se unen con el eje de X). En tal caso, únalos

con segmentos de recta que deben estar ubicados a medio intervalo por debajo y por encima de

los dos valores extremos (Gráfico 4-4 y Gráfico 4-5).

4. La utilización de los puntos medios está plenamente justificado teóricamente, en vista de que

los mismos representan cada uno de los intervalos, lo cual quedará demostrado al momento de

calcularse ciertos estadísticos básicos para los análisis.

G R Á F I C O D E F R E C U E N C I A S A C U M U L A D A S U O J I V A

Hay ocasiones en las que el investigador necesita que los datos se ordenen acumulativamente. Ya

observamos en la Tabla 3-4 que es posible resumir las frecuencias de los intervalos de manera

acumulada. Para tales casos, los datos acumulados pueden representarse gráficamente a través de

una ojiva o curva acumulativa de frecuencias; a continuación se presenta un ejemplo.

TABLA 4-5:

Distribución De Frecuencias Por Intervalos Correspondientes

A Las Aptitudes De Una Muestra De 70 Estudiantes.

i f fa Pm

63 - 69 2 2 67

70 - 76 2 4 72

77 - 83 9 13 77

84 - 90 13 26 82

91 - 97 18 44 87

98- 104 10 54 92

105 - 111 8 62 97

112 - 118 5 67 102

119 - 125 3 70 107

∑ 0

Page 39: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

22

GRÁFICO 4-6

Los pasos a seguir para confeccionar una gráfica de frecuencias acumuladas (OJIVA) son los

siguientes:

1. Confeccione el cuadrante de coordenadas

2. En el eje Y se colocan las frecuencias acumuladas de la distribución y en el eje X se colocan los

puntos medios de cada intervalo.

3. Localice, en el cuadrante, el punto en que coinciden el intervalo (punto medio) y la frecuencia

acumulada de dicho intervalo: márquelo con un punto. Repita esta acción con todos los

intervalos y con sus correspondientes frecuencias acumuladas.

4. Una todos los puntos a través de líneas rectas obteniéndose finalmente el gráfico denominado

Ojiva.

A través de éste gráfico se puede calcular algunas medidas de posición importantes tales como los

percentiles, los rangos percentiles, la mediana, etc.

D I A G R A M A D E T A L L O Y H O J A S

Es una alternativa muy sencilla de describir los datos de una muestra, especialmente cuando la

misma no es muy grande (n ≤ 100). Cada dato se va a dividir en dos partes: el primer dígito (y el

segundo, en algunas ocasiones), corresponde al tallo y el segundo a la hoja. Veamos un ejemplo con

el dato X = 46. Para este caso:

Tallo = 4, Hoja = 6.

Este procedimiento se seguiría con todos los puntajes de la distribución, pero el diagrama tiene una

estructura especial, la cual pasamos a presentar a continuación. Para tal efecto utilizaremos los datos

resumidos en la Tabla 3-2.

0

10

20

30

40

50

60

70

80

67 72 77 82 87 92 97 102 107

Fre

cue

nci

as a

cum

ula

das

Ojiva correspondiente a las aptitudes de n=70 aspirantes universitarios

Page 40: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

23

GRÁFICO 4-7

TALLO HOJA

6 7 8

7 3 6 7 8 9

8 1 1 1 2 3 3 4 4 4 4 6 7 7 8 9 9 9 9

9 0 0 1 1 1 1 2 2 3 3 4 4 4 4 4 4 4 5 7 7 9 9

10 0 0 1 1 2 3 3 4 5 5 6 7 7

11 0 1 1 2 7 7 7 8 9

12 0 2

En el ejemplo anterior se observa que el puntaje más bajo corresponde al número 67, por esta razón

el diagrama se inicia en el tallo 6. Las hojas correspondientes a este tallo son el 7 y el 8 porque

únicamente en esta decena están el número 67 y 68. A continuación vendría la decena del 70, cuyo

tallo sería el 7; las hojas en este tallo serían 3, 6, 7, 8 y 9, porque corresponderían a los números 73,

76, 77, 78 y 79. De esta manera se desarrollarían los restantes tallos con sus correspondientes hojas.

L O S O R D E N A D O R E S Y L A S G R Á F I C A S

El desarrollo y crecimiento de la informática, tanto en lo que respecta a los ordenadores como a los

programas, han facilitado la presentación de gráficos y han enriquecido este aspecto tan importante

de las estadísticas. A continuación presentamos algunos ejemplos de presentaciones gráficas que se

pueden desarrollar gracias al avance de la tecnología.

Page 41: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

24

C O N C E P T O S I M P O R T A N T E S

Gráfico

Cuadrante cartesiano

Ordenada

Gráfico de barras

Histograma

Polígono de frecuencias

Pares ordenados

Ojiva

Diagrama Tallo – Hoja

0 2 4 6 8 10 12 14 16 18

65- 69

75- 79

85- 89

95- 99

105- 109

115

- 119

f

Page 42: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

25

E J E R C I C I O S P R Á C T I C O S

P r o b l e m a 1

110 113 111 108 113 134 124 80 112 106

133 119 115 117 110 104 125 85 120 135

116 103 103 121 109 147 103 113 107 98

128 93 93 105 118 119 89 143 108 142

85 108 108 136 115 117 110 128 145 127

100 100 100 123 126 119 113 102 100 93

105 111 122 100 114 91 123 132 97 110

150 130 130 89 108 137 121 142 111 123

118 104 104 94 115 112 125 129 131 110

97 135 135 139 133 107 115 83 109 116

154 131 113 82 106 101 122 96 145 101

Los datos presentados son los mismos que se dieron para el ejercicio del Capítulo III, para los

cuales usted ya ha generado varias tablas de frecuencias por intervalos. Utilizando la Tabla de

intervalos de tamaño 5, construya los siguientes gráficos:

1. Polígono de frecuencias usando los puntos medios. También lo debe hacer utilizando uno de los

límites del intervalo.

2. Gráfico de barras

3. Histograma

4. Ojiva

5. Diagrama de tallo y hojas

P r o b l e m a 2

Construya estos gráficos, utilizando las diferentes distribuciones de frecuencias que construyó en el

Capítulo III. Observe, analice y discuta las diferencias encontradas entre los gráficos construidos.

Page 43: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

26

CAPÍTULO 5

MEDIDAS DE TENDENCIA CENTRAL

Hasta este momento, el proceso de sistematización y organización de los datos que hemos seguido,

ha permitido reducir la información inicial (datos originales) correspondientes a las aptitudes de 70

aspirantes a ingresar a la Universidad, a partir de tablas y gráficos descriptivos. A pesar de esta

reducción, la calidad de la información mejoró tanto cuantitativa como cualitativamente, en vista de

que se logró identificar características especiales de la muestra que no resaltaban en su forma

original de presentación: datos brutos.

Estas características particulares de las muestras, favorecen un análisis más profundo y dinámico de

la información cuantitativa resumida en las tablas y gráficos, a tal punto, que logran resumir, en

muy pocos valores cuantitativos, las características de las variables analizadas y como consecuencia

directa, las características de las muestras que están siendo objeto de análisis. Esta nueva

información se identifica como medidas estadísticas y se pueden definir desde dos perspectivas

particulares pero complementarias: las medidas de tendencia central y las medidas de

variabilidad. A continuación pasaremos a analizar y discutir lo que significan las medidas de

tendencia central y su importancia en el análisis descriptivo de los datos.

Las muestras de datos, con mucha frecuencia, tienden a comportarse de manera muy particular, lo

cual tiende a dramatizarse con mucho detalle en las tablas y los gráficos correspondientes. Por lo

general, hay uno o varios puntajes que al analizarlos en las tablas y gráficos, presentan una mayor

frecuencia de ocurrencia que los otros; en muchas ocasiones, es un solo valor de la distribución el

que se destaca por esta cualidad.

Si observamos los resultados resumidos en la Tabla 3-3 y en la Tabla 3-4, la mayor frecuencia de

datos se observa en el intervalo 90-94 (frecuencia 17) y en el intervalo 91-97 (frecuencia 18),

respectivamente. Es evidente que un número importante de datos tiende a agruparse alrededor de

ciertos valores centrales (intervalos), y consecuentemente, el resto se distribuye por encima y por

debajo de estos intervalos de mayor frecuencia. A partir de este comportamiento, se determina que

en las distribuciones muestrales hay un valor que es el más frecuente y alrededor del cual se agrupa

el resto de los valores; este puntaje se considera representativo de toda la distribución. A estos

valores, que representan la tendencia de una distribución se les denomina: medidas de tendencia

central. A continuación pasaremos a analizar las más importantes en el análisis estadístico de los

resultados obtenidos en una investigación del comportamiento.

L A M E D I A A R I T M É T I C A

Es la medida de tendencia central más conocida y la más importante. Su utilización no es una

experiencia tan novedosa cuando se inician los estudios de estadística, en vista de que se le conoce

ampliamente como el promedio. Todos recordamos en el colegio cuando el profesor nos pedía que

calculáramos el promedio de la materia en el bimestre, lo cual era equivalente a sumar todas

nuestras notas, dividir la suma entre la totalidad de éstas y alcanzar un puntaje que era el

representativo de nuestro rendimiento.

Page 44: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

27

Una definición simple y adecuada de la media aritmética es: la suma de todos los datos

correspondientes a una muestra, dividida entre el total de los datos. Definida de manera estadística

sería:

Para el caso de una muestra

Se refiere a la sumatoria de todos los datos de la muestra, dividida entre la totalidad de

sujetos de la misma.

Para el caso de una población:

Se refiere a la sumatoria de todos los datos de la población, dividida entre la totalidad

de sujetos de la misma.

La fórmula anterior se conoce como la fórmula general de la media aritmética y se aplica cuando

se utiliza la totalidad de las observaciones, tanto de las muestras como las poblaciones. Es el

procedimiento que usan los programas estadísticos tanto de las calculadoras manuales como los

ordenadores.

Las principales características de la media aritmética son las siguientes:

1. Por ser el promedio de todas las observaciones está afectada por todos los valores, lo cual

determina que la media sea muy sensible a las puntuaciones extremas de las distribuciones.

2. A partir de la fórmula general, ∑

si dos de los componentes son conocidos, se puede

conocer el tercero.

3. La suma de las desviaciones de cada puntaje con relación a la media es igual a cero: ∑ 0.

4. La media representa un punto de equilibrio o centro de gravedad de la distribución, a partir de

los puntajes extremos de la misma.

L a m e d i a a r i t m é t i c a p a r a d i s t r i b u c i o n e s d e f r e c u e n c i a s

Cuando las muestras están organizadas en Tablas de Frecuencias, la media aritmética se calcula a

partir de algunos de los componentes de la misma, tal y como se demuestra a continuación. Es

importante que la tabla resumen contenga la información necesaria para que se puedan aplicar las

fórmulas requeridas para el cálculo de la media aritmética siguiendo este procedimiento.

Page 45: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

28

TABLA 5-1:

Cálculo de la media aritmética para datos agrupados

i f Pm f * Pm

65-69 2 67 134

70-74 1 72 72

75-79 4 77 308

80-84 9 82 738

85-89 8 87 696

90-94 17 92 1564

95-99 5 97 485

100-104 8 102 816

105-109 5 107 535

110-114 4 112 448

115-119 5 117 585

120-124 2 122 244

∑ 0 ∑

A partir de los datos de la Tabla anterior, se aplica la siguiente fórmula:

∑( )

0

El resultado obtenido indica que la media aritmética de las aptitudes de los 70 aspirantes a ingresar

a la Universidad fue igual a 94.64. Si se observa la Tabla 5-1, se puede verificar la cercanía de este

resultado con el intervalo de mayor frecuencia. Es evidente que la correcta construcción de la Tabla

y de sus componentes, son una garantía para la obtención de resultados precisos en el cálculo de

estadísticos como la media aritmética.

L a m e d i a a r i t m é t i c a y l o s m é t o d o s a b r e v i a d o s

La media aritmética puede ser calculada a través de los denominados métodos abreviados.

Aprovechando la propiedad de que la ∑ 0, se han desarrollado dos métodos alternativos para el

cálculo de este estadístico. En ambos se determina una media supuesta, que puede corresponder a

cualquier puntaje de la distribución, ya sea que esté por encima o por debajo de la media real. A

partir de este valor se calcula un corrector, que se va a agregar algebraicamente a la media

supuesta:

Si la media supuesta es mayor que la media verdadera, el corrector será restado de la primera,

corrigiendo el exceso. De esta manera, el resultado final corresponde a la media real.

Si la media supuesta es menor que la media verdadera, el corrector será sumado a la primera

corrigiendo el defecto; el resultado corresponderá a la media verdadera.

Las fórmulas correspondientes a los métodos abreviados son:

Page 46: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

29

1. ∑

, en donde:

A corresponde a la media supuesta

∑ es igual a la sumatoria de las diferencias alrededor de la media supuesta ∑

es el factor de corrección, cuyo signo será positivo o negativo atendiendo a las

características de la media supuesta (por encima o debajo de la media real)

2. (∑( )

) , en donde:

A es la media supuesta

∑( ) corresponde a la sumatoria del producto de las frecuencias de cada intervalo

con su correspondiente diferencia ∑( )

es el factor de corrección

i es el tamaño del intervalo

Cualquiera de los dos métodos abreviados tendrá como resultado la misma media: la verdadera.

Con el desarrollo de la tecnología y la informática, en la actualidad la utilización de los métodos

abreviados se ha reducido de manera significativa. Sin embargo, son un ejemplo claro de la

posibilidad de calcular la media real, a partir de cualquier valor de la distribución.

L O S P R O M E D I O S D E P O S I C I Ó N

Otros promedios, diferentes que la media aritmética, permiten estimar el valor representativo de la

distribución. A estos promedios se les denomina promedios de posición, en vista de que los mismos

corresponden a un lugar en la distribución. Para calcularlos, se deben satisfacer las siguientes

condiciones:

1. La distribución debe estar ordenada de menor a mayor

2. Hay que determinar el lugar o posición de la distribución, en que debe caer el promedio.

3. A diferencia de la media aritmética, no están afectados por las puntuaciones extremas de la

distribución en vista de que no se calculan a partir de los datos individuales de las muestras.

Los promedios de posición más importantes son: la mediana y la moda, los cuales pasaremos a

analizar a continuación.

L a m e d i a n a ( m d n )

Se considera la medida de tendencia central que divide la distribución de datos en dos partes

iguales, dejando por encima y por debajo de ella igual cantidad de observaciones. Para el cálculo de

la mediana, es necesario que los datos estén ordenados de menor a mayor atendiendo a sus

magnitudes. A continuación presentamos un ejemplo para datos no organizados en tablas de

frecuencias:

Page 47: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

30

Puntuación (ficticios)

1

2

3

4

5 mediana

6

7

8

9

La mediana de los datos anteriores es 5, porque es el valor que en la distribución ordenada deja por

encima y por debajo igual número de puntajes. Cuando el número de observaciones es impar, la

mediana coincide con uno de los valores de la distribución; cuando el número es par, la mediana

será una fracción y estará ubicada entre los dos valores centrales de la distribución, y habrá

necesidad de promediar los mismos, tal y como se presenta a continuación:

X

1

2

3

4 mediana:

5

6

7

8

Como se puede observar, la mediana sólo se puede calcular en una distribución ordenada

previamente y no está afectada por los dos valores más extremos (1 y 8).

Cuando los datos están agrupados en tablas de frecuencias, la mediana se calcula utilizando un

procedimiento de interpolación, siendo su fórmula de cálculo la siguiente:

((

)

)

: límite inferior real del intervalo en que debe caer la mediana

: lugar(intervalo) en la columna de frecuencias acumuladas en que debe caer la

mediana

fa : frecuencia acumulada hasta el intervalo anterior al de la mediana

: frecuencias simples dentro del intervalo en donde debe caer la mediana

i : tamaño del intervalo

Page 48: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

31

TABLA 5-2:

Cálculo de la mediana en una distribución de frecuencias

i f fa

65-69 2 2

70-74 1 3

75-79 4 7

80-84 9 16

85-89 8 24

90-94 17 41

95-99 5 46

100-104 8 54

105-109 5 59

110-114 4 63

115-119 5 68

120-124 2 70

∑ 0

Para el cálculo de la mediana se requiere de las columnas intervalos, frecuencias y frecuencias

acumuladas de la tabla de intervalos (ver Tabla 5-2). Como se puede observar, la tabla está

organizada de menor a mayor. A continuación se detalla el procedimiento para el cálculo de dicho

estadístico:

1. Se calcula

2. 35 se ubica en las frecuencias acumuladas en el intervalo 90 – 94. A este intervalo se le

denomina la clase mediana.

3. Se determina fa que corresponde a la frecuencia acumulada anterior a la clase mediana; en este

caso es igual a 24

4. De igual manera se señala el valor de fmdn, o sea, la frecuencia simple dentro de la clase

mediana, que resultó ser igual a 17

5. El tamaño del intervalo, i, para este problema es de (5)

6. Finalmente se sustituye en la fórmula de la mediana:

(( )

)

El valor de la mediana para estos datos es de 92.73 y se considera que deja por encima y por debajo

de él al 50% de los datos de la distribución. Como se puede observar, el valor de la mediana es

ligeramente inferior al de la media aritmética, situación que se presentará siempre que se analicen

datos muestrales. Sin embargo, siempre aspiraremos a que la diferencia entre estos dos estadísticos

sea la menor posible, lo cual indicaría lo que se denominará posteriormente asimetría.

Page 49: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

32

L a m o d a ( )

La definición más simple y frecuente de la moda es: el valor o puntaje que más se repite en una

distribución. A continuación se presenta un ejemplo, cuando las puntuaciones no están afectadas

por intervalos:

Puntajes (ficticios)

1

2

3

4

……moda

4

5

6

7

8

Para el ejemplo anterior, la moda es 4 porque es el puntaje que más se repite. El cálculo de este

estadístico en distribuciones simples es sencillo, presentándose dificultades si en la distribución hay

más de un puntaje con la mayor frecuencia; en estas condiciones, estamos ante la presencia de

varias modas en una sola distribución, situación que no es la más adecuada para el análisis de la

tendencia central de las observaciones.

1. La moda para datos agrupados en intervalos

Existen varios procedimientos para el cálculo de la moda en datos agrupados en distribuciones por

intervalos: el método de interpolación algebraica y el método empírico. A continuación

analizaremos cada uno de ellos.

Page 50: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

33

Moda por el método de interpolación algebraica

TABLA 5-3:

Cálculo de la moda por interpolación algebraica

i f

65-69 2

70-74 1

75-79 4

80-84 9

85-89 8

90-94 17

95-99 5

100-104 8

105-109 5

110-114 4

115-119 5

120-124 2

∑ 0

La fórmula general para el cálculo de la moda por el método de interpolación algebraica es la

siguiente:

(

)

: límite inferior real del intervalo donde cae la moda (clase modal), o sea, el que tiene

mayor frecuencia

: Delta 1, que se refiere a la diferencia entre la frecuencia de la clase modal y la

frecuencia de la clase pre modal (despréciense los signos).

: Delta 2, que se refiere a la diferencia entre la frecuencia de la clase modal y la

frecuencia de la post modal (despréciense los signos).

i : tamaño del intervalo.

Al igual que en la mediana, los datos están organizados de menor a mayor y se requiere determinar

previamente el lugar (intervalo) en que debe caer el valor de la moda. A continuación se presenta un

ejemplo a partir de los datos de la Tabla 5-3.

(( )

) (

)

El valor de la moda calculada a través del método de interpolación algebraica es de 91.64, que es un

valor ligeramente diferente al de la media y la mediana, calculadas para el mismo conjunto de datos.

Page 51: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

34

Moda por el método empírico

Otro método a través del cual también se puede calcular la moda es el método empírico, el cual se

utiliza preferiblemente cuando la distribución es moderadamente asimétrica, o sea, cuando la media

y la mediana difieren ligeramente. En este caso se requiere que la media y mediana hayan sido

calculadas previamente y la fórmula general es la siguiente:

( )

Como ya se tienen los valores de la media y la mediana calculados, 94.64 y 92.73 respectivamente,

se hacen las correspondientes sustituciones en la fórmula:

( )

En este caso, la moda alcanzó un valor de 88.91, menor que el obtenido en el método de

interpolación algebraica. La diferencia entre ambos valores calculados no debe inquietar al

estudiante si los procedimientos han sido correctamente ejecutados; estos procedimientos no llevan

a resultados iguales. Sin embargo, el buen juicio del investigador debe prevalecer en situaciones

como ésta antes de escoger el método más conveniente. Para este caso, sería prudente evaluar el

coeficiente de asimetría para verificar que la diferencia entre la media y la mediana es

estadísticamente aceptable.

C O M P A R A C I O N D E L A M E D I A , L A M E D I A N A Y L A M O D A

Es importante destacar que de las tres medidas de tendencia central, la media presenta

características estadísticas que la hacen poseer un mayor nivel de utilidad; es la más importante. Sus

propiedades favorecen su utilización en cálculos estadístico más avanzados, especialmente en las

estadísticas inferenciales y el muestreo. Se le considera la más estable y confiable entre las medidas

de tendencia central, lo cual significa que si tomáramos varias muestras, la media aritmética

presentaría menor fluctuación que la mediana y la moda.

Hay ocasiones en que se prefiere utilizar la mediana, especialmente cuando queremos hacer ciertas

descripciones.

Finalmente, la moda es la medida de tendencia central con menos aplicaciones en la investigación

psicológica. Fundamentalmente, es una medida muy inestable, no es susceptible de manipulación

algebraica y su verdadero valor es difícil de establecer.

La media, mediana y moda pueden relacionarse a través de ciertas condiciones que pasaremos a

señalar:

Para una distribución simétrica y unimodal, la media ≈ mediana ≈ moda

Para una distribución positivamente asimétrica, la media es la mayor, la mediana se ubica en el

centro y la moda es la menor.

Page 52: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

35

Para una distribución negativamente asimétrica, la media es la menor, la moda la mayor y la

mediana se ubica entre las dos.

C O N C E P T O S I M P O R T A N T E S

Datos originales o brutos

Media aritmética

Promedios de posición

Mediana

Moda

Medidas estadísticas

Tendencia Central

Variabilidad

Page 53: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

36

E J E R C I C I O S P R Á C T I C O S

P r o b l e m a 1

110 113 111 108 113 134 124 80 112 106

133 119 115 117 110 104 125 85 120 135

116 103 103 121 109 147 103 113 107 98

128 93 93 105 118 119 89 143 108 142

85 108 108 136 115 117 110 128 145 127

100 100 100 123 126 119 113 102 100 93

105 111 122 100 114 91 123 132 97 110

150 130 130 89 108 137 121 142 111 123

118 104 104 94 115 112 125 129 131 110

97 135 135 139 133 107 115 83 109 116

154 131 113 82 106 101 122 96 145 101

Los datos anteriores son los mismos para los cuales ha creado distribuciones de frecuencias y

gráficos. En esta ocasión, utilizando la tabla de Frecuencias con intervalos de tamaño 5, determine:

1. La media aritmética

2. La mediana

3. La moda (por el método de interpolación u por el método empírico)

Como usted ha construido para estos datos, distintos tipos de tablas de frecuencias, calcule las

medidas de tendencia central identificadas anteriormente. Trate de desarrollar estas prácticas que

serán de gran beneficio para su proceso de aprendizaje.

Page 54: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

37

CAPÍTULO 6

MEDIDAS DE VARIABILIDAD

En el capítulo anterior analizamos las denominadas Medidas de Tendencia Central más

importantes en las estadísticas aplicadas en psicología. La importancia de la “tendencia central” es

incuestionable, pero es importante destacar que las mismas no son totalmente exhaustivas para

describir todas las características de una muestra de puntajes.

Además de la tendencia central o el agrupamiento de los puntajes alrededor de ciertos valores

centrales, se observan manifiestas diferencias entre los valores obtenidos por cada sujeto. Algunos

sujetos obtienen puntajes que sobrepasan las medidas de tendencia central, mientras que otros

corresponden a valores inferiores a la tendencia central. Esto se debe, principalmente, a las

diferencias individuales, que se reflejan en los resultados obtenidos en las mediciones

psicológicas, las cuales determinan una evidente “variabilidad” de las puntuaciones individuales.

En la misma forma en que la tendencia central fue analizada a través de varios estadísticos

denominados medidas de tendencia central, las variaciones observadas entre los puntajes pueden ser

descritas a través de estadísticos denominados medidas de variabilidad o dispersión, las cuales

permiten analizar las condiciones de variación que se dan entre los puntajes de la muestra y las

medidas de tendencia central.

Las medidas de variabilidad que se analizarán a lo largo de este capítulo son: la fluctuación, los

percentiles, la varianza y la desviación estándar. Las dos primeras, la fluctuación y los

percentiles, son medidas de variabilidad que no están asociadas con ninguna medida de tendencia

central, mientras que la desviación media, la varianza y la desviación estándar, son medidas de

variabilidad asociadas con la media aritmética.

Las medidas de variabilidad anteriormente presentadas no son las únicas medidas de de este tipo

existentes, pero para efectos de nuestros estudios y posteriores aplicaciones, se considerarán las más

importantes.

M E D I D A S D E V A R I A B I L I D A D Q U E N O S E A S O C I A N C O N L A

M E D I A A R I T M É T I C A

L a F l u c t u a c i ó n ( A m p l i t u d )

La fluctuación es la medida de variabilidad más sencilla, tanto en su forma de calcularse como de

interpretarse. También se le reconoce como rango o amplitud, y se refiere a la diferencia que hay

entre la puntuación mayor de la distribución, menos la puntuación menor de la distribución, más

uno:

= fluctuación

= puntuación mayor

= puntuación menor

1 : corrector por continuidad

Page 55: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

38

Si nos referimos a los datos de la muestra No.1, Capítulo 3 (ver Tabla 3-1), el puntaje mayor fue

122 y el menor 67, lo que implica que su fluctuación es de:

Para datos agrupados en tablas de distribuciones de frecuencias, la fluctuación es la diferencia entre

el límite de clase superior del intervalo más alto, menos el límite de clase inferior del intervalo más

bajo.

Como puede observarse, la fluctuación está afectada por los puntajes extremos de la distribución, y

esta situación establece la probabilidad de que valores inusuales pueden estar afectándola. Además,

la fluctuación no está relacionada con ninguna medida de tendencia central, lo cual le resta poder en

los análisis estadísticos.

Es importante destacar, que la fluctuación es muy sensible al tamaño de la muestra, lo que significa

que está muy afectada por las modificaciones en el tamaño de las mismas. Ante este conjunto de

condiciones desfavorables, es claro que la utilidad de la fluctuación es bastante limitada en

comparación con otras medidas de variabilidad que analizaremos posteriormente. Sin embargo, ya

vimos que la misma es importante para la construcción de las tablas de frecuencias por intervalos.

A continuación vamos a introducir una medida de variabilidad de mucha importancia para la

psicometría y el diseño de normas: los percentiles.

L o s P e r c e n t i l e s

Se conoce como percentil, al puntaje de una distribución que deja por debajo de él un cierto

porcentaje de los casos de dicha distribución. Por ejemplo, el percentil 50, o sea, P50 en notación

estadística, es aquel que deja por debajo de sí al 50% de la totalidad de los casos; el percentil 32,

P32, es aquel que deja por debajo de sí al 32%, y así sucesivamente. Para el cálculo de los

percentiles, es necesario que los datos estén organizados en una Tabla de Frecuencias ordenada de

menor a mayor. El procedimiento de cálculo de un percentil es idéntico al de la mediana y se le

considera un estadístico de posición. Para el cálculo de los percentiles en una tabla de frecuencias se

recurre a la siguiente fórmula:

(( )

), donde:

Li = límite inferior real del intervalo en que cae el percentil.

%n= número de casos correspondientes al percentil y se encuentra en la columna de las

frecuencias acumuladas.

= frecuencias acumuladas hasta el intervalo anterior al del percentil.

= frecuencias simples dentro del intervalo donde cae el percentil.

i = tamaño del intervalo.

A continuación se presenta un ejemplo:

Page 56: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

39

TABLA 6-1:

Cálculo del P40 en una muestra de 78 sujetos

I F Fa

5-9 3 3

10-14 8 11

15-19 16 27

20-24 17 44

25-29 12 56

30-34 7 63

35-39 5 68

40-44 4 72

45-49 2 74

50-54 2 76

55-59 1 77

60-64 1 78

Supongamos que se desea calcular el P40 en los datos de la Tabla anterior:

Paso 1: se calcula el %/n, o sea, el 40% de 78 = (0 0)( )

Paso 2: se ubica 31.2 en el intervalo 20 – 24 que tiene una fa = 44, porque es en ese

intervalo en el que se encuentra dicho valor.

Paso 3: a partir de este intervalo se desarrolla la fórmula:

(

) 0

De acuerdo con el resultado obtenido, el puntaje 20.74 deja por debajo de él al 40% de la

distribución. Es necesario destacar que los percentiles también pueden ser identificados con otras

denominaciones, la cuales están asociadas con los porcentajes de puntajes que dejen por debajo de

si:

Deciles (D): se refieren al 10%. En este caso, se les denominaría: decil 1 al primer 10% (D1),

decil 2 al 20% (D2), decil 3 al 30% (D3) y así sucesivamente hasta el decil 10 que dejaría por

debajo de sí al 100%.

Quartil (Q) : se refieren a intervalos de 25%. El cuartil 1 (Q1) deja por debajo al 25%, el Q2 se

refiere al que deja por debajo al 50% (observe que este caso es igual a la mediana), el Q3 que

deja por debajo el 75% y el Q4 que corresponde al 100%.

Intervalo en que cae 31.2

Page 57: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

40

Observe que el D5, el Q2 y la mediana, corresponden al mismo dato: el que deja por debajo de si

al 50% de la distribución.

Todas estas denominaciones corresponden a percentiles y son calculados de acuerdo con la

fórmula ya presentada.

M E D I D A S D E V A R I A B I L I D A D Q U E S E A S O C I A N C O N L A M E D I A

A R I T M É T I C A

L a D e s v i a c i ó n M e d i a

A partir de la “desviación media”, nuestro interés se centra en las medidas de variabilidad que

parten de algún tipo de promedio, ya sea la mediana o en especial la media. La desviación media se

define como el promedio de las desviaciones absolutas alrededor de la media. La fórmula para el

cálculo de dicho estadístico para datos no organizados por intervalos es:

∑| |

∑| |

A continuación se presenta un ejemplo:

X |d|

2 3.5

3 2.5

4 1.5

5 0.5

6 0.5

7 1.5

8 2.5

9__ 3.5__

∑ 16.0

Como se puede observar, cada puntaje se resta de la media (d) pero no se toma en consideración el

signo (diferencias absolutas), se suman y dividen entre n, obteniéndose una estimación de la

variabilidad la cual tiene la restricción de que no da información sobre la ubicación del puntaje con

relación a la media.

Diferencia

entre el

puntaje y la

media

aritmética,

sin

considerar

el signo

Page 58: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

41

Para datos organizados en tablas de frecuencias, los puntos medios de cada intervalo se restan de la

media aritmética, sin tomar en consideración los signos (| |). Luego se multiplican las frecuencias

de cada intervalo por sus respectivas desviaciones, f(d), se suman los resultados de esta columna y

se dividen entre la n muestral. La fórmula para calcular de DM en datos agrupados es la siguiente:

∑( | |)

∑( | |)

Considerando los datos de la Tabla 6-2, la

0

TABLA 6-2:

Cálculo de la DM para una muestra de 70 estudiantes aspirantes a ingresar a la universidad.

I F Pm |d| f(|d|)

65-69 2 67 27.64 55.28

70-74 1 72 22.64 22.64

75-79 4 77 17.64 70.56

80-84 9 82 12.64 113.76

85-89 8 87 7.64 61.12

90-94 17 92 2.64 44.88

95-99 5 97 2.36 11.8

100-104 8 102 7.36 58.88

105-109 5 107 12.36 61.8

110-114 4 112 17.36 69.44

115-119 5 117 22.36 111.8

120-124 2 122 27.36 54.72

∑ = 70 ∑= 736.68

La DM representa una modificación del cálculo e interpretación de las medidas de variabilidad.

Esto se debe a que en este caso existe un punto o criterio a partir del cual se determinan las

desviaciones: la media aritmética. En otras palabras, desviación significa diferencia entre el puntaje

y la media aritmética. La DM no es aconsejable en muestras grandes, aunque puede utilizarse en

muestras pequeñas; además, no toma en consideración los signos positivos o negativos de las

diferencias, atendiendo a la posición del puntaje con relación a su media.; esto no favorece la

utilización de esta medida en el análisis de la Distribución Normal.

D e s v i a c i ó n E s t á n d a r O T í p i c a

Es la más importante de las medidas de variabilidad. Está afectada por todos los valores de la

distribución y mide la dispersión de los puntajes a partir de la media aritmética, con la característica

fundamental de que considera los signos + y – de cada diferencia. Esta situación la coloca en una

posición superior, matemáticamente, con respecto de las otras medidas de variabilidad

Page 59: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

42

anteriormente discutidas. Para el caso de poblaciones, la desviación estándar se representa por el

símbolo σ; y al cuadrado de la desviación estándar σ2, se le denomina varianza. Cuando nos

referimos a muestras, la desviación estándar está representada por s y el cuadrado de esta desviación

s2 se denomina varianza muestral.

En distribuciones de frecuencias simples (no afectadas por intervalos), la fórmula para calcular la

desviación estándar es a siguiente:

√∑( )

Para el cálculo de la S, se requieren los siguientes pasos:

1. Calcular la media aritmética de la distribución

2. Calcular la diferencia algebraica entre cada puntaje (x) y la media:

3. ( ̅); a esta diferencia se le denomina desviación (d).

4. Elevar al cuadrado las desviaciones de cada puntaje con respecto a la media ( ̅) y sumar

el total de las desviaciones cuadráticas

5. Dividir la suma de las desviaciones cuadráticas en la muestra entre el número total de casos (n).

Este valor se denomina la varianza muestral, la cual será muy útil al momento de analizar las

estadísticas inferenciales.

6. Finalmente le extrae la raíz cuadrada a la varianza y se obtiene la desviación estándar (s).

Para datos agrupados en tablas de intervalos, la fórmula para el cálculo de la s es la siguiente:

√∑

A continuación se presenta un ejemplo del cálculo de la varianza y la desviación estándar, para

datos agrupados en tablas de intervalos.

A partir de los datos organizados en la Tabla 6-3, se sustituye en la fórmula, y se obtiene el valor de

la s:

0 ( ) √

0 √ 0

168.20 representa la varianza

Al extraérsele la raíz cuadrada a la varianza, se calcula la s (desviación estándar de la

muestra).

Page 60: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

43

TABLA 6-3:

Cálculo de la desviación estándar para una muestra de 70 aspirantes a ingresar a la universidad

I f Pm fpm fpm2

65-69 2 67 134 8978

70-74 1 72 72 5184

75-79 4 77 308 23716

80-84 9 82 738 60516

85-89 8 87 696 60552

90-94 17 92 1564 143888

95-99 5 97 485 47045

100-104 8 102 816 83232

105-109 5 107 535 57245

110-114 4 112 448 50176

115-119 5 117 585 68445

120-124 2 122 244 29768

Total ∑ 0 6625 638745

La s es la medida de variabilidad más confiable y se puede definir como la raíz cuadrada del

promedio de las desviaciones cuadráticas alrededor de la media, siendo ésta su propiedad

matemática más importante. A partir de estas propiedades, la s es de gran utilidad en análisis

estadístico más avanzados tales como: muestreo, prueba de hipótesis, Análisis de la Varianza, teoría

de regresión y correlación, etc.

L a A s i m e t r í a

Se entiende por simetría el grado de equilibrio que presentan las observaciones a ambos lados de su

tendencia central. Por lo tanto, la asimetría es la ausencia de equilibrio entre dichas puntuaciones.

Estadísticamente, la simetría se refiere a que las tres medidas de tendencia central son iguales; como

esta situación es poco probable que suceda en las muestras, las mismas son asimétricas en vista de

que dichas medidas tienden a ser diferentes por efecto de los errores de muestreo. En el fondo, los

investigadores aspiramos a obtener muestras con bajos niveles de asimetría y tratamos de verificar

esta situación calculando el índice de asimetría.

La condición de asimetría de una muestra se puede verificar, inicialmente, a través del polígono de

frecuencias, en el cual se puede observar las distintas formas de asimetría o sesgo, como también se

le denomina. Veamos algunos ejemplos.

Page 61: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

44

FIGURA 6—1

Si la cola izquierda del polígono es más alargada que la derecha, estamos ante un caso de asimetría

negativa. Esto significa que por debajo de la media se encuentran los puntajes más extremos y la

media aritmética ha tenido que correrse en esta dirección, para mantener los pesos positivos y

negativos equilibrados. Si la cola de la derecha está más alargada, significa que estamos ante un

caso de asimetría positiva. Es decir, los puntajes más extremos están por encima de la media

aritmética y ella ha tenido que correrse en dicha dirección. En la distribución ubicada en el centro

de la Figura 6—1, ambos lados de la curva están equilibrados y esto indica que sus medidas de

tendencia central tienden a ser más o menos iguales.

Existen diversas fórmulas para calcular el Coeficiente de Asimetría o CA.; a continuación

presentamos dos de ellas.

Primer Coeficiente de Asimetría de Pearson:

Segundo Coeficiente de Asimetría de Pearson:

( )

Cuando el coeficiente de asimetría es ≤ 1, se considera que el mismo está dentro de los límites

aceptables de sesgo; mucho mejor a medida que tiende a cero (0).

L a C u r t o s i s

Se define como el grado de apuntalamiento (alargamiento vertical) que tiene una distribución y que

se refleja con claridad en los gráficos estudiados anteriormente. Cuando el apuntalamiento es poco

marcado (bajo), se considera que la distribución es platicúrtica. Cuando el apuntalamiento es muy

marcado, la distribución se considera leptocúrtica. Y cuando el apuntalamiento es mesurado, se

considera mesocúrtica, siendo esta última la que mejor nos aproxima al modelo de la curva normal.

Page 62: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

45

FIGURA 6—2

Al igual que en la asimetría, hay diversos métodos para calcular la curtosis. A continuación

presentamos uno de ellos: K = coeficiente de curtosis percentílico, cuya fórmula es la siguiente:

K = coeficiente de curtósis percentílico

Q = desviación intercuartil =

P90 : percentil 90

P10 : percentil 10

C O N C E P T O S I M P O R T A N T E S

Variabilidad o dispersion

Fluctuación

Percentil

Variable

Varianza

Desviación estándar (típica)

Decil

Quartil

Desviación media

Asimetría

Curtósis

Page 63: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

46

E J E R C I C I O S P R Á C T I C O S

P r o b l e m a 1

110 113 111 108 113 134 124 80 112 106

133 119 115 117 110 104 125 85 120 135

116 103 103 121 109 147 103 113 107 98

128 93 93 105 118 119 89 143 108 142

85 108 108 136 115 117 110 128 145 127

100 100 100 123 126 119 113 102 100 93

105 111 122 100 114 91 123 132 97 110

150 130 130 89 108 137 121 142 111 123

118 104 104 94 115 112 125 129 131 110

97 135 135 139 133 107 115 83 109 116

154 131 113 82 106 101 122 96 145 101

Para los datos presentados, los cuales están debidamente organizados en Tablas y gráficos, y para

los cuales se han calculado las principales medidas de tendencia central, determine, utilizando la

tabla con intervalos de tamaño 5:

1. Los percentiles 25, 50, 75 y 95

2. La desviación media

3. La Varianza y la desviación estándar

4. La asimetría primero, y segundo, coeficiente de asimetría

5. La Curtosis

Calcule los estadísticos de variabilidad anteriormente señalados, para todas las tablas de práctica

que ha desarrollado utilizando los datos presentados.

Page 64: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

47

CAPÍTULO 7

MODELOS POBLACIONALES PROBABILÍSTICO

A lo largo de los capítulos anteriores, se ha hecho énfasis en la relación existente entre las medidas

de tendencia central y las de variabilidad, especialmente entre la media aritmética y la desviación

estándar. Es incuestionable que una medida pierde mucha significatividad si no va acompañada de

la otra, dado que ambas conjugan las dos características más importantes que se pueden observar en

una distribución de puntajes.

La media y la desviación estándar son las dos medidas descriptivas más poderosas y más

importantes en los análisis estadísticos aplicados en la investigación del comportamiento. Bajo

ciertos supuestos teóricos, las muestras analizadas estadísticamente se aproximan a un modelo

poblacional teórico denominado curva normal; esto es posible a partir de la información

proporcionada por la media y la desviación estándar.

Para comprender mejor lo anteriormente señalado, es necesario tener claro el significado del

concepto modelo poblacional o probabilístico. Un modelo poblacional (o probabilístico) es una

expresión matemática deducida de un conjunto de supuestos con el propósito de:

1. Estudiar los resultados de un experimento aleatorio y

2. Pronosticar resultados futuros del experimento o investigación, cuando se realizan un número

repetido de veces.

Algunos modelos poblacionales se utilizan para aproximar un gran conjunto de distribuciones de

datos obtenidos de grandes poblaciones, las cuales se hacen representar por subconjuntos menores

denominados muestras. En vista de que las variables se han definido como discretas y continuas, se

han creado modelos poblacionales para cada uno de estos tipos de variables. Lo anteriormente

señalado nos permite hacer las siguientes observaciones:

En los casos en que la(s) variable(s) de estudio se considere discreta, o sea, que está

representada por categorías, las cuales reflejan la cantidad de sujetos, objetos o fenómenos que

comparten dicha categoría, hay un conjunto de modelos poblacionales probabilísticos que

permitirán llevar adelante estudios e investigaciones con dichas variables, independientemente

del área científica en la que se desarrolla el estudio. Lo importante es que la variable, además de

ser discreta y no poseer valores fraccionales, satisfaga las restricciones que el modelo

probabilístico exige. Algunos ejemplos de estos modelos serían: Bernoulli, Binomial,

Multinomial, Hipergeométrico, Poisson, y otros. Para el caso de este libro, analizaremos el

modelo Binomial, en vista de que el mismo se aplica a diversas experiencias, situaciones e

investigaciones propias de los estudios del comportamiento, en especial en el área de la

psicometría y construcción de pruebas.

Page 65: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

48

En los casos en que la(s) variable(s) de estudio se considere continua, o sea, que puede asumir

valores fraccionales dentro de intervalos y que por lo tanto indica la cantidad que cada sujeto

posee del atributo, los resultados serán aproximados a modelos de probabilidad continuos, tales

como la Distribución Normal para muestras grandes (>) de 30 sujetos, la “t” de student y la “F”

de Fisher para muestras ≤ de 30sujetos.

V A R I A B L E S D I S C R E T A S

L a D i s t r i b u c i ó n B i n o m i a l

La Distribución Binomial es útil en aquellos casos en los cuales la variable de estudio es discreta en

el sentido de que puede asumir únicamente dos posibles valores y se satisfacen las siguientes

restricciones:

1. El experimento o investigación está compuesto por n casos, para cada uno de los cuales hay n

cantidad de pruebas o actos, con dos posibles alternativas cada una.

2. Cada una de las pruebas se debe desarrollar en las mismas condiciones

3. Los resultados obtenidos en cada prueba se clasifican en una de dos posibles categorías que son

mutuamente excluyentes denominadas éxitos o fracasos.

4. La probabilidad de éxito se identifica por “p” y la de fracaso por “q”, las cuales son

mutuamente excluyentes.

5. En cada acto, la probabilidad de éxito no varía, y por lo tanto, la probabilidad de “q” sería igual

a 1 – p

6. El objetivo del experimento es determinar para cada acto o prueba, si el evento venturoso o

esperado, se presentó o no.

Cuando se desarrollan investigaciones de esta índole, las mismas se consideran de carácter binomial

y tienen n + 1 resultados posibles. El 1 representa la posibilidad de que el evento esperado no se

dé. Veamos algunas situaciones relacionadas con este tipo de estudio.

Se lanza una moneda 5 veces. El evento de interés es la aparición de caras y por lo tanto la

misma podría aparecer: 1, 2, 3, 4 y 5 veces, pero también puede suceder que no aparezca

ninguna vez. Por lo tanto, cara tiene 5 + 1 formas diferentes de aparecer (n + 1), lo cual incluye

que no aparezca. Su representación correcta sería: 0, 1, 2, 3, 4, 5.

Se aplica un examen de 25 preguntas y el evento de interés es el número de preguntas

respondidas correctamente. Esto significa que el estudiante puede obtener desde 1… hasta 25

preguntas correctas, pero hay que incluirle que no responda correctamente ninguna de las 25 lo

que significa que obtuvo 0 éxitos. Bajo estas condiciones, el experimento tiene 25 + 1 posibles

resultados, o sea, 26. Desde 0, 1, 2, 3, 4… hasta 25.

El modelo binomial es útil en casos en los cuales estamos interesados en determinar la probabilidad

de ocurrencia de un número X de éxitos, cuando se han desarrollado n pruebas o actos, y la

probabilidad p de éxitos se ha mantenido constante a lo largo de las n pruebas. Por ejemplo:

¿Cuál es la probabilidad de obtener exactamente tres caras al lanzar una moneda 5 veces?

Page 66: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

49

¿Cuál es la probabilidad de responder satisfactoriamente 10 preguntas de un examen de 30

preguntas, si cada pregunta es de selección múltiple con cuatro alternativas?

Para responder a estas preguntas, se debe aplicar la fórmula de la función probabilística binomial, la

cual detallamos a continuación:

( ) ( )

Esta expresión se leería de la siguiente manera: ¿cuál es la probabilidad de obtener exactamente X

éxitos, en un experimento de n pruebas, siendo p la probabilidad de éxito en cada prueba? Los

elementos que componen la ecuación son los siguientes:

b : función binomial o probabilidad binomial

X: número de éxitos

p: probabilidad de cada éxito (es una constante, que será explicada en el capítulo 9)

nCx: combinación de x éxitos en n pruebas. (

)

( )

A continuación se desarrollarán los dos problemas presentados como ejemplos:

Ejemplo 1

¿Cuál es la probabilidad de obtener exactamente tres caras al lanzar una moneda 5 veces?

( 0 0) ( )(0 0 )(0 0 ) ( 0)(0 )(0 ) 0

Ejemplo 2

¿Cuál es la probabilidad de responder satisfactoriamente 4 preguntas de un examen de 10

preguntas, si cada pregunta es de selección múltiple con cuatro alternativas?

( 0 0 ) ( )(0 )(0 0 ) ( 0)(0 00 )(0 ) 0

V A R I A B L E S C O N T Í N U A S

P u n t u a c i o n e s e s t á n d a r

Daremos inicio a nuestro estudio de los modelos poblacionales continuos, a través de la

Distribución Normal, considerada la más importante de todas las distribuciones por las propiedades

estadísticas que la definen.

Si tomáramos en consideración todos los puntajes de la muestra resumida en la Tabla 5-1,

podríamos llegar a la conclusión que la media aritmética de dichos datos fue de 94.64. A partir de

este dato podemos observar que las puntuaciones de dicha muestra se desvían por encima y por

debajo de su media muestral, tal y como lo presentamos en los ejemplos a continuación:

Page 67: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

50

TABLA 7-1:

Desviaciones con respecto a la media

Dato Límite real Media (d)

Desviación

75 74.5 94.64 -20.14

90 89.5 94.64 -5.14

99 99.5 94.64 +4.86

112 112.5 94.64 +17.86

Los ejemplos anteriores demuestran que los puntajes de las distribuciones se desvían por encima y

por debajo de su media aritmética; si recordamos una propiedad de la media sabemos que ∑ 0.

Otro aspecto a destacar en el cuadro anterior es que para calcular la desviación (d), se utilizan los

límites reales de cada dato, atendiendo a la posición que ocupe con relación a la media: si es menor

que la media, la desviación se haría desde el límite inferior real del dato (75 y 90); si es mayor que

la media, se utilizaría el límite superior real del dato (99 y 112). Estos ejemplos permiten aclarar el

concepto de desviación con respecto a la media, desde el punto de vista de que las desviaciones

alrededor de la media pueden ser negativas (-) para los casos de X menores que la media, y

positivas (+) para los casos de X mayores que la media.

Para la muestra de datos de la Tabla 5-1, la desviación estándar (s) fue de 12.97, lo cual representa

el promedio de las desviaciones alrededor de la media. Si cada desviación de los puntajes

observados en la Tabla 7-1, fuera dividida entre la desviación estándar (12.97), se obtendrían las

desviaciones de los puntajes expresados en unidades de desviación estándar, tal y como se presenta

en la siguiente Tabla.

TABLA 7-2:

Desviación estandarizada de los puntajes originales a partir de la relación d/s

x (Puntajes)

d (Desviación

original)

Desviación estandarizada

75 -20.14 0 ⁄ -1.55

90 -5.14 ⁄ -0.40

99 +4.86 ⁄ +0.37

112 +17.86 ⁄ +1.38

Si observamos la Tabla anterior, las “d” han sido transformadas a unidades de desviación estándar.

Esta nueva situación se interpreta de la siguiente manera:

1. El puntaje 75 se desvía de la media aritmética en -1.55 unidades de desviación estándar.

2. El puntaje 90 se desvía de la media aritmética en -0.40 unidades de desviación estándar.

3. El puntaje 99 se desvía de la media aritmética en 0.37 unidades de desviación estándar.

4. El puntaje 112 se desvía de la media aritmética en 1.38 unidades de desviación estándar

Page 68: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

51

Como se puede observar, las “d” con la media aritmética son relativas en función de la desviación

estándar; la interpretación ahora es la siguiente: cuántas unidades de desviación estándar se

desvía cada puntaje de su media aritmética.

Una puntuación estándar, identificada a partir de este momento por “z”, se refiere a la

transformación de la diferencia de un puntaje con respecto a su media aritmética en unidades de

desviación estándar. La regla (fórmula) para calcular esta medida es la siguiente:

En términos de puntuaciones estandarizadas Z, una distribución de puntajes está definida dentro de

los siguientes intervalos:

FIGURA 7—1

De acuerdo con el diagrama anterior, podemos hacer las siguientes deducciones:

Cada desviación estándar (s) corresponde a una z

En una distribución de puntajes, los mismos estarán definidos entre -3z y +3z.

Esto significa que el puntaje menor de la distribución estará muy cerca de -3z pero nunca más

allá de este valor

De igual manera, el puntaje mayor de la distribución estará muy cerca de +3z, pero nunca será

mayor a éste.

La media de las puntuaciones z será igual a cero y la desviación estándar será igual a uno.

L a D i s t r i b u c i ó n N o r m a l

La Distribución Normal es un modelo poblacional, teórico, que permite analizar las observaciones

correspondientes a ciertas muestras en términos de probabilidades. La Distribución normal se

identifica por una curva perfecta en forma de campana, que satisface las siguientes propiedades:

1. Es una distribución teórica de los datos de una población

2. Tiene forma de campana

3. Es asintótica, o sea, que las colas de la curva nunca se unen con el eje de X

4. Tiene como parámetros a (media) y a (desviación estándar). Esto significa que el área bajo

la curva está definida por y un valor determinado de .

5. El valor de es de 0, mientras que el valor de es de 1.

| | | | | | |

-3s -2s -1s 𝑥 1s 2s 3s

-3z -2z -1z 0 1z 2z 3z

Page 69: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

52

6. Está definida totalmente a partir de la media, por 3 desviaciones a la derecha (por encima de )

y 3 desviaciones a la izquierda (por debajo de ), lo que significa que la totalidad de los casos

de la muestra están definidos dentro de este intervalo. (Ver la Figura 7—2)

FIGURA 7—2

Otra característica de la Distribución Normal es su perfecta simetría; la media aritmética = a la

mediana = a la moda, lo que determina que una mitad de la curva sea igual a la otra mitad. Esto

implica que las características estadísticas de una mitad, sean igual a las de la otra.

Entre cada desviación estándar se describe la probabilidad de los datos bajo la curva, tal y como se

observa en la Figura 7—2. Esta probabilidad también se expresa en % para facilitar su

interpretación. A continuación se detalla la distribución de probabilidades bajo la curva:

Entre la media y una desviación estándar positiva se encuentra el 0.3413 de probabilidad que

corresponde al 34.13%. Por identidad, se dan los mismos valores a una desviación negativa.

Entre una desviación y dos desviaciones positivas, se da el 0.1359 de probabilidad que

corresponde al 13.59%; lo mismo sucede el lado izquierdo.

Entre dos desviaciones y tres desviaciones positivas se observa el 0.0215; de igual manera

sucede en el lado izquierdo. Esto corresponde al 2.15% de la probabilidad total.

Desde la media hasta tres desviaciones positivas se da un total de 0.4987 de probabilidad; de

igual manera sucede en el lado izquierdo.

La probabilidad total bajo la curva, o sea, entre -3z y + 3z es igual a 0.9974, que corresponde a

un 99.74% de la totalidad del área bajo la curva. La Curva Normal no tiene un 100% de

probabilidades bajo ella, por su condición asintótica; la curva normal va al infinito tanto en la

cola derecha como en la izquierda.

-3 -2 -1 0 1 2 3

13.59% 13.59%

34.13% 34.13%

2.15% 2.15%

Page 70: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

53

Así como las probabilidades bajo la curva son infinitas, de igual manera lo son las puntuaciones

z. Sin embargo, cuando se aproximan muestras a la curva normal, las probabilidades se

determinan entre +3z y – 3z.

Para cada valor z hay una probabilidad asignada, la cual se determina a través de una Tabla

especialmente confeccionada para estos fines (Ver Apéndice)

Aplicación

Una de las aplicaciones al trabajar con la distribución normal mediante las puntuaciones z es el

cálculo de la probabilidad de ocurrencia de una determinada puntuación.

El procedimiento para este cálculo conlleva los siguientes pasos:

1. Determinar el puntaje z correspondiente a la puntuación cuya probabilidad se quiere calcular.

2. Se determina el área correspondiente entre la media y el valor z (Utilizar la tabla de Áreas bajo

la curva normal en el Apéndice 1)

3. Realizar la operación de acuerdo con el área que se solicita

Si Z es positiva y se solicita área por encima de x, entonces resta

0 000

Si Z es positiva y se solicita área por debajo de x, entonces suma

0 000

Si Z es negativa y se solicita área por encima de, entonces suma

0 000

P de Z

P de Z

0.5000

Page 71: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

54

Si Z es negativa y se solicita área por debajo de, entonces resta

0 000

Si Z1 y Z2 tienen signos iguales y se solicita el área entre ellas, entonces se resta

Si Z1 y Z2 tienen signos distintos y se solicita el área entre ellas, entonces se

suma

Ejemplos

P de Z

0.5000

P de Z

P de Z1

P de Z2

P de Z1 P de Z2

Page 72: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

55

1. Se aplicó una prueba de aptitudes generales a una muestra de 250 estudiantes de primer ingreso

a la universidad. La media fue de 65 y la desviación estándar de 8.25. Determine la “p” de

obtener una puntuación mayor de 68 puntos

Se calcula el valor “z” correspondiente al puntaje 68. En vista de que ese

puntaje es mayor que la media aritmética, se utiliza el límite superior real del

mismo.

0

Se determina el área o probabilidad bajo la Tabla de la curva normal

correspondiente al valor de z, lo cual equivale a 0.1628

Como la probabilidad pedida es mayor que 68, se resta a la mitad de la curva

(0.5000) la probabilidad correspondiente a X = 68, tal y como se demuestra a

continuación: 0 000 0 0 , lo cual corresponde a la

respuesta correcta.

2. Con los mismos datos del problema, determine la probabilidad de obtener una puntuación

menor o igual a 71 puntos.

Se calcula el valor “z” correspondiente al puntaje 71; por ser el mismo mayor

que la media aritmética, se utiliza el límite superior real.

0

Se determina el área o probabilidad de z = 0.79, que corresponde a 0.2852

En vista de que la probabilidad solicitada es ≤ que 71, a la probabilidad

correspondiente a 71 que va desde la media hasta este puntaje, se le suma la

mitad inferior de la curva, tal y como se presenta a continuación:

0 0 000 0 , que representa la respuesta correcta

3. Con los mismos datos, indique la probabilidad de obtener una puntuación entre 60 y 71.

Por el problema anterior ya se conoce la probabilidad del puntaje 71, que fue

igual a 0.2852

Se determina el valor Z del puntaje 60, que por ser inferior a la media

aritmética, requerirá que se utilice el límite inferior real de dicho puntaje.

0

Como se pudo observar, este valor es negativo por ser 60 inferior a la media de

65.

Se determina el área o probabilidad de Z = -0.67 utilizando la Tabla; el

resultado fue de 0.2486

Finalmente se suman las dos áreas y se determina la probabilidad de obtener un

puntaje ente 60 y 71, tal y como se presenta a continuación:

0 0 0 , que representa la respuesta correcta.

Page 73: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

56

Hay ocasiones en que el problema se debe desarrollar íntegramente en una mitad de la curva. Por

ejemplo, si se busca un área en la mitad superior de la media o en la mitad inferior de la media

aritmética.

Tomando como referencia el problema planteado, suponga que se requiere determinar la

probabilidad que hay entre los puntajes 53 y 62. Como se puede observar, ambos puntajes están

por debajo de la media aritmética, lo cual afecta la definición de los límites reales. Para estos

casos, se procedería de la siguiente manera.

1. Ubique el puntaje más alejado de la media aritmética, el cual sería, en este caso 53, y

determine su valor Z, utilizando su límite real inferior.

2. Determine el área correspondiente a este valor Z, que es igual a 0.4357

3. Ubique el puntaje más cercano a la media, el cual corresponde a 62. Como usted está buscando

la probabilidad entre 53 y 62, en realidad está buscando la probabilidad entre 52.5 y 62.5, por lo

tanto, necesita determinar la probabilidad entre la media y el límite superior de 62, que es 62.5.

Se determina la Z de 62.5.

0 0

4. Determine el área o probabilidad correspondiente a esta Z, que es 0.1179

5. Teniendo el área del límite inferior del puntaje más lejano (53) y el área del límite superior del

puntaje más cercano (62), se restan ambas probabilidades, tal y como se presenta a

continuación: 0 0 0 , que es la respuesta correcta al problema.

El manejo correcto de la Distribución Normal es una obligación de los especialistas del

comportamiento, en vista de que un número importante de investigaciones se refieren a muestras

provenientes de grandes poblaciones. Además, un número importante de pruebas de hipótesis se

fundamentan en los principios de la Distribución Normal, tanto en el caso de muestras grandes

como pequeñas. Finalmente, la medición del comportamiento requiere del dominio de la curva

normal en los aspectos de muestreo, análisis de reactivos y diseño de normas.

A p r o x i m a c i ó n N o r m a l D e L a D i s t r i b u c i ó n B i n o m i a l

En algunas ocasiones, los investigadores se encuentran con la necesidad de analizar un problema

utilizando una distribución de probabilidad diferente a la que corresponde a la(s) variable(s) de

estudio. Uno de los casos más frecuente en psicología es el evaluar a través de la normal, datos que

originalmente corresponden a la binomial. A esta situación se le conoce como la aproximación

normal de la binomial.

Page 74: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

57

Su aplicación es muy útil en investigación general del comportamiento, pero en mi opinión, su

aporte más importante se da en la medición psicológica, especialmente en los casos en que

deseamos analizar probabilísticamente los resultados de pruebas, cuyas respuestas se pueden

brindar en dos posibles alternativas: éxitos y fracasos, y en las cuales, el número de reactivos que la

conforman es grande.

Para utilizar esta aproximación es necesario que se cumplan algunas condiciones:

N debe ser grande. Para efectos prácticos estadísticos, np debe ser > 5.

p y q no deben estar próximos a cero; mientras más se aproximen a su límite, 0.50, mejor.

La aproximación se realiza transformando los puntajes binomiales a normales, o sea, a puntuaciones

z. La fórmula para alcanzar éste objetivo es:

z : puntuaciones normales estandarizadas

np : media de la distribución binomial

√ : desviación estándar de la distribución binomial

x : puntaje.

A continuación se presenta un ejemplo:

Se aplicó una prueba de conocimientos generales constituida por 60 reactivos; la prueba es de

cierto-falso, o sea, dos alternativas. Estamos interesados en determinar la probabilidad de

obtener hasta 38 preguntas correctas.

√ ( 0)(0 0)

√( 0)(0 0)(0 0) 0

0

Area (p) de Z = 2.20 = 0.4861

Probabilidad solicitada: mitad inferior de la curva = 0.5000 + 0.4861 = 0.9861

A partir del cálculo de Z, el resto del procedimiento se hace tal y como se estudió en el capítulo de

la Distribución Normal.

Page 75: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

58

C O N C E P T O S I M P O R T A N T E S

Curva Normal

Área o probabilidad

Desviación

Distribución binomial

Modelo poblacional

Límites reales

Puntuación estándar

Puntuación Z

Page 76: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

59

E J E R C I C I O S P R Á C T I C O S

P r o b l e m a 1

110 113 111 108 113 134 124 80 112 106

133 119 115 117 110 104 125 85 120 135

116 103 103 121 109 147 103 113 107 98

128 93 93 105 118 119 89 143 108 142

85 108 108 136 115 117 110 128 145 127

100 100 100 123 126 119 113 102 100 93

105 111 122 100 114 91 123 132 97 110

150 130 130 89 108 137 121 142 111 123

118 104 104 94 115 112 125 129 131 110

97 135 135 139 133 107 115 83 109 116

154 131 113 82 106 101 122 96 145 101

Para los datos presentados, usted ya ha desarrollado en los capítulos anteriores, todo un modelo de

análisis descriptivo que incluye: tablas de frecuencias, gráficos, medidas de tendencia central y de

variabilidad. En estas dos últimas, ha calculado la media aritmética y la desviación estándar. Como

ya es de su conocimiento, estos dos estadísticos se consideran los estimadores requeridos para

ajustar los datos a la distribución normal o curva normal. Desarrolle los problemas que le

presentamos, a continuación:

1. ¿Cuál es el área o “p” por encima del puntaje (X) = 103?

2. ¿Cuál es el área o “p” por debajo de X = 90?

3. ¿Cuál es el área o “p” por encima de X = 79?

4. ¿Cuál es el área o “p” por debajo de X = 112?

5. ¿Cuál es el área o “p” entre X = 77 y X = 94?

6. ¿Cuál es el área o “p” entre X = 99 y X = 112?

7. ¿Cuál es el área o “p” por debajo de X = 80 y por encima de X = 107?

8. ¿Cuál es el área o “p” exactamente = a X=103?

9. Para cada uno de los 8 ejercicios anteriores, determine el número de sujetos (n) incluidos dentro

de cada uno de los intervalos presentados.

B i n o m i a l

10. Se ha presentado un examen de cierto-falso con 20 preguntas. Determine la “p” de obtener:

0 preguntas correctas

4 preguntas correctas

Entre 3 y 6 preguntas correctas

11. La probabilidad de que nazca una niña mujer es de 0.51. Si en cierta fecha se producen tres

nacimientos, ¿cuál es la “p” de: que nacieran:

tres mujeres?

Por lo menos una mujer?

Ninguna mujer?

Page 77: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

60

12. En un “test” psicológico de relaciones espaciales, se tiene una probabilidad de 0.40 de acertar

en cada una de las pruebas. Si un sujeto realiza 5 pruebas, ¿cuál es la probabilidad de obtener:

un éxito?

tres éxitos?

hasta cuatro éxitos?

Ningún éxito?

13. El 30% de los hogares de cierta ciudad, tiene por lo menos una persona desempleada. Un

investigador visita 6 hogares. ¿Cuál es la probabilidad de que encuentre:

Un hogar en estas condiciones?

Entre 0 y 3 hogares en estas condiciones?

Todos los hogares en estas condiciones?

No menos de 2 hogares en estas condiciones?

14. La probabilidad de que un niño tenga Déficit de Atención (DA) en una escuela elemental es de

0.20. Se seleccionan 7 niños de dicha escuela. ¿Cuál es la probabilidad de que:

por lo menos 4 niños sufran de DA?

2 niños sufran de DA?

A lo máximo 3 niños sufran de DA?

Entre uno y 4 niños sufran de DA?

A p r o x i m a c i ó n N o r m a l A L a B i n o m i a l

15. Una prueba de aptitudes cuyas preguntas son de 4 alternativas cada una, consta de 50 reactivos.

¿Cuál es la probabilidad de obtener:

entre 20 y 38 respuestas correctas

entre 30 y 42 correctas

más de 26 correctas

menos de 20 correctas

16. En un centro de rehabilitación de menores el 40% ingresó por consumo de drogas. Se

selecciona una muestra de 60 menores. ¿Cuál es la probabilidad de obtener:

entre 20 y 29 menores consumidores?

menos de 30 menores consumidores?

15 o más menores consumidores?

Entre 12 y 22 menores consumidores?

Page 78: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

61

CAPÍTULO 8

CORRELACIÓN Y REGRESIÓN

En los capítulos anteriores nos hemos dedicado a analizar los resultados correspondientes a la

medición de una sola variable. Pero en muchas ocasiones, los psicólogos se interesan por las

relaciones que existen entre dos o más variables, asumiendo que las mismas no funcionan

independientemente, sino que una afecta o se relaciona con la otra.

Por lo general, las teorías psicológicas que tratan de explicar la conducta del hombre, analizan la

misma a través de modelos teóricos multivariantes, que exploran el comportamiento desde dos

perspectivas: la teórica y la operacional; en ambos casos, el enfoque principal se centra en

considerar el comportamiento como el efecto combinado de dos o más variables. El análisis

operacional de las relaciones entre variables se lleva a cabo utilizando una herramienta de las

estadísticas denominada correlación. El análisis de las correlaciones permite explicar, en términos

estadísticos, el tipo de relación entre las variables y la magnitud (cantidad) de la relación entre las

mismas.

Las correlaciones favorecen la interpretación del comportamiento desde diferentes puntos de vista:

La predicción: no es otra cosa que la posibilidad que tienen los especialistas de la conducta de

pronosticar, dentro de ciertos márgenes de error, el comportamiento de una o más variables, a

través del análisis del comportamiento de otras variables diferentes. Suponga que yo considero

que dos variables comportamentales X y Y se relacionan de alguna manera. Si logro comprobar

dicha relación, desde una perspectiva estadística, puedo estar en capacidad de pronosticar que

sucederá en el futuro con una de ellas, a partir del conocimiento del comportamiento de la otra.

Por ejemplo:

o Se ha logrado establecer estadísticamente, que la aptitud numérica (X) se relaciona

con el rendimiento académico en ingeniería (Y).

o Por lo tanto es posible, probabilísticamente, que se pueda pronosticar qué resultados se

pueden obtener en el futuro en la variable Y, si tengo información previa de los

resultados obtenidos de un atributo en la variable X.

Relación causa-efecto: a partir de la correlación, se puede establecer si entre dos o más

variables se da una relación de causa y efecto; o sea, que el comportamiento de una(s), es(son)

la(s) responsable(s) del comportamiento de la otra(s).

La Confiabilidad: es una de las dos características imprescindibles en toda prueba psicológica;

la otra es la validez. Se entiende por confiabilidad, la capacidad que tiene una prueba de

mantener resultados más o menos parecidos en dos o más mediciones de una variable, siempre

y cuando entre dichas mediciones, el sujeto no sufra cambios significativos (cognitivos,

cognoscitivos, emocionales, etc.). La correlación es un método que favorece la determinación

de la confiabilidad de una prueba.

Page 79: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

62

La Regresión: es un procedimiento estadístico a partir del cual se puede establecer una

predicción y requiere que previamente se establezca que entre las variables involucradas exista

correlación.

Después de haber presentado algunas características propias de la correlación, es prudente brindar

una definición de este concepto: se entiende por correlación, el grado de relación que existe entre

dos o más variables. La correlación nos brinda información sobre la magnitud o cantidad de

relación y la dirección de dicha relación. Más adelante aclararemos estos dos conceptos, porque

consideramos prudente aclarar el concepto de relación, antes de continuar avanzando en este tema.

Además, para facilitar la presentación del módulo, nos referiremos específicamente a la relación

que hay entre dos variables; a esta situación la llamaremos relación bivariante. Las relaciones de

más de tres variables las presentaremos al finalizar del capítulo.

La relación entre dos variables puede ser de dos tipos:

1. Relación lineal, que se refiere al caso en que dicha relación puede ser representada con mayor

precisión, a través de una línea recta.

2. Relación no lineal, que se refiere al caso en que la misma no se aproxima a una línea recta.

Para el desarrollo de nuestro tema nos referiremos, tanto en teoría como en la práctica, al modelo de

relación lineal.

A continuación presentamos un ejemplo de relación lineal. Supongamos que un investigador en

psicología escolar está interesado en determinar si las variables Habilidad General y Habilidad

Verbal están relacionadas. Para tal efecto, toma una muestra de 10 estudiantes preuniversitarios y

les aplica pruebas que miden ambos factores. Los resultados son los siguientes:

TABLA 8-1

Puntajes obtenidos en habilidad general y en habilidad verbal por 10 estudiantes preuniversitarios

Sujetos H. General

X H. Verbal

Y

1 10 10

2 12 15

3 20 17

4 25 25

5 27 32

6 35 37

7 43 40

8 40 38

9 32 30

10 47 49

Los puntajes resumidos en la Tabla 8-1 indican, de forma descriptiva, los resultados que obtuvieron

cada uno de los diez sujetos de la investigación, en la medición de las variables contempladas en el

estudio. Para determinar la correlación se sugiere que, como primer paso, se determine el

Page 80: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

63

Diagrama de Dispersión correspondiente a dichos datos, el cual nos brindará información gráfica

de la relación entre ambas variables.

GRÁFICO 8-1

El Diagrama de Dispersión consiste en localizar cada par de puntos (X, Y) en un sistema de

coordenadas rectangulares, el cual se construye en el cuadrante cartesiano en el cual tanto X (eje

horizontal) como Y (eje vertical) son positivos. Como se puede observar en el diagrama, hay diez

puntos que corresponden a la intersección de las X y las Y para cada sujeto. La variable Habilidad

General está ubicada en el eje X y la variable Habilidad Verbal en el eje Y; la totalidad de los

puntos localizados en el diagrama se denomina nube de puntos.

Los puntos localizados en el Diagrama permiten identificar ciertas características de la relación de

las variables X y Y, las cuales se deben generalizar para cualquier Diagrama de Dispersión que se

construya:

1. Si la nube de puntos tiende a una línea recta, estamos ante una relación lineal.

2. Si la nube de puntos tiende a algún tipo de curva, la relación es no lineal.

Para nuestro ejemplo, la nube de puntos tiende a una línea recta, lo cual es indicativo que estamos

ante una relación lineal.

La nube de puntos además de aproximar los datos a una línea recta, puede presentar una de dos

direcciones dentro del diagrama:

0

10

20

30

40

50

60

0 5 10 15 20 25 30 35 40 45 50

Y (

Ha

bil

ida

d v

erb

al)

X (Habilidad general)

Gráfico de dispersión de los datos

Page 81: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

64

1. Una dirección positiva, que es aquella en que la nube de puntos va de izquierda a derecha del

diagrama de dispersión.

2. Una dirección negativa, cuando la nube de puntos va de derecha a izquierda del diagrama de

dispersión.

Si analizamos con detenimiento la información presentada con relación al Diagrama de Dispersión,

podemos hacer las siguientes observaciones:

El Diagrama nos permite establecer si la relación será lineal o no lineal.

Además, el Diagrama permite pronosticar que la relación será positiva (+) o negativa (-)

atendiendo a la dirección de la nube de puntos.

Otro aspecto importante que se puede deducir de la inspección del Diagrama de Dispersión es la

estimación de la magnitud (cantidad) de la relación entre ambas variables, lo cual se podrá

determinar observando si los puntos tienen poca variabilidad o mucha variabilidad; en otras

palabras, si los puntos al trazarse una línea recta tienden a caer sobre la misma, o si los puntos

tienden a caer fuera de la línea, ya sea por encima o por debajo de ella. La siguiente figura presenta

las principales alternativas.

X

Y

X

Y

Page 82: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

65

FIGURA 8—1

En la Figura 8—1 se presenta con mucha claridad la información que se puede extraer de un

Diagrama de Dispersión.

Los tres primeros diagramas horizontales nos indican que corresponden a relaciones positivas,

por la dirección de la nube de puntos. Además se observa que la magnitud de las correlaciones

(información que está sobre recta de regresión) varía en cada uno de los Diagramas. En el

primero de observa que r = 1.00; en el segundo r = 0.91; en el tercero r = 0.56. Si observamos

con detalle cada diagrama resalta el hecho de que en cada uno de ellos, los puntos que

constituyen la nube se dispersan de manera diferente en cada ejemplo: en el primero, todos los

puntos caen sobre la línea recta; en el segundo, los puntos no caen en su totalidad sobre la línea

y se dispersan por arriba y por debajo de la misma, pero no están muy alejados de ella; en el

tercero, los puntos no caen sobre la línea y se dispersan de la misma en un mayor grado que en

los dos ejemplos anteriores. De esto podemos extraer como conclusión de que a menor

dispersión, mayor magnitud de la correlación. De los tres ejemplos se desprende que, la mayor

relación corresponde al primero (r=1.00), en segundo lugar está el ejemplo número dos (r =

0.91) y finalmente, el ejemplo número tres (r=0.56). Se ha introducido un elemento nuevo a

nuestra discusión: r, que se lee coeficiente de correlación y es el indicador matemático de la

cantidad de relación entre las variables. Más adelante, vamos a discutir ampliamente este

concepto.

Page 83: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

66

Los tres diagramas que están en la segunda línea de la Figura No.1 indican que, por la dirección

de la nube de puntos, o no hay relación (primer diagrama) o la relación es negativa (segundo y

tercer diagrama), lo cual se observa en los valores de r para cada uno de ellos: para el primero

r = 0 y los puntajes no se aproximan a una línea recta; en el segundo caso, la nube si se

aproxima a una línea recta pero a la inversa, además de que los mismos no caen exactamente

sobre la recta (r = - 0.66); y en el tercer caso, la nube se ajusta totalmente a una recta y el valor

de r = - 1.00.

El Diagrama de Dispersión es una herramienta que permite hacer una estimación cualitativa de

la relación entre dos variables. Esta relación se debe establecer cuantitativamente a través del

denominado coeficiente de correlación, el cual se representa por r. Los valores de r

presentados para cada uno de los seis ejemplos anteriores, no se calculan a través del diagrama

de dispersión; han sido presentados en los mismos con la intención de hacer más clara la

explicación de la importancia de dicha figura en el establecimiento de la relación entre dos

variables. El cálculo de r se presentará a continuación.

Si los incrementos en X van acompañados de incrementos en Y, se produce una correlación

positiva, lo cual se refleja en la dirección de la nube de puntos. Si al incrementarse X se observa

que Y tiende a disminuir, estamos ante una correlación negativa y esto se reflejará en la

dirección de la nube de puntos. Si no se observa en la nube de puntos, tendencia a aproximarse

a una línea recta, entonces estamos ante una evidente situación de ausencia de correlación.

Vamos a continuación a referirnos al coeficiente de correlación como indicador de la magnitud o

cantidad de relación que se presenta entre las variables involucradas.

Un coeficiente de correlación es una estimación matemática de la relación entre dos o más

variables. El valor del coeficiente de correlación estará comprendido entre + 1 y -1, pasando por

cero. El máximo valor que puede alcanzar un coeficiente de correlación positivo es +1; esto indica

que la relación es perfecta entre los valores de X y Y. Por lo tanto, decimos que estamos ante una

relación de este tipo, cuando la posición que ocupa el sujeto en la variable X es exactamente la

misma que ocupa en la variable Y. En el momento en que esta situación no se dé sistemáticamente,

el valor de r será menor a 1.00, y se aproximará a cero (0) a medida que las diferencias de posición

(rango) sean mayores.

Por otro lado, cuando el valor de r es igual a -1, estamos ante una correlación perfecta negativa y

corresponde al valor de r más alto con este signo. Esto nos indica que el sujeto más alto en X es el

más bajo en Y, el segundo sujeto más alto en X es, a su vez, el segundo sujeto más bajo en Y, y así

sucesivamente. Si esta relación inversamente proporcional no se cumple sistemáticamente, el valor

de r va a disminuir y se aproximará a cero en la medida que las diferencias de posición en ambas

variables sean mayores.

/ / /

r = -1.00 r = 0 r = 1.00

Page 84: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

67

La correlación se centra en dos aspectos de la relación: la dirección que puede ser positiva o

negativa, y el grado, fuerza o magnitud, que se refiere al valor cuantitativo de la relación. Cuando la

relación es perfecta (+1 ó -1), la predicción de una variable hacia la otra es exacta; cuando la

correlación es imperfecta (< 1 ó > -1), la predicción es aproximada y se debe establecer el margen

de error, siendo ésta la situación más común cuando se trabaja con muestras. Cuando no hay

correlación (r = 0), no se puede hacer predicción.

El coeficiente de correlación, que a partir de este momento representaremos por rxy se denomina

Coeficiente de Correlación de Pearson, y el mismo es aplicable al cálculo de relaciones lineales.

Para determinar el rxy, es necesario que ambas variables estén medidas en la misma escala y se

pueden utilizar dos métodos para calcular el mismo:

1. El método normalizado, en el cual se aproximan los datos a la curva normal, y cuya fórmula

es:

∑( )

2. El método de los puntajes originales, cuya fórmula es:

(∑ )(∑ )

√[∑ (∑ )

] [∑ (∑ )

]

A continuación se presenta el cálculo de rxy para los datos de la Tabla 8-1, utilizando ambos

métodos: el normalizado y el de datos originales. Con ambos métodos los resultados deben ser

iguales aunque, en la situación de laboratorios o talleres, puede suceder que se observen diferencias

de +/- 0.01; en estos casos, por la situación del redondeo, las diferencias pueden ser aceptadas.

TABLA 8-2:

Cálculo de rxy para las variables habilidad general y habilidad verbal (n = 10)

Sujetos H. General

X H. Verbal

Y Z de X Z de Y (ZxZy)

1 10 10 -1.51 -1.55 2,34

2 12 15 -1.35 -1.15 1,55

3 20 17 -0.72 -0.99 0.71

4 25 25 -0.32 -0.35 0.11

5 27 32 -0.17 0.22 -0.04

6 35 37 0.47 0.62 0.29

7 43 40 1.10 0.86 0.95

8 40 38 0.86 0.70 0.60

9 32 30 0.23 0.06 0.01

10 47 49 1.42 1.58 2.24

Page 85: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

68

La Tabla 8-2 presenta el resumen del procedimiento para calcular el coeficiente de correlación rxy

para dos variables, utilizando el procedimiento de los datos normalizados z. A continuación

presentamos los pasos requeridos. En primera instancia, organice los datos en una matriz o Tabla

que contenga las siguientes columnas: Sujetos, X, Y, Zx, Zy, ZxZy

1. Calcule la media y la desviación estándar tanto para la variable X como para la Y.

2. Transforme todos los valores X en puntuaciones Z (columna Zx) al igual que los valores Y

(columna Zy)

3. Multiplique cada valor de Zx por su correspondiente valor de Zy y coloque cada resultado en la

columna (ZxZy) y sume esta columna.

4. Sustituya en la fórmula los datos calculados en el ejemplo:

∑( )

0 0 0

El resultado obtenido de 0.97 indica, que entre las variables Habilidad General y Habilidad

Numérica se observa una relación positiva y alta. Esto implica que, en general, los sujetos con

puntuaciones altas en X, también obtuvieron puntuaciones alta en la variable Y; los que obtuvieron

puntuaciones medias en X, también las obtuvieron en Y, y de igual manera sucedió con los de

puntajes bajos.

El método de las puntuaciones originales es una forma alternativa para calcular el coeficiente de

correlación lineal de Pearson. Tal y como su nombre lo indica, se utilizan las puntuaciones

originales para calcular la rxy. A continuación se desarrolla el procedimiento, utilizando los datos de

la Tabla anterior

TABLA 8-3:

Cálculo de rxy para las variables habilidad general y habilidad verbal (n = 10)

Sujetos H. General

X H. Verbal

Y X2 Y2 XY

1 10 10 100 100 100

2 12 15 144 225 180

3 20 17 400 289 340

4 25 25 625 625 625

5 27 32 729 1024 864

6 35 37 1225 1369 1295

7 43 40 1849 1600 1720

8 40 38 1600 1444 1520

9 32 30 1024 900 960

10 47 49 2209 2401 2303

∑ 291 293 9905 9977 9907

Page 86: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

69

(∑ )(∑ )

√[∑ (∑ )

] [∑ (∑ )

]

0

( )( ) 0

√[ 0 0 ] [

0 ]

0 0

√[ 0 00 0][ 0]

0 0

√( 0)( ) 0

0

Los pasos a seguir para calcular rxy utilizando el método de las puntuaciones originales son los

siguientes:

1. Cree una tabla en la que deben aparecer las columnas de X y Y. Sume las puntuaciones de cada

columna.

2. Incorpore a la Tabla las columnas de X2 y Y

2; sume las puntuaciones de dichas columnas.

3. Incluya en la Tabla la columna de XY, o sea, que para cada sujeto se multiplica el puntaje X por

el puntaje Y; sume los puntajes de la misma.

4. Sustituya en la fórmula los datos obtenidos en la Tabla y obtendrá el coeficiente de correlación

para datos originales.

Los métodos analizados anteriormente están dirigidos a variables que han sido medidas por lo

menos en una escala de intervalos. Para estos casos, el Coeficiente de Correlación de Pearson, ya

sea en su forma normal (Z) o en la de puntuaciones originales, es el adecuado para establecer la

magnitud y el sentido de la relación entre las dos variables.

Sin embargo, hay ocasiones en las cuales las variables no satisfacen la condición de medición

intervalar, sino que ambas o una de ellas está medida en una escala ordinal. En estos casos, el

Coeficiente de Correlación de Rangos de Spearman (rho) es el método más eficiente para

determinar la relación entre estas variables; es una aplicación del coeficiente lineal de Pearson para

datos medidos en escala ordinal. Es importante destacar que los datos originales no necesariamente

deben estar medidos en escala ordinal, pero si el investigador considera que los daos no satisfacen

los requisitos exigidos para la aplicación del método de Pearson, puede transformarlos a una escala

ordinal y aplicar el coeficiente Rho. La fórmula para el cálculo de rho es la siguiente:

D: diferencia entre los rangos de ambas variables

n: número de pares de rangos (X y Y)

A continuación presentamos un ejemplo:

Page 87: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

70

TABLA 8-4:

Cálculo del coeficiente de correlación rho de Spearman para una muestra de 5 sujetos

Sujetos X Y R(X) R(y) D

(Rx-Ry)

D

(Rx-Ry)2

1 5 6 1 2 -1 1

2 6 9 2 5 -3 9

3 8 4 3 1 2 4

4 9 8 4 4 0 0

5 11 7 5 3 2 4

18

( )

0 0

El coeficiente rho del problema anterior es de 0.10, el cual es positivo y bajo, en vista de que se

aproxima a cero. Como se puede observar, la interpretación del Coeficiente rho es exactamente

igual a la de Pearson. Los pasos para calcular el Coeficiente rho son los siguientes:

1. Organice los datos X y Y en una matriz, tal y como se presenta en la Tabla 8-4:

2. Se crea la columna R(X), rangos de X, para la cual se asigna a cada puntaje X un rango de

menor a mayor. Para nuestro ejemplo X = 5 es el de menor valor, se le asigna el rango 1, a

continuación sigue el puntaje 6 al que corresponde el rango 2, y así sucesivamente.

3. Se crea la columna R(Y), rangos de Y, para la cual se asigna a cada puntaje Y un rango de

menor a mayor. Para nuestro ejemplo, Y = 4 es el de menor valor y se le asigna el rango 1,

luego sigue el puntaje 6 al que corresponde el rango 2, y así sucesivamente.

4. Se crea la columna D, que corresponde a la diferencia de cada par de rangos X y Y, tomando en

consideración los signos.

5. Se desarrolla la columna D2 que corresponde a elevar al cuadrado cada diferencia entre los

pares de rangos. Estas diferencias al cuadrado se suman.

6. Se desarrolla la fórmula correspondiente a Rho y se obtiene el coeficiente de correlación.

Hay ocasionas en que en una variable se repite el mismo valor varias veces. A esta situación se le

denomina ligas, y las mismas son resueltas promediando los rangos que se le hubieran adjudicado

originalmente. A continuación se presenta un ejemplo.

Page 88: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

71

TABLA 8-5:

Cálculo del coeficiente de correlación de spearman para una muestra de 10 sujetos (método de ligas)

( )

0 0

0 0 0

Como puede observarse, el coeficiente de correlación Rho es muy alto (0.99), casi perfecto y

positivo. En este ejemplo se observa cómo se tratan las ligas. En la variable X, el puntaje menor es

10 y se le asignó el rango 1, a continuación los siguientes puntajes son 12 y 12, como son iguales, al

primero se le asigna el rango 2 y al segundo el rango 3, se promedia la suma de estos dos rangos

que es 2.5, y se les asigna a los dos valores 12, el rango 2.5. Esto se repite en cada ocasión en que

aparezcan ligas. Las ligas pueden corresponder a 2, 3 ó más sujetos a quienes se les asigna el mismo

puntaje; en cada caso, se promedian los rangos que originalmente se les asignaría.

C O R R E L A C I Ó N M Ú L T I P L E

Hasta este momento, los análisis de correlaciones discutidos en esta obra se han referido a la

relación lineal entre dos variables. Sin embargo, se dan circunstancias en las cuales estamos

interesados en la relación que hay entre tres o más variables, o específicamente, en la relación de

una variable con una combinación lineal de otras variables. A este análisis de correlaciones se le

denomina correlación múltiple, la cual vamos a presentar en su forma más simple: la relación entre

una variable y la combinación lineal de otras dos variables.

Suponga que una muestra de estudiantes ha sido evaluada en tres factores psicoeducativos que se

consideran relacionados:

1. Factor 1: Rendimiento académico

2. Factor 2: Aptitud general

3. Factor 3: Aptitud verbal

Estamos interesados en analizar la relación que hay entre el rendimiento académico (F1) y los

efectos combinados de la aptitud general (F2) y la aptitud verbal (F3): F1 VS F2+F3. La regla

general (fórmula) para el cálculo de dicha relación es la siguiente:

Sujetos H. General

X H. Verbal

Y R(X) R(Y) D D2

1 10 10 1 1 0 0

2 12 15 2.5 2 0.5 0.25

3 12 17 2.5 3 -0.5 0.25

4 25 25 4 4.5 -0.5 0.25

5 27 25 5 4.5 0.5 0.25

6 35 37 7 7 0.0 0.00

7 40 40 8.5 9 -0.5 0.25

8 40 38 8.5 8 0.5 0.25

9 32 30 6 6 0.0 0.00

10 47 49 10 10 0.0 0.00

Page 89: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

72

( )

Los pasos para calcular r1.23 son los siguientes:

1. Calcule las relaciones simples entre las combinaciones de pares de variables r12, r13 y r23. Para

efecto de nuestro ejemplo, dichas correlaciones fueron las siguientes:

r12 = 0.52

r13 = 0.45

r23 = 0.60

2. Sustituya estos valores en la fórmula de correlación múltiple, tal y como se presenta a

continuación:

(0 ) (0 ) [( )(0 )(0 )(0 0)]

(0 0) 0 0

A partir de esta regla, se puede generalizar para cuatro o más variables, situaciones éstas que

escapan de los objetivos de este texto. Para analizarlas, recomendamos revisar la bibliografía que

acompaña esta obra.

C o m o I n t e r p r e t a r E l C o e f i c i e n t e D e C o r r e l a c i ó n .

La interpretación del coeficiente de correlación, debe hacerse cuidadosamente, atendiendo

principalmente a las características de las variables involucradas y al tipo de problema que se está

tratando de solucionar. Es evidente que a medida que r se aproxima a 1.00, la correlación se

considera más alta, siendo este valor el más extremo, tanto en el lado positivo como en el negativo

(-1.00). O sea, que la correlación tiende a aumentar tanto positiva como negativamente, a medida

que se aleja de 0 y se aproxima a sus valores extremos (+1.00 ó -1.00).

Sin embargo, hay ocasiones en que los coeficiente de correlación que son bajos se consideran lo

suficientemente saludables como para utilizarlos de manera efectiva. Por ejemplo, en la

construcción de pruebas es muy frecuente que los coeficientes de correlación no alcanzan valores

altos, y observamos en estos casos coeficientes efectivos desde 0.35 hasta 0.60, en el mejor de los

casos.

A pesar de los casos especiales citados anteriormente, algunos autores sugieren que para facilitar la

interpretación de los coeficientes de correlación, se tome en consideración la siguiente escala:

r…………….0.00 hasta 0.20……….correlaciones bajas

r…………….0.21 hasta 0.40……….correlaciones inferiores al término medio

r…………….0.41 hasta 0.60……….correlaciones promedio

r…………….0.61 hasta 0.80……….correlaciones superiores al término medio

r…………….0.81 hasta 1.00……….correlaciones altas

Esto se puede aplicar tanto en el caso de las correlaciones positivas, > 0, como en las negativas, - 0.

Sin embargo no olvide que el buen juicio del psicólogo investigador, es la principal herramienta

Page 90: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

73

para el análisis de los coeficientes de correlación, porque también se dan casos de coeficientes de

correlación relativamente altos, pero ineficaces.

R E G R E S I Ó N L I N E A L S I M P L E .

A través del estudio de la correlaciones se logró analizar la asociación que existe entre dos o más

variables. Se logró establecer que la magnitud de estas relaciones se podían determinar

cuantitativamente a través del coeficiente de correlación, además de establecerse el sentido de las

mismas: positivo, negativo o ausencia de correlación.

Pero, la relación de variables nos permite obtener información que va mas allá de lo anteriormente

señalado. También permite alcanzar uno de los objetivos más apreciados en la investigación del

comportamiento: la predicción.

Para comprender en qué forma el análisis de la asociación de variables nos permite hacer

predicciones, es necesario recordar algunos aspectos básicos de la teoría de la correlación.

Como se observó anteriormente, la primera aproximación al análisis estadístico de la correlación, es

el diagrama de dispersión. En el mismo, se analiza la nube de puntos generada por la combinación

de cada X con su respectiva Y, sobre un sistema de coordenadas rectangulares. Se explicó, además,

que la nube tomaba diferentes formas y que una de ellas, la que se aproxima a una línea recta, era de

gran importancia para el análisis de las correlaciones. En realidad, lo que sucede es que la nube de

puntos se puede aproximar a través de diferentes curvas entre las cuales tenemos: parábolas,

hipérbolas, etc, y la línea recta.

Haremos énfasis en los diagramas de dispersión cuya nube de puntos está aproximada por una línea

recta, dado que éste es el tipo de dispersión más común al estudiarse las relaciones de variables

psicológicas. Por lo tanto, vamos a considerar a la línea recta como la que mejor aproxima los datos

de la nube de puntos. A esta línea recta se le denomina Recta de Mínimos Cuadrados, en vista de

que tiene la propiedad de que la suma de las diferencias cuadráticas de los puntos del diagrama con

relación a su valor teórico sobre la curva, es mínimo. O sea: ∑D2 es mínimo, tal y como se presenta

en el siguiente gráfico:

Page 91: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

74

GRÁFICO 8-2

En el Gráfico 8-2 se presenta el diagrama de dispersión correspondiente a dos variables X y Y. Se

puede observar con claridad que los puntos oscuros corresponden a los pares ordenados (XY), los

cuales generan una nube de puntos. Adicionalmente se presenta un conjunto de puntos más claros,

ordenados de tal manera que, si los uniera, generarían una línea recta; esta es la recta de mínimos

cuadrados porque las distancias entre cada punto del diagrama y su correspondiente valor en la

recta, al elevarse al cuadrado y sumarse, darían el valor más pequeño que se podría alcanzar.

La figura incluye otra línea recta, de color oscuro que también cruza el diagrama pero en otro

sentido. En este caso, que no corresponde a la recta de mínimos cuadrados, la ∑D2 no sería la

mínima, como si lo es para el otro caso (línea clara).

La recta de mínimos cuadrados se construye a partir de la siguiente ecuación:

( )

La cual corresponde a la ecuación de la línea recta. Esta ecuación se utiliza para pronosticar Y a

partir de un valor conocido de X. En dicha ecuación se identifican dos constantes:

a0 : corresponde a la intersección de la recta de regresión con el eje Y.

a1: corresponde a la pendiente (inclinación) de la recta de regresión.

X : corresponde al valor de X para el cual se va a pronosticar el valor de Y.

Las constantes se calculan a través de las siguientes fórmulas:

(∑ )(∑ ) (∑ )(∑ )

∑ (∑ )

(∑ ) (∑ )(∑ )

∑ (∑ )

En los casos en que se requiera estimar X a partir de Y, las ecuaciones serían las siguientes:

Page 92: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

75

( )

Para la cual:

(∑ )(∑ ) (∑ )(∑ )

∑ (∑ )

(∑ ) (∑ )(∑ )

∑ (∑ )

E r r o r T í p i c o D e L a E s t i m a c i ó n

La recta de regresión representa el centro de gravedad de la nube de puntos, siendo evidente que

alrededor de la misma se dispersan los puntos del diagrama. En tales circunstancias, se puede

calcular una medida de la dispersión de los valores a través de las siguientes expresiones:

| √∑( )

Que se denomina error típico de la estima de Y a partir de X.

En los casos que se refieren a la recta de regresión de X a partir de Y, el error típico de la

estimación viene dado por la expresión:

| √∑( )

A partir del error típico de la estimación, se puede estimar (pronosticar), para cualquiera de los

valores X, su correspondiente valor esperado Y, al igual que para cualquier valor de Y, se puede

estimar su correspondiente valor esperado X. A continuación presentamos un ejemplo de

estimación estadística.

TABLA 8-6

Sujetos H. General

X H. Verbal

Y X2 Y2 XY

1 10 10 100 100 100 2 12 15 144 225 180 3 20 17 400 289 340 4 25 25 625 625 625 5 27 32 729 1024 864 6 35 37 1225 1369 1295 7 43 40 1849 1600 1720 8 40 38 1600 1444 1520 9 32 30 1024 900 960

10 47 49 2209 2401 2303

∑ 291 293 9905 9977 9907

Page 93: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

76

Ya se demostró que entre ambas variables existe una correlación importante:

r = 0.98. Por lo tanto es factible desarrollar un modelo de estimación estadística que permita el

pronóstico de Y a partir de X o viceversa.

En primera instancia se calculan las dos constantes que requiere el modelo:

( )( 0 ) ( )( 0 )

( 0)( 0 ) ( )

0( 0 ) ( )( )

0( 0 ) ( ) 0

0

Una vez determinadas las constantes de regresión, se desarrolla la ecuación de mínimos cuadrados,

tal y como se presenta a continuación:

( ) : ecuación de mínimos cuadrados

0 ( )

Cada valor de X obtenido por el sujeto se sustituye en la ecuación, obteniéndose el valor Y

estimado o pronosticado para cada persona que, perteneciendo a la misma población, obtenga dicho

valor X. A continuación se presenta la Tabla resumen correspondiente a los datos analizados.

TABLA 8-7

Sujetos H. General

X H. Verbal

Y Y’ (Y-Y’)2

1 10 10 10.94 0.88

2 12 15 12.86 4.58

3 20 17 20.54 12.53

4 25 25 25.34 0.12

5 27 32 27.26 22.47

6 35 37 34.94 4.24

7 43 40 42.62 6.86

8 40 38 39.74 3.03

9 32 30 32.06 4.24

10 47 49 46.46 6.45

65.40

Como se puede observar, para cada valor de X se estimó un posible valor de Y, el cual corresponde

al punto en que cae dicha estimación sobre la recta de regresión; en el fondo, la recta de regresión es

el conjunto de todos los valores estimados para cada uno de los valores de X. Además, la Y

estimada es el promedio de todos los posibles valores esperados para cada una de las X. Esto

significa que para cada valor de X, la Y estimada sería el pronóstico promedio, aunque algunos

valores de Y estarán por encima y otros por debajo de dicha estimación.

Page 94: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

77

Tal y como señalamos anteriormente, de todas las estimaciones de Y se puede determinar una

desviación estándar de las mismas, la que se denomina error típico de la estimación. Los datos

requeridos para este cálculo están descritos en la última columna de la Tabla anterior (Y – Y’)2 y

con los mismos resolvemos la ecuación del error típico:

| √ 0

0

Esto significa que, en promedio, las Y estimadas varían en 2.56 unidades, información que favorece

el análisis de la estimación a la luz de la Distribución Normal, siempre y cuando los datos se ajusten

a dicha distribución. Este mismo procedimiento se puede desarrollar para estimar X a partir de Y,

siempre y cuando se utilice la ecuación de estimación correspondiente.

C O N C E P T O S I M P O R T A N T E S

Relación lineal

Correlación simple

Correlación múltiple

Predicción

Relación causa-efecto

Confiabilidad

Diagrama de dispersión

Nube de Puntos

Ecuación de mínimos cuadrados

Regresión lineal simple

Constantes de regresión

Error típico de estimación

Y estimada

X estimada

Page 95: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

78

E J E R C I C I O S P R Á C T I C O S

P r o b l e m a 1

Un investigador del comportamiento seleccionó una muestra aleatoria de 20 estudiantes de primer

ingreso a la Universidad y obtuvo las puntuaciones en las pruebas de Conocimientos Generales (X)

y de Comprensión Verbal (Y). A continuación, se presentan los puntajes:

E 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

X 52 49 26 28 63 44 70 32 49 51 64 28 49 43 30 65 35 60 49 66

Y 49 49 17 34 52 41 45 32 29 49 53 17 40 41 15 50 28 55 37 50

A partir de los datos anteriores determine:

1. Las medias de X y de Y.

2. Las desviaciones estándar de X y de Y

3. Confeccione el Diagrama de Dispersión correspondiente

4. Calcule el coeficiente de correlación Producto Momento de Pearson (rxy) a partir del:

Método de puntuaciones estandarizadas; analice y discuta el resultado

Método de puntuaciones originales: analice y discuta el resultado

5. Calcule el coeficiente de determinación r2 para ambos casos. Analice y discuta los resultados.

6. Calcule los valores de las constantes a0 y a1 y presente la ecuación de regresión (predicción) de

Y a partir de X.

7. Escoja cinco pares de valores de la tabla de datos originales y construya la recta de regresión

sobre el diagrama de dispersión. Analice y discuta los resultados.

8. Calcule el error estándar de la estimación de Y a partir de X.

9. Desarrolle los pasos 6, 7 y 8, para la estimación de X a partir de Y.

10. Con los datos de la Tabla, determine el Coeficiente de Correlación por Rangos (Rho). Analice y

discuta los mismos; compare los resultados con los obtenidos por el método de Producto

Momento de Pearson.

11. Suponga que está interesado(a) en determinar la correlación entre el rendimiento académico (1)

y las variables aptitud verbal (2) y razonamiento lógico (3). Las intercorrelaciones obtenidas

entre estas tres variables fueron: r12 = 0.64, r13 = 0.50 y r23 = 0.41. Calcule el coeficiente de

correlación múltiple entre el rendimiento académico y las variables aptitud verbal y

razonamiento lógico. Analice y discuta los resultados.

Page 96: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

79

CAPÍTULO 9

ESTADÍSTICA INFERENCIAL Y PROBABILIDADES

Ya hemos analizado los principios de la estadística descriptiva, los cuales hacen énfasis en la

organización, presentación y descripción de los datos obtenidos en las investigaciones

comportamentales, de una manera, objetiva, coherente y eficiente. Para tal efecto, se discutieron

conceptos tales como: organización de datos, medidas de tendencia central y variabilidad, la curva

normal y los principios de la correlación y regresión simple.

La estadística inferencial se preocupa, principalmente, por analizar cuantitativamente los datos

provenientes de las muestras y demostrar cuán cerca o alejados están estos datos de los que se

hubieran obtenido, si los mismos hubieran sido obtenidos de la totalidad de la población. Por lo

tanto, es evidente que la estadística inferencial se desarrolla a través de muestras, que son sectores

de la población, y no de la información proveniente de la totalidad de la misma. A continuación

presentamos un diagrama que explica la relación entre población y la muestra.

FIGURA 9—1

Como se puede observar en la Figura 9—1, la muestra es un segmento de la población, una parte de

la población que ha sido segregada de la misma con fines de investigación. Al trabajar con

segmentos de la población, es evidente que algunas características de ésta no estarán presentes en la

muestra, porque los tamaños muestrales son muy inferiores a los poblacionales: n < N. Esta

situación trae como consecuencia, que entre la información proveniente de la muestra y la existente

en la población real, se produzcan diferencias a la cuales denominaremos errores de muestreo.

Población Muestra

Muestra no

aleatoria

Muestra

aleatoria

Probabilidad

Error

Generalización

Muestras aleatorias

Igual oportunidad de ser seleccionadas

Margen de error conocido

Tamaño muestral específico

Inferencia estadística: Generalizar los datos estadísticos

muestrales a los parámetros poblacionales.

Page 97: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

80

En realidad la estadística inferencial está constituida por dos aspectos:

(1) la estimación de parámetros, que se refiere a establecer con la mayor precisión posible,

cuáles son los valores correspondientes a los principales indicadores o parámetros que hay en la

población y que están siendo utilizados en las investigaciones muestrales. Como debe recordar,

esto se realiza a partir de la información de la muestra y no de la población, y (2) el desarrollo de

la prueba de hipótesis, en el cual el investigador intenta demostrar si las hipótesis que han

presentado sobre diversos aspectos comportamentales que él espera que se estén manifestando

en la población, se pueden o no demostrar a través del análisis de las muestras.

Otro aspecto relevante que se observa en al diagrama antes mencionado lo son las dos categorías de

muestreo que pueden ser utilizadas en una investigación: el muestreo aleatorio, por un lado, que

permite seleccionar los sujetos de la población a partir de la condición de que todos tengan igual

probabilidad de ser seleccionados al momento de constituirse la muestra. Es evidente que, para

efectos de representar a la población, este tipo de muestreo es el más indicado. Por otro lado, está el

muestreo no aleatorio, en el cual no hay garantías de que todos los sujetos de la población hayan

tenido la misma probabilidad de ser seleccionados al momento de constituir la muestra, y por lo

tanto, sus resultados son dudosos en cuanto a representar a la población.

En ambos casos de muestreo se cometen errores. La diferencia estriba en que en el muestreo

aleatorio, el error puede ser determinado de antemano por el investigador, al igual que la

probabilidad de cometer el mismo; mientras que en el muestreo no aleatorio, el investigador no

cuenta con información objetiva sobre el margen de error y la probabilidad asociada con él.

Se considera que el muestreo aleatorizado es más eficiente para generalizar sus resultados hacia la

población por las siguientes razones:

se determina el margen de error,

se determina la probabilidad de este margen de error,

y además, a partir de la información anteriormente señalada, se puede establecer el tamaño

muestral (n) mínimo requerido para que estos dos primeros aspectos se cumplan.

T E O R Í A D E L A P R O B A B I L I D A D ( T P )

La explicación teórica sobre la relación matemática entre las observaciones poblacionales y las

muestrales la ofrece la Teoría de la Probabilidad. Sería ostentoso concebir que en este libro se

pueda hacer una presentación efectiva de dicha teoría; tampoco es uno de los objetivos que se tratan

de alcanzar con esta obra. Sin embargo, es necesario plantear algunos principios de la probabilidad,

que permitirán un mayor nivel de comprensión de los aspectos básicos de la inferencia estadística.

En la TP, hay algunos conceptos que deben ser comprendidos con claridad, especialmente por los

que no somos especialistas en las matemáticas, con el fin de que los mismos puedan ser utilizados

Page 98: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

81

de la manera más correcta al momento de aplicar la TP. A continuación, detallaremos los más

importantes y los más utilizados en la investigación del comportamiento.

E l E x p e r i m e n t o A l e a t o r i o

Siempre que se desarrolle una investigación, y que el método (actos o pruebas) para obtener los

resultados se desarrolle en las mismas condiciones, estamos ante un experimento aleatorio. Por

ejemplo, en el juego de la lotería oficial nacional, siempre se repite el mismo acto: las bolas

numeradas están en una urna que se hace girar para que las mismas se revuelvan y así se evite

cualquier picardía. Se detiene la urna, se abre, un niño selecciona una de las bolas, se la pasa a la

autoridad, ésta la abre y dentro de la misma se encuentra un número entre el 0 y el 9. Este acto se

repite tantas veces como sea necesario, sin que se observen cambios de ninguna clase en la

metodología. Por esta razón, la lotería es un experimento aleatorio, en vista de que en cada acto,

cualquier número entre 0 y 9, tiene la misma probabilidad de aparecer.

Veamos ahora, una actividad que no se refiere a un juego de azar, sino a una medición educativa. El

profesor confecciona un examen de 30 preguntas, todas de selección múltiple con cuatro

alternativas, con las mismas instrucciones, con el mismo procedimiento para responder a las

preguntas y para corregirlas. Esta metodología será la misma para todos los estudiantes que reciban

la prueba, al igual que la metodología que se exigió para extraer una bola de la urna de la lotería.

Como la prueba tiene cuatro alternativas, todos los estudiantes tienen la misma probabilidad de

escoger cualquiera de las cuatro alternativas, y si el examen vale 30 puntos, y los puntajes finales

pueden ser entre 0 y 30, todos los estudiantes tendrán la misma probabilidad de obtener cualquiera

de estos puntajes totales al corregirse su examen. Esto significa que la medición educativa se regula

por las mismas reglas que regulan el juego de azar de la lotería; por lo tanto, para la ciencia, la

medición científica también es un experimento aleatorio.

Cada acto que se desarrolla en un experimento aleatorio genera un resultado que se denomina punto

muestral. En el examen que pusimos de ejemplo, si un estudiante gana 6 puntos, esto es un punto

muestral, al igual que lo es los 30 puntos que gana el que obtuvo todas las respuestas correctas. Bajo

esta perspectiva, un experimento aleatorio genera un espacio muestral (S), que no es otra cosa, que

todos los posibles resultados que se pueden obtener al desarrollar el experimento. Veamos a

continuación algunos ejemplos de espacios muestrales:

Lanzamiento de una moneda: S: (C, S), 2 puntos muestrales.

Lanzamiento de un dado común: S (1, 2, 3, 4, 5 ó 6), 6 puntos muestrales

Page 99: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

82

Lanzamiento de un dado y una moneda juntos: S(12 puntos muestrales)

Dado

1 2 3 4 5 6

Cara C1 C2 C3 C4 C5 C6

Sello S1 S2 S3 S4 S5 S6

Los resultados de un examen como el del ejemplo de los 30 reactivos: S (31 puntos muestrales,

porque se incluye el cero (0)

Éxito: 1 punto

Fracaso: 0 puntos

Resultados exitosos: espacio muestral, desde 0 hasta 30.

Los resultados de la Lotería Nacional

El juego de la lotería es un buen ejemplo de lo que son los juegos de azar. Los controles

metodológicos que se aplican en el mismo, han dado suficiente confianza a la

población como para asegurar que en el mismo no hay picardía, aunque muchas

personas digan lo contrario. Este juego se caracteriza porque se cumple la condición

de que todas las bolas tienen la misma probabilidad de ser seleccionadas, y el

espacio muestral que se genera es el siguiente S: (0, 1, 2, 3, 4, 5, 6, 7, 8 y 9). Los

eventos del S se combinan de acuerdo con el tipo de jugada que el cliente haya

comprado: chances o billetes, y a medida que el juego se desarrolla (experimento

aleatorio), siempre hay la certeza de que su número está en la urna y que tiene la

misma probabilidad de ocurrencia que cualquier otro número.

Es evidente que el proceso de selección aleatoria es muy importante para el estudio de las

inferencias estadísticas, en vista de que a través del mismo se cumple el requisito estadístico de que

cada evento posible de un espacio muestral, debe tener la misma probabilidad de ser seleccionado.

En un experimento aleatorio, la selección de una unidad del total se denomina acto o prueba. Cada

acto o prueba produce un resultado que debe corresponder a algunos de los posibles eventos del

espacio muestral (S). En el espacio muestral (S), los posibles resultados o eventos se denominan

puntos muestrales.

Page 100: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

83

P r o b a b i l i d a d

Por lo general, la probabilidad de un evento P(x), se define como el cociente entre el número de

veces que se da un evento en el espacio muestral y la totalidad de posibles eventos del espacio

muestral; o, el número de veces que se da un evento entre el número de pruebas en un experimento

o investigación. Como se puede observar, se han presentado dos definiciones de probabilidad,

aunque ambas comparten el concepto de que la probabilidad es un cociente y se presenta como un

valor que tiene un rango entre 0.00 hasta 1.00, siendo el primero ausencia total de probabilidad y el

último probabilidad máxima de un evento. Sin embargo, para efectos descriptivos, la probabilidad

se puede expresar en porcentajes: P(A) = 0.60, es equivalente al 60%. Para aclarar esta situación, es

necesario estudiar la probabilidad desde el punto de vista de dos teorías o escuelas, que pasaremos a

discutir a continuación.

1. Escuela Clásica de la Probabil idad:

También se conoce como la Escuela a Priori, en vista de que las probabilidades pueden ser

determinadas por la razón. Esto es factible en vista de que los espacios muestrales son conocidos

antes de desarrollarse los experimentos, tal y como sucede con algunos juegos de azar tales

como: las barajas, los dados, la lotería, etc. La regla básica (fórmula) para el cálculo de las

probabilidades en estos casos es:

( ) ( )

( )

m(A): número de eventos clasificables como A en el espacio muestral.

n(S): número total de eventos posibles en el espacio muestral (S).

Ejemplos:

Se lanza un dado. Cuál es la probabilidad de que resulte el número 1?

( )

0

Se extrae una carta de un paquete de 52. ¿Cuál es la probabilidad de que sea el

No.8?

( )

0 0

2. Escuela Empírica o Aposteriori :

En este caso del cálculo de las probabilidades, se requiere de la recolección previa de la data; o

sea, se requiere de una muestra sobre la cual se hace una medición; no se conoce previamente y

con exactitud, el espacio muestral del experimento. La regla básica (fórmula) para el cálculo de

probabilidades es la siguiente:

Page 101: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

84

( ) ( )

( )

m(a): número de veces que ocurre A en la experimentación.

n(S): número de pruebas en el experimento

Ejemplos:

En una muestra de 250 sujetos, 130 son estudiantes sin educación secundaria.

¿Cuál es la probabilidad de seleccionar a un estudiante sin educación

secundaria?

( ) 0

0 0

Mientras mayor sea el número de pruebas que se desarrollen en el experimento, mejor será la

aproximación de la probabilidad a su valor teórico. Esto es muy importante porque indica que,

mientras más sujetos de una población se seleccionen, las probabilidades obtenidas de dicha

muestra estarán más próximas a las probabilidades reales de dichos eventos en la población.

A x i o m a s D e P r o b a b i l i d a d

La probabilidad está condicionada por una serie de axiomas que favorecen el desarrollo de los

modelos y procedimientos requeridos para el cálculo de la misma.

A continuación se presentan los tres axiomas básicos asociados con el cálculo de las probabilidades.

1. Axioma de la posit ividad:

Este axioma señala que la probabilidad de un evento no puede ser negativa; la probabilidad es

igual a cero (0) o mayor que cero (0). P(A) ≥ 0.

2. Axioma de la cert idumbre:

La probabilidad de todo el espacio muestral es igual a 1: P(S) = 1

De los axiomas 1 y 2 podemos deducir que: 0 ≤ P(E) ≤ 1.

3. Axioma de las uniones:

Este axioma se aplica especialmente en el caso de los eventos compuestos. Los eventos

compuestos son aquellos que están constituidos por eventos simples:

P(EC) = p(e1) + P(e2)+…+P(ek).

Por ejemplo: ¿Cuál es la probabilidad de un número par al lanzar un dado? Un número par en un

dado serían: 2, 4 y 6; cada uno de ellos tiene en el espacio muestral una

. Aplicando la

regla: ( ) ( ) ( ) ( )

0 0

Page 102: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

85

A S P E C T O S B Á S I C O S E N E L C Á L C U L O D E P R O B A B I L I D A D E S

1. Un evento que tiene una P(X) = 1, es seguro que ocurrirá en cada una de las pruebas que se

registren en el experimento. Un evento con P(X) = 0, es seguro que no ocurrirá en ninguno de

los actos del experimento.

2. La probabilidad de un evento, P(E), se expresa como una fracción, en vista de que los límites de

sus posibles valores están entre 0 y 1. Se acostumbra expresar la probabilidad como un valor

decimal: 0.55, 0.83, 0.19, etc.

3. Las probabilidades también pueden expresarse en base a 100, o sea, porcentajes, como por

ejemplo: P = 0.05 se puede expresar descriptivamente como 5%; P= 0.28, es semejante a 28%,

y así sucesivamente.

4. Las probabilidades pueden expresarse a favor o en contra de un evento, tal y como se explica a

continuación:

La P de que suceda un evento es de 3 a 1 (3/4), o sea, que tiene una

P = 0.75.

También se puede expresar en contra: la P de que el evento anterior no suceda

es de 1 a 3 (1/4), o sea, que tiene una probabilidad P= 0.25.

El cálculo de probabilidades puede ser muy complejo. Para efectos de este curso, tomaremos en

consideración algunas reglas básicas aplicadas a eventos particulares, que se consideran

fundamentales para el cálculo de probabilidades en las investigaciones comportamentales.

1. Eventos Mutuamente Excluyentes:

Dos eventos se definen como mutuamente excluyentes, si no pueden suceder al unísono o en

un solo acto. También se conocen como eventos simples. Por ejemplo:

1. Se lanza una moneda una sola vez; o sale cara o sale sello, pero no ambas en el mismo acto.

2. Se extrae una carta de un mazo de 52 cartas, o es roja o es negra, pero no puede ser ambas en un

solo acto.

3. Se desarrolla un reactivo de selección múltiple con cuatro alternativas de las cuales una es la

correcta y las otras tres restantes, son incorrectas. En este caso, el reactivo se tiene como bueno

o como malo, pero no ambos en una sola respuesta.

La regla para calcular probabilidades para eventos mutuamente excluyentes es la siguiente:

Page 103: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

86

( ) ( ) ( )

Por ejemplo:

Al seleccionar una carta (baraja), ¿cuál es la probabilidad de que sea un As o

una K?

( ) ( ) ( )

0

Al seleccionar una carta (baraja) de un paquete, ¿cuál es la probabilidad de que

sea un corazón o un trébol?

( ) ( ) ( )

0 0

2. Eventos Solapados:

Dos eventos son solapados o también se conocen como unidos, si tienen puntos muestrales en

común. La regla o fórmula para el cálculo de estas probabilidades es:

( ) ( ) ( ) ( )

Como se puede observar en la fórmula, se determina la probabilidad de A y B como si fueran

mutuamente excluyentes, pero se les resta el área compartida por ambos eventos.

Ejemplo:

Se selecciona una baraja, ¿cuál es la probabilidad de que sea una K o un trébol?

En el paquete de barajas existe una carta que es K y es trébol al unísono, por lo

tanto, se refiere al caso de dos eventos solapados.

B

Page 104: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

87

( ) ( ) ( ) ( )

0

Se lanza una moneda y un dado juntos. Sea A, el evento sello en la moneda y

B, el evento 3 ó 4 en el dado. ¿Cuál es la probabilidad de que A o B aparezcan?

( )

0

3. Eventos Independientes :

Dos eventos son unidos o compuestos, si aparecen al unísono o en consecuencia. De acuerdo a

lo anteriormente señalado, los eventos unidos o compuestos son independientes, si el resultado

de uno no afecta la probabilidad de ocurrencia del otro. La regla o fórmula para el cálculo de las

probabilidades de estos eventos es:

( ) ( ) ( )

Ejemplo:

Se lanzan al unísono dos dados. ¿Cuál es la probabilidad de que el dado B ≥ 5 y

el dado A ≤ 4?

( ) ( ) ( ) (

) (

)

0

Observación:

B ≥ 5 = 5 y 6 (dos eventos de posibles seis en el dado B)

A ≤ 4 = 4, 3, 2, 1 (cuatro eventos de posibles seis en el dado A)

4. Eventos dependientes:

Los eventos dependientes también están referidos a eventos compuestos, o sea, que pueden

suceder al unísono o en consecuencia. En este caso, dos eventos son dependientes, si la

ocurrencia de uno, afecta la probabilidad de ocurrencia del otro. La regla o fórmula para el

cálculo de sus probabilidades es:

( ) ( ) ( ) ⁄

Si A ya sucedió, cuál es la probabilidad de que suceda B, si la aparición de A afecta la

probabilidad de aparición de B.

Ejemplo:

DADO

1 2 3 4 5 6

Cara X X X X X X

Sello X X X X X X

Page 105: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

88

¿Cuál es la probabilidad de extraer dos cartas rojas de un paquete, sin

reemplazamiento? En la primera extracción hay 26 cartas rojas en el paquete

(26/52); pero en la segunda extracción, como no ha habido sustitución, ya no

quedan 26 rojas sino únicamente 25, o sea, 25/51. Por lo tanto si aplicamos la

fórmula el resultado sería:

( ) ( ) ( ) ( ) (

) (

) (0 0)(0 ) 0

5. Eventos Complementarios:

Dos eventos son complementarios, E1 y E2, si el segundo de ellos contiene todos los elementos

del espacio muestral que no están en el primero. La suma de las probabilidades de los eventos

complementarios debe ser igual a 1. La regla para el cálculo de estas probabilidades es:

( ) ( ) ( ) ( )

Ejemplo:

Se tienen 500 bolas rojas y blancas en una urna. Si 300 son rojas, ¿cuál es la

probabilidad de extraer una bola blanca?

( ) ( ) 00

00 0 0 0 0

6. Eventos Condicionados:

Los eventos condicionados son aquellos que se manifiestan como un sub conjunto del espacio

muestral. Por ejemplo: en un mazo de 52 cartas, los eventos que son iguales o mayores que 10:

10, J, Q y K, se consideran un sub conjunto dentro del espacio muestral de las 52 cartas. Si

estuviera interesado en saber cuál es la probabilidad de un evento, dentro de este sub conjunto de

eventos, tendría que aplicar la regla correspondiente:

( | ) ( )

( ) ( ) ( )

Que se lee: ¿cuál es la probabilidad de que ocurra A, habiendo ocurrido B?

Para efectos del desarrollo de este evento, desarrollemos el siguiente problema:

Se lanza una moneda y un dado juntos. Si la moneda cae cara, ¿cuál es la

probabilidad de que el dado resulte par?

ESPACIO MUESTRAL

Dado

1 2 3 4 5 6

Cara C1 C2 C3 C4 C5 C6

Sello S1 S2 S3 S4 S5 S6

Page 106: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

89

1. Únicamente se toman en consideración los eventos correspondientes a cara. Estos son C1, C2,

C3, C4, C5, C6

2. En los eventos Cara, se dan tres eventos pares: C2, C4 y C6, los cuales corresponden al 50% de

los eventos asociados con cara (en negrita)

3. En tal caso, la P pedida en el problema es igual a 3/6 = 0.50.

4. Este procedimiento es válido cuando usted conoce todo el espacio muestral.

Hay ocasiones en que el cálculo de la probabilidad condicional no se puede desarrollar

directamente por la observación del espacio muestral En tales casos, se utiliza la regla o fórmula

anteriormente presentada, bajo la condición de que, al momento de reemplazar en la misma, se

debe considerar todos los eventos del espacio muestral. A continuación presentamos el

procedimiento correspondiente.

( | ) ( )

( ) ⁄

⁄ (

) (

) 0 0

Observación: Las probabilidades dentro de los sub conjuntos, son mayores que las

probabilidades dentro de todo el espacio muestral.

El conocimiento exhaustivo de la Teoría de la Probabilidad, es una garantía en cuanto a la

comprensión e interpretación correcta de la estadística inferencial. A pesar de que en este capítulo,

el enfoque de la probabilidad no ha sido profundo, consideramos que los conceptos emitidos serán

de gran ayuda para la interpretación correcta de los capítulos que a continuación se presentarán,

relacionados con la inferencia estadística.

C O N C E P T O S I M P O R T A N T E S

Estimación de parámetros

Teoría de la probabilidad

Experimento aleatorio

Espacio muestral

Eventos

Acto o Prueba

Eventos mutuamente excluyentes

Eventos solapados

Eventos independientes

Eventos dependientes

Eventos complementarios

Eventos condicionados

Page 107: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

90

E J E R C I C I O S P R Á C T I C O S

1. Determine la probabilidad de los siguientes eventos:

Al lanzar un dado el resultado sea un número impar

Un 10, un 9 de trébol o el 5 de diamantes, en la extracción de una baraja.

Al lanzar dos dados, la suma de las caras sea mayor que 9

2. Una caja contiene 6 bolas rojas, 4 blancas y 5 azules. Hallar la probabilidad de que la bola

extraída sea:

Roja

Blanca

Azul

No roja

Roja o blanca

3. Un dado se lanza dos veces. Hallar la probabilidad de obtener 4, 5 ó 6 en la primera tirada y 1,

2, 3 ó 4 en la segunda.

4. Se sacan sucesivamente tres bolas de la caja del problema 2. Hallar la probabilidad de que

salgan en el orden roja, blanca y azul, si cada bola: (a) se repone y (b) si no se repone.

5. Hallar la probabilidad de que salga al menos un 4 en dos tiradas de un dado.

6. Una bolsa contiene 4 bolas blancas y 2 bolas negras; otra contiene 3 bolas blancas y 5 bolas

negras. Si se saca una bola de cada bolsa, hallar la probabilidad de que: (a) ambas sean blancas,

(b) ambas sean negras y (c) una sea blanca y la otra negra.

7. A y B juegan 12 partidas de ajedrez .A gana 6, B gana 4 y en 2 hacen tablas (empate).Juegan un

nuevo torneo de 3 partidas. Hallar la probabilidad de que: (a) A gane las 3, (b) hagan tablas en

2, (c) A y B ganen alternadamente y (d) B gane al menos una partida.

8. Se lanza un par de dados corrientes. Hallar la probabilidad de que la suma de sus números sea

10 o mayor si:

Aparece un 5 en el primer dado

Aparece un 5 en uno de los dos dados por lo menos

9. Se lanzan tres monedas corrientes. Hallar la probabilidad de que todas sean caras si:

La primera de las monedas es cara

Una de las monedas es cara

10. Una clase tiene 12 niños y 4 niñas. Se escogen tres estudiantes de la clase al azar, ¿cuál es la

probabilidad de que todos sean niños?

11. Una urna contiene 7 bolas rojas y 3 bolas blancas. Se sacan 3 bolas de la urna una tras otra.

Hallar la probabilidad de que las dos primeras sean rojas y la tercera blanca.

12. Una urna contiene 3 bolas blancas y 7 negras; se extraen dos bolas sin reemplazamiento. ¿Cuál

es la probabilidad de los siguientes eventos?

Blanca y blanca

Blanca y negra

Negra y blanca

Negra y negra

13. ¿Al extraer una carta de un mazo de 52, ¿cuál es la probabilidad de que el resultado sea una

carta entre 3 y 13 inclusive?

14. Al seleccionar una carta de un paquete de 52, ¿cuál es la probabilidad de obtener una carta igual

o menor que 6 o un 3?

Page 108: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

91

15. Se lanzan dos dados. ¿Cuál es la probabilidad de que uno resulte impar, si el otro muestra un 6?

16. En una universidad hay 200 estudiantes distribuidos de la siguiente forma: bachilleres en

ciencias, letras y humanidades, hombres y mujeres. Atendiendo a estas condiciones se sabe que:

20 son bachilleres en ciencias y hombres

88 son mujeres y bachilleres en letras

87 son hombres

140 son bachilleres en letras

30 son bachilleres en ciencias

Construya el espacio muestral de todos los eventos.

A partir del espacio muestral determine:

La “p” de seleccionar un bachiller en ciencias

La “p” de seleccionar un bachiller en ciencias hombre

La “p” de seleccionar una mujer

L “p” de seleccionar un bachiller en letras si fue hombre

La “p” de no seleccionar una mujer

La “p” de seleccionar un hombre de ciencias o una mujer de letras

La probabilidad de seleccionar una mujer de letras, si fue mujer

La “p” de seleccionar un hombre de letras y una mujer de

Humanidades.

17. En un vuelo de cierta línea aérea viajan 18 muchachos, 178 adultos hombres, 10 mexicanos del

sexo masculino, dos muchachos mexicanos, 26 personas de nacionalidad mexicana y 14

muchachas extranjeras, sin contar la tripulación. Desarrolle el espacio muestral correspondiente,

y calcule sus probabilidades.

Page 109: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

92

CAPÍTULO 10

DE LA POBLACIÓN A LA MUESTRA

El objetivo principal de un investigador del comportamiento es el de describir, analizar,

diagnosticar y pronosticar el comportamiento de una variable en una población determinada. Esta

meta se alcanza, por lo general, seleccionando una muestra de la población, midiendo la variable de

interés en la misma y aplicando procesos y modelos estadísticos que permitan llegar a una decisión

final con relación a la variable en estudio y su comportamiento en la muestra y en la población. Es

evidente que el trabajar con una muestra es más económico que hacerlo con toda la población, pero

para alcanzar tal objetivo, se deben satisfacer ciertos requerimientos estadísticos, que pasaremos a

discutir a continuación.

¿ Q u é e s u n a v a r i a b l e a l e a t o r i a ?

Una variable aleatoria es aquella que se genera tras un proceso de selección aleatoria. Si recordamos

los temas anteriormente discutidos, para que un experimento sea aleatorio, todos los miembros de la

población deben tener la misma probabilidad de ser seleccionados. Si la variable que se estudia en

la población puede asumir X posibles valores, entonces los sujetos seleccionados aleatoriamente

pueden asumir cualquiera de estos X valores, y si además, cada uno de estos valores tiene una

probabilidad en la población, entonces una definición más acertada de variable aleatoria sería:

aquella que puede tomar cualquier valor de un número total de valores, teniendo cada uno de ellos

una probabilidad asignada. Veamos los siguientes ejemplos:

1. Se lanzan un dado, identifique los posibles valores (Xi) que puede asumir cada lanzamiento y

determine sus probabilidades.

TABLA 10-1

Resultado

POSIBLES RESULTADOS

1 2 3 4 5 6 Probabilidad 1/6 1/6 1/6 1/6 1/6 1/6

Como se puede observar, del lanzamiento del dado se puede obtener uno de 6 posibles

resultados y cada uno de ellos tiene una probabilidad asignada. Por lo tanto, el resultado del

lanzamiento de un dado es una variable aleatoria porque combina ambas condiciones: un

resultado y su probabilidad de ocurrencia.

Page 110: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

93

2. En una población escolar hay 300 estudiantes de los cuales 175 son mujeres y 125 son hombres.

Se selecciona aleatoriamente un estudiante. Demuestre que el sexo es una variable aleatoria.

TABLA 10-2

Total

Masculino Femenino Total

125 175 300 Probabilidad 0.42 0.58 1.00

En este ejemplo, sexo es una variable aleatoria en vista de que puede asumir uno de dos valores

(masculino o femenino) y cada uno de ellos tiene una probabilidad de ocurrencia.

De acuerdo a Chou (1974), podemos presentar los siguientes conceptos asociados con una variable

aleatoria:

Una variable aleatoria es aquella cuyo valor es un número determinado por el resultado de un

experimento aleatorio.

Si X es una variable aleatoria que puede asumir distintos valores (xi), y si cada uno de estos

valores está asociado a una probabilidad (p), entonces la combinación de cada valor de X con su

probabilidad, X(p), se denomina Función de Probabilidad o Distribución de Probabilidad. Por

lo tanto, los resultados organizados en la Tabla 10-1 y en la Tabla 10-2, son ejemplos de

Distribuciones de Probabilidad.

De todo lo anteriormente señalado se desprende que para el investigador es muy importante

conocer los posibles resultados que se pueden obtener con cada observación, además de las

probabilidades asociadas con los mismos.

Los ejemplos anteriormente desarrollados indican que, en el proceso de investigación del

comportamiento, al momento de seleccionarse una muestra, los resultados obtenidos en la medición

de cada uno de ellos deben reflejar, por un lado, un valor y por el otro, el mismo debe corresponder

a una probabilidad existente en la población. Esta situación no se cumple con precisión con un solo

sujeto o con una muestra muy pequeña de sujetos, pero a medida que aumenta el número de

selecciones, aumenta la posibilidad de que se cumpla la probabilidad real de dicho evento en la

población.

Al momento de hacerse una medición en una muestra, los resultados deben corresponder a una de

las dos posibles alternativas de variables aleatorias: discretas o continuas. Es importante que el

investigador determine con claridad a cuál de estas categorías pertenece la medición de la variable

estudiada; también puede suceder que en una misma investigación se combinen ambas categorías de

variables. A continuación discutiremos el significado de cada una de ellas.

Page 111: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

94

Variable aleatoria discreta (categórica):

Se refiere a aquella variable que al momento de ser medida, los resultados

correspondientes no pueden asumir valores fraccionales. Según Kerlinger y Lee

(2001), también se reconocen como variables nominales y se caracterizan por tener

dos o más subconjuntos del tipo de objetos medidos. Los sujetos que están en una

clase se caracterizan por poseer o no la propiedad definitoria: es un asunto del todo

o nada. Algunos ejemplos simples serían: masculino-femenino, correcto-incorrecto,

etc. Por lo general, cada categoría se identifica con un nombre o un número:

correcto o incorrecto, ó 1 si posee la característica, ó 0 si no la posee. En estos

casos, los números no tienen significado cuantitativo, sino únicamente nominal.

Variable aleatoria continua:

Es aquella que es capaz de asumir un conjunto ordenado de valores dentro de cierto

rango y que además puede asumir valores fraccionales. Esto implica que dicha

variable refleja, al menos, un orden de rango, o sea, que un valor mayor implica

más de la propiedad estudiada que un valor menor. Las medidas continuas están

contenidas dentro de rangos y los sujetos obtienen un puntaje dentro del mismo. Por

ejemplo, si se miden actitudes, la escala puede ser de 1 a 5: 1 significa una actitud

muy negativa y 5 una actitud my positiva. Además, dentro de la escala, se pueden

asumir valores fraccionales tales como: 1.75, 3.25, 4.50, etc. Por esta razón, las

variables continuas se miden por lo menos en una escala de intervalos.

Es evidente que los resultados obtenidos en las mediciones psicológicas corresponden a una de estas

dos categorías de variables, y que los mismos deben reflejar, hasta donde la muestra lo permita, el

espacio muestral de los resultados de la investigación y sus posibles probabilidades. En otras

palabras, deben corresponder a una distribución muestral de probabilidades

¿ Q u é e s u n a D i s t r i b u c i ó n M u e s t r a l d e P r o b a b i l i d a d e s ?

Se puede definir una a una distribución muestral como una descripción matemática de todos los

posibles resultados de los eventos muestrales y de sus probabilidades. Este concepto se aplica a

todas las muestras de un mismo tamaño que se pueden seleccionar de una población y a los

estadísticos calculados en las mismas. Específicamente, una distribución muestral se refiere a la

distribución de cualquier estadístico calculado sobre todas las posibles muestras de un mismo

tamaño, seleccionadas de una población. Este concepto estadístico se cumple con mayor certeza,

cuando la población es grande y genera muestras lo suficientemente grandes como para que se

cumplan algunos criterios que pasaremos a analizar a continuación; el ejemplo no es el más válido

porque la población es pequeña, pero se cumplen con claridad los principios básicos de las

distribuciones muestrales.

Supongamos que tenemos una población de tamaño N de la cual se seleccionan todas las posibles

muestras de tamaño n. Si para cada muestra es factible calcular la media, la varianza y la desviación

Page 112: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

95

estándar, entonces es factible generar la distribución muestral de cada uno de estos estadísticos, las

cuales se denominarían: distribución muestral de medias, distribución muestral de varianzas y

distribución muestral de desviaciones estándares; esto es posible para cualquier estadístico

muestral. El siguiente ejemplo nos ayudará a comprender mejor el concepto:

1. Suponga que tenemos la siguiente población de datos: 2, 4, 6, 8, 10.

Calculamos la Media (µ) y la Desviación Estándar (S) de dicha población de

datos: µ = 6; S = 2.83

Seleccionamos todas las posibles muestras de tamaño 2 de dicha población.

Son un total de 25 combinaciones o muestras:

2 4 6 8 10

2 2,2 2,4 2,6 2,8 2,10

4 4,2 4,4 4,6 4,8 4,10

6 6,2 6,4 6,6 6,8 6,10

8 8,2 8,4 8,6 8,8 8,10

10 10,2 10,4 10,6 10,8 10,10

Si calculamos la media aritmética de cada una de las muestras, los resultados

serían los siguientes:

2.0 3.0 4.0 5.0 6.0

3.0 4.0 5.0 6.0 7.0

4.0 5.0 6.0 7.0 8.0

5.0 6.0 7.0 8.0 9.0

6.0 7.0 8.0 9.0 10.0

Si calculamos la media de todas las medias anteriores tendríamos como

resultado:

0

00

Como se puede observar:

00

Se ha podido demostrar que la media de la población original de los cinco datos (6.00) es igual a

la media de todas las 25 medias de tamaño 2 (6.00). Las 25 medias constituyen lo que se

denomina la distribución muestral de las medias, lo cual es una importantísima propiedad

estadística en la cual se fundamenta el proceso de muestreo. Esta propiedad es cierta para

cualquiera distribución de muestras del mismo tamaño. A partir de esta propiedad, podemos

llegar a las siguientes conclusiones:

Page 113: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

96

La distribución muestral de todas las medias se aproxima a una curva normal,

independientemente de la forma de la distribución de los puntajes originales. Si se graficaran

todas las medias muestrales, la forma se aproximaría a una curva. Esta propiedad está

fundamentada en el Teorema Central del Límite.

La media de una distribución de medias (media de medias) es igual a la media original de la

población de los puntajes.

La desviación estándar de la distribución muestral de medias es menor que la desviación

estándar de la población original.

Es evidente que al seleccionar muestras aleatorias, las medias aritméticas resultantes de ellas serán

diferentes y esta diferencia se considera aleatoria, o sea, independiente del proceso de selección; es

inevitable. Es también lógico esperar que entre la media real de la población y la media de la

muestra seleccionada exista una diferencia; esta diferencia se denomina error de muestreo.

Ante esta situación, el investigador se enfrenta a la situación de que, independientemente de que su

proceso de selección sea el más adecuado, él sabe que la media obtenida de la muestra no será igual

a la media de la población, la cual es desconocida para el investigador. En estos casos, ¿Qué hace el

investigador para determinar el error o diferencia que hay entre la media de su muestra y la de la

población desconocida?

El primer paso para conocer el grado de aproximación que hay entre la media muestral y la

poblacional, es el cálculo de un estadístico denominado error estándar de la media. A través de

este indicador, el investigador se ahorra el largo proceso de determinar la distribución muestral de

las medias de cada muestra y calcular el promedio de las mismas para conocer el valor de la media

poblacional, o en última instancia, calcular la media poblacional sobre la totalidad de sujetos de la

población. Veremos algunos ejemplos:

Si estoy interesado en conocer el promedio de la habilidad verbal de los 19,000

aspirantes a ingresar a la Universidad, tendría que aplicar una prueba que mida

dicha variable a cada uno de ellos, determinar la puntuación individual, el valor

por cada sujeto y promediarla. Además de ser un trabajo metodológicamente

complicado, debe resultar muy caro.

Otra alternativa es que lo haga a través del promedio de la distribución muestral

de las medias de cada muestra de un mismo tamaño. Para el ejemplo anterior, si

establecemos muestras de 1,250 personas, necesitaríamos un número

infinitamente grande de muestras de este tamaño, lo cual hace de este

procedimiento algo imposible de lograr.

Para evitar estas situaciones complicadas, partiendo de la premisa de que la distribución muestral de

las medias se aproxima una curva normal, se calcula un estimador de la desviación estándar de la

distribución muestral de medias denominado: error estándar de la media, a partir de los datos

recogidos en una sola muestra. La fórmula para alcanzar este valor es:

Page 114: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

97

: error estándar de la media

s : desviación estándar de la muestra

n : tamaño de la muestra

Veamos un ejemplo: Una muestra de 75 entrevistados determinó una media de 46 con una

desviación estándar de 4.8. ¿Cuál sería el error estándar de la media aritmética?

A partir del valor del error estándar, estamos en capacidad de poder desarrollar una metodología

que nos permitirá aproximar la media aritmética conocida de la muestra, a la media poblacional

desconocida. A este procedimiento se le denomina ESTIMACIÓN, y es el primer objetivo de la

inferencia estadística.

E S T I M A C I Ó N E S T A D Í S T I C A

Se entiende por estimación estadística al conjunto de procedimientos estadísticos dirigidos a

aproximar los valores muestrales a los correspondientes valores poblacionales. Solamente podemos

aproximarlos; nunca se podrán calcular con exactitud. Hay dos métodos de estimación estadística:

la estimación puntual, y,

la estimación por intervalos

A continuación analizaremos cada uno de ellos.

E s t i m a c i ó n P u n t u a l :

Se refiere al procedimiento de seleccionar una muestra aleatoriamente de una población, calcular

uno o más valores estadísticos determinados por el problema de investigación (media, varianzas,

desviaciones estándar, etc.) y considerarlos como estimadores de sus correspondientes valores

poblacionales (parámetros). A este valor se le considera un buen estimador, aunque no se tenga

evidencia estadística de cuán cerca o lejos esté de su correspondiente valor poblacional; el

investigador depende plenamente de su juicio científico y, principalmente del método de muestreo

que se sugiere sea completamente aleatorio. Ante las dudas que presenta la estimación puntual, se

ha desarrollado un segundo método que no calcula el valor poblacional con exactitud, pero que

establece una estimación probabilística entre la muestra y la población. A este método se le

denomina: estimación por intervalos.

E s t i m a c i ó n P o r I n t e r v a l o s :

Se refiere al procedimiento a través del cual se estima, probabilísticamente, que a partir de los datos

muestrales, el parámetro poblacional se encuentre dentro de un intervalo bajo la curva normal. Esto

Page 115: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

98

es posible porque al determinar que la distribución muestral de las medias se aproxima a la curva

normal y que es factible determinar la desviación estándar de las distribución muestral de las

medias, éstas quedan definidas por los límites de la curva normal, que están entre -3z y + 3z a partir

de la media aritmética muestral. En otras palabras, se puede inferir probabilísticamente que la media

poblacional está ubicada dentro de un intervalo bajo la curva normal. Esta es la estimación más

precisa que se puede hacer de la media poblacional desconocida, a partir de la información obtenida

a través de una muestra aleatoria.

Para tal efecto se define lo que se denomina un intervalo de confianza, que es una zona de

probabilidad bajo la curva normal y que toma a la media muestral como estimadora de la media

poblacional. De esta manera, las puntuaciones Z se ubicarán por encima y por debajo de la media

muestral hasta -3z y + 3z, asociándose esta zona con un valor probabilístico. Si recordamos las

probabilidades bajo la curva, tenemos que:

o entre –1z y +1z hay un 0.6826 de probabilidades: zc = ± 1.64

o entre –2z y +2z hay un 0.9544 de probabilidades: zc = ± 1.96

o entre –3z y +3z hay un 0.9900 de probabilidades: zc = ± 2.58

O sea, que la probabilidad de que la media poblacional esté entre –z y +z es de 68.26%, la

probabilidad de que esté entre -2z y +2z es de 95.44%, y la probabilidad de estar entre -3z y +3z es

de 0.99.

Para tener claro el concepto, volvamos al ejemplo de la muestra de 75 entrevistados que obtuvo una

S = 4.8, y un error estándar de estimación de 0.55. ¿Cuál es el intervalo de confianza en el que se

espera que se encuentre la media poblacional desconocida?

Para responder a este cuestionamiento, debemos decidir dentro de cuál nivel de probabilidad

queremos hacer la estimación. Por lo general, se calculan los intervalos de confianza en los niveles

de probabilidad del 95% o el 99%. Para el 95%, el valor de Z es de 1.96, mientras que para el 99%,

el valor de Z será de 2.58. Para estos casos, Z se identificará como Zc (Z crítica)

La fórmula para determinar el intervalo de confianza es:

(

√ ) ……si la población es infinita

(

√ )√

…..si la población es finita

Donde Np es el tamaño de la población y n el de la muestra.

Supongamos que para el problema planteado queremos calcular el intervalo de confianza al 95%.

Como no se conoce el tamaño de la población, se utiliza la fórmula de poblaciones infinitas:

( ) (

√ ) ( ) (

) 0

Límite superior: 46 + 0.55 = 46.55

Límite inferior: 46 – 0.55 = 45.45

Page 116: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

99

Este resultado indica que, con un 95% de probabilidad, la media poblacional

desconocida estará entre 45.45 y 46.55.

Suponga que, para el mismo problema se conoce el tamaño de la población, N = 500. ¿cuál sería el

intervalo de confianza al 95%? En este caso se utiliza el método de las poblaciones finitas.

0 √ 00

00

0 √

(0 )(0 ) 0

Límite superior: 46 + 0.51 = 46.51

Límite inferior: 46 – 0.51 = 45.49

Este resultado indica que con un 95% de probabilidad, la media poblacional

desconocida estará entre 45.49 y 46.51.

El procedimiento anteriormente señalado, el cálculo del intervalo de confianza para la media

poblacional, es el más preciso con que se cuenta en estadística para aproximarnos al valor verdadero

de la media. También se pueden desarrollar intervalos de confianza para otros valores

poblacionales, pero para efectos de este texto, sólo nos referiremos a la media aritmética, por ser el

estadístico en el que se fundamentarán los procedimientos de prueba de hipótesis que se estudiarán

en capítulos posteriores.

Es evidente que la estimación estadística determina, en gran parte, la utilidad que se le podrá dar a

la muestra de estudio. A continuación introduciremos las técnicas de muestreo más efectivas, con la

intención de tener un panorama amplio de la relación que debe existir entre la muestra y su

correspondiente población.

M É T O D O S D E M U E S T R E O

El muestreo es el procedimiento a través del cual se seleccionan subconjuntos de las poblaciones a

las que se les denomina muestras. Las muestras son herramientas importantes para la investigación

del comportamiento, en vista de que favorecen el estudio de las poblaciones sin necesidad de

utilizar todas las observaciones poblacionales. Las muestras, además de ser métodos económicos en

comparación con los estudios poblacionales, mantienen un alto nivel de representatividad de dichas

poblaciones, si el procedimiento de muestreo es desarrollado de manera adecuada, respetándose los

criterios metodológicos que las estadísticas señalan al respecto.

Básicamente hay dos tipos de muestreo que pueden ser utilizados en el proceso de organización de

una muestra: el muestreo aleatorio que se caracteriza porque todos los sujetos de la población

tienen la misma probabilidad de ser seleccionados para conformar la muestra, y el muestreo no

aleatorio, en el cual cada miembro de la población no tiene la misma probabilidad de ser

seleccionado. A continuación analizaremos cada una de estas alternativas.

Page 117: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

100

M u e s t r e o N o A l e a t o r i o :

También se le conoce como muestreo no probabilístico, en vista de que la selección de cada unidad

(sujeto) no está determinada por su probabilidad en la población, ni está sustentada por un

procedimiento que asegure que dicha probabilidad poblacional ha sido considerada al momento de

hacer la selección. Algunos ejemplos de muestreo no aleatorio son.

1. Muestreo dirigido:

Se caracteriza porque los ítems (sujetos) son seleccionados con base en el juicio del encuestador;

en otras palabras, se escogen de la población aquellas unidades, que de acuerdo al investigador,

son representativos de la misma. En tales casos, La Probabilidad de selección del ítem (sujeto) es

desconocida. En estos casos, no se pueden establecer intervalos de confianza y la estimación es

de tipo puntual únicamente. A pesar de esta limitación, es un tipo de muestreo que se utiliza con

relativa frecuencia en estudios económicos y comerciales (Chou, 1974)

2. Muestreo por cuotas:

Se caracteriza porque a cada investigador (encuestador) se le da una cuota o número de

encuestas para ser cubiertas por el mismo. Los sujetos que constituyen la cuota que debe cubrir

el encuestador, deben satisfacer ciertas características previamente establecidas tales como:

nacionalidad, género, raza, afiliación política, etc. En algunas ocasiones se considera que se

puede obtener información de ciertos estratos, a bajos costos y con problemas metodológicos

inferiores a la verdadera estratificación. La limitación principal de este tipo de muestreo es que

la selección de las unidades refleja de manera significativa el juicio del encuestador. Bajo estas

características, las muestras no pueden ser tratadas como aleatorias en el mejor sentido de la

palabra. A pesar de esto, se utiliza con relativa frecuencia en estudios de opiniones y actitudes.

3. Muestreo deliberado:

También se le denomina muestreo por segmento. Se caracteriza porque se utiliza un segmento de

la población en función de su accesibilidad y comodidad para el investigador. Las guías

telefónicas, las listas de compradores de supermercados, etc., son ejemplos de unidades

observacionales en este tipo de muestreo. Sin embargo, los resultados obtenidos suelen ser muy

sesgados y poco representativos. No obstante, no se puede negar su utilidad como investigación

piloto, en vista de que se puede someter a prueba preguntas de los cuestionarios, encuestas, etc.,

antes de diseñar el estudio de manera definitiva.

M u e s t r e o A l e a t o r i o :

Se caracteriza porque todos los miembros de la población tienen igual oportunidad de ser

seleccionados para la muestra. Esta situación determina que cada uno de los miembros de la

población debe ser identificado previamente, tal y como sucedería, por ejemplo, con los estudiantes

de una escuela, los miembros de una empresa, los habitantes de un corregimiento, etc. La población

y cada una de sus unidades participantes del muestreo, deben ser conocidas previamente y se debe

desarrollar una metodología para su correcta identificación al momento de la selección. Es evidente

que la definición de la población y la identificación de cada uno de sus miembros, es una de las

Page 118: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

101

dificultades más importantes a la que se deben enfrentar los investigadores. Los principales tipos de

muestreo aleatorio son los siguientes:

1. Muestreo Aleatorio Simple:

Se refiere a la extracción de una muestra de una población, a través de un procedimiento en el

cual todos los sujetos de la población tuvieron la misma oportunidad de ser seleccionados. Para

alcanzar este objetivo, el procedimiento de selección debe ser meticulosamente planificado de tal

manera que se cumplan todos los controles exigidos para este tipo de actividad.

En teoría, para que se cumpla la aleatoriedad, los sujetos seleccionados deben ser devueltos a la

población original, manteniendo los eventos y sus probabilidades invariantes. Pero en la práctica

esto no es necesario, porque por lo general, el tamaño de la población es muy grande en

comparación con el de la muestra y el error cometido por la no sustitución no tiene importancia

práctica. Sin embargo, si la población es muy grande, en ocasiones se hace difícil numerar a

cada uno de los miembros de la población para poder identificarlos. En la actualidad, este

inconveniente está superado con el desarrollo de la informática que agiliza estos procedimientos

de manera significativa.

El proceso de selección de la muestra, una vez identificados de manera adecuada todos los

sujetos de la población, se lleva a cabo utilizando una Tabla de Números Aleatorios, que no es

otra cosa que una serie de números generados electrónicamente sin ningún patrón u orden pre

establecido. A continuación presentamos una parte de una Tabla de Números Aleatorios, tomada

de Pagano, 2006.

TABLA 10-3:

Tabla de números aleatorios (PAGANO, 2006)

1 2 3 4 5 6 7 8

1 32942 95416 42339 59045 26693 49057 87596 20624

2 07410 99859 83828 21409 29094 65114 36701 25762

3 59981 68155 45673 76210 58219 45738 29550 24736

4 46251 25437 69654 99716 11563 08803 86027 51867

5 65558 51904 93123 27887 53138 21488 09095 78777

6 99187 19258 86421 16401 19397 83297 40111 49326

7 35641 00301 16096 34775 21562 97983 45040 19200

Como se puede observar, una Tabla de Números Aleatorios no es otra cosa que una matriz

(combinación de filas y columnas) constituida por celdillas, dentro de las cuales se observan

series numéricas en desorden, generadas a través de ordenadores. Para nuestro ejemplo, las

celdillas están constituidas por series de cinco números, pero cada celdilla puede generar

cualquier conjunto de números, desde 1 hasta k; lo importante es que los mismos no representen

ningún orden predeterminado. Como en la población cada sujeto estará identificado por un

número o combinación de números, se entra a la Tabla de manera aleatoria y se va

Page 119: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

102

seleccionando a los sujetos de acuerdo la aparición del número que corresponde a los mismos.

En los Laboratorios se estudiará el método para utilizar la Tabla en la selección aleatoria de

sujetos.

2. Muestreo Aleatorio Sistemático:

Se trata de una forma de muestreo aleatorio simple, en la cual no es necesario utilizar la Tabla de

Números Aleatorios a lo largo del muestreo; se utiliza para hacer la primera selección

únicamente. El resto del muestreo se hará sistemáticamente, o sea, a través de intervalos fijos

previamente establecidos por el investigador. A los intervalos fijos los llamaremos K, y los

mismos serán definidos a través de la siguiente regla: ⁄ . Por ejemplo, si se tiene una

población de N=1000 sujetos y se desea seleccionar una muestra de 100 sujetos, se divide el

tamaño de la población entre el tamaño de la muestra, obteniéndose K o intervalo de selección

aleatoria. Para nuestro ejemplo sería 000 00⁄ 0. Esto significa que a partir del primer

sujeto seleccionado aleatoriamente utilizando la Tabla, el resto de los sujetos de la muestra se

seleccionarán en intervalos de tamaño 10, directamente de la población hasta obtener los 100

sujetos que conforman la muestra. Como el primer sujeto fue seleccionado aleatoriamente, el

resto de las selecciones que se hagan utilizando el intervalo de tamaño 10 también se consideran

aleatorias. Este procedimiento es más rápido y por lo tanto más económico que el muestreo

aleatorio simple, manteniéndose el concepto de aleatoriedad a lo largo del proceso.

3. Muestreo Aleatorio Estratif icado:

Se trata de una aplicación del método aleatorio simple, que permite desarrollar un muestreo más

eficiente y completo. Este caso requiere que la población esté dividida en estratos o categorías

homogéneos internamente pero heterogéneos entre ellos. Este sería el caso de poblaciones

estratificadas por género, por nivel académico, por nivel socioeconómico, por género y tipo de

organización familiar, etc. Para estos casos, una vez determinado el tamaño muestral a utilizar,

se selecciona de cada estrato una sub muestra utilizando uno de los métodos aleatorios

anteriormente explicados, de tal manera que en la muestra estarán representados los estratos

originales de la población.

Hay dos tipos de muestra aleatoria estratificada: la proporcional y la no proporcional. Una

muestra es aleatoria estratificada proporcional, si el número de sujetos seleccionados de cada

estrato es proporcional a su representación en la población. A continuación presentamos un

ejemplo:

Para ingresar a una carrera universitaria hay un total de 450 aspirantes, los

cuales pertenecen a los siguientes bachilleratos:

Estrato N p

Ciencias 250 0.50

Letras 100 0.20

Comercio 150 0.30

Total 500 1.00

Page 120: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

103

Se va a seleccionar una muestra de 75 estudiantes para ingresar a la

universidad. ¿Cuál sería la cuota de estudiantes por estrato y de qué

manera serían seleccionados?

Se trata de un muestro aleatorio estratificado proporcional.

Estrato n!(p) n

Ciencias 75(0.50) 37.5

Letras 75(0.50) 15.0

Comercio 75(0.50) 22.5

∑ 0

Como se observa en el ejemplo anterior, los 75 estudiantes seleccionados están conformados por

los tres bachilleratos, pero el número de estudiantes de cada bachillerato es proporcional a la

cantidad de estudiantes que originalmente constituían el estrato en la población. Este

procedimiento permite seleccionar una muestra que representa al universo con relación a la

proporción de cada estrato de la población. Sin embargo, es prudente utilizar este procedimiento

en aquellos casos en los que no hay gran diferencia en la dispersión entre los estratos.

Una vez asignada la cuota de muestreo a cada uno de los estratos, se les trata como si fueran una

población y se selecciona la cuota asignada a cada uno de ellos, utilizando cualquiera de los

métodos de muestreo aleatorio anteriormente analizados: simple o sistemático.

Es evidente que el muestreo estratificado no proporcional no es una alternativa adecuada para la

selección de muestras constituidas por estratos. Este tipo de muestreo puede presentar

distorsiones de la información proveniente de cada uno de los estratos, especialmente si hay

diferencias marcadas en la dispersión entre los estratos. Este método de muestreo no es

recomendable para el desarrollo de investigaciones aplicadas en psicología.

D E T E R M I N A C I Ó N D E L T A M A Ñ O D E L A M U E S T R A : n

Este capítulo sobre poblaciones y muestras no podía darse por concluido, si no se abordaba el

problema del tamaño de la muestra. A continuación discutiremos los aspectos básicos que deben ser

tomados en consideración, para determinar el tamaño mínimo que debe tener una muestra al

momento de desarrollarse un estudio. Es importante destacar que el concepto de la aleatoriedad se

mantiene como un aspecto básico en el desarrollo del tema. Además, los principios que se

presentarán a continuación se refieren específicamente a la determinación de n, para la estimación

de la media de la población, por ser éste el parámetro que más se utiliza en investigaciones del

comportamiento.

Para determinar “n”, es importante tomar en consideración los siguientes aspectos estadísticos

básicos:

1. El intervalo de confianza para la media, ya sea del 95% o del 99%

2. El nivel de probabilidad que desea para el intervalo de confianza

Page 121: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

104

3. La diferencia que espera entre los límites del intervalo y el valor de la media verdadera: d

4. La σ2 de la población

En el caso de la σ2, en pocas ocasiones el investigador cuenta con este dato; por lo general se

requiere que el mismo sea estimado de la población, para lo cual se sugiere una de las siguientes

alternativas:

El investigador saca de la población una muestra piloto, por lo general pequeña, y hace una

estimación de la σ2.

Se investigan estudios previos en los cuales se han tocado temas similares a los que le interesan

al investigador. Si los temas, objetivos y contenidos de dichos estudios son lo suficientemente

similares, puede hacer uso de las varianzas muestrales obtenidas y considerarlas estimadoras de

la σ2.

Al momento de determinar “n”, el investigador debe considerar si la población en la cual se hará el

muestreo es infinita (desconocido el número de sujetos o significativamente grande), o si es finita,

en cuyo caso, se tiene información sobre el amaño de la población. A continuación se presentan las

fórmulas correspondientes a cada una de estas alternativas.

T a m a ñ o D e P o b l a c i ó n D e s c o n o c i d o

z2: cuadrado de la puntuación z correspondiente al 95% (1.96) o al 99% (2.58)

σ2 : varianza de la población o un estimador de ella

d2: diferencia esperada entre la media de la muestra y la de la población

T a m a ñ o D e P o b l a c i ó n C o n o c i d o

( )

z2: cuadrado de la puntuación z correspondiente al 95% (1.96) o al 99% (2.58)

σ2 : varianza de la población o un estimador de ella

d2: diferencia esperada entre la media de la muestra y la de la población

N : tamaño de la población

Page 122: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

105

C O N C E P T O S I M P O R T A N T E S

Variables aleatorias

Variable aleatoria contínua

Variable aleatoria nominal (discreta)

Distribución muestral

Error de muestreo

Error típico de la media

Estimación estadística

Intervalo de confianza

Page 123: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

106

E J E R C I C I O S P R Á C T I C O S

DISEÑO DE MUESTREO

TABLA 1

P O B L A C I Ó N

H O M B R E S M U J E R E S

01 17 33 49 65

02 18 34 50 66

03 19 35 51 67

04 20 36 52 68

05 21 37 53 69

06 22 38 54 71

07 23 39 55 71

08 24 40 56 72

09 25 41 57 73

10 26 42 58 74

11 27 43 58 75

12 28 44 60 76

13 29 45 61 77

14 30 46 62 78

15 31 47 63 79

16 32 48 64 80

A partir de la población anterior, seleccionaremos muestras de manera aleatoria.

1. Selecciones una muestra aleatoria de tamaño n = 30, utilizando el método de muestreo aleatorio

simple.

2. Seleccione una muestra aleatoria de tamaño n= 30, utilizando el método sistemático

3. Seleccione una muestra aleatoria de tamaño n=30, utilizando el método de muestreo

estratificado proporcional.

Page 124: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

107

DISEÑO DE MUESTREO

SEGUNDA PARTE

TABLA 2

P O B L A C I Ó N

H O M B R E S M U J E R E S

60 75 72 92 85

72 64 75 49 94

55 88 64 79 68

45 73 85 83 71

82 68 71 69 65

84 77 87 64 55

93 67 83 82 62

63 89 81 72 73

94 82 57 75 77

85 78 62 70 72

90 81 91 66 67

76 68 73 85 87

78 70 78 98 61

69 81 79 72 76

56 71 72 78 82

73 78 93 76 90

Suponga que a los sujetos de la población de la Tabla 1, se les aplicó una prueba de Conocimientos

Generales y los resultados están descritos en la Tabla 2 de este laboratorio. Como usted seleccionó

muestras de tamaño 30, acredite a cada sujeto de las muestras seleccionadas el puntaje que obtuvo

en la prueba y desarrolle el laboratorio que presentamos a continuación. Recuerde: la Tabla 1

identifica a los sujetos de la población; la Tabla 2 identifica los puntajes que obtuvo cada uno de

ellos en la prueba.

4. A partir de la muestra aleatoria simple de tamaño 30 seleccionada anteriormente determine:

La media aritmética de la muestra y la desviación estándar de la muestra

El error estándar de la media aritmética

El intervalo de confianza para la media aritmética al:

95%

99%

5. A partir de la muestra aleatoria estratificada de tamaño 30, seleccionada anteriormente,

determine: :

La media aritmética y la desviación estándar del estrato masculino

Page 125: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

108

El error estándar de la media del estrato masculino

El intervalo de confianza para la media del estrato masculino al:

95%

99%

6. Desarrolle el mismo procedimiento del punto 2, para el estrato femenino

7. A partir de la población hipotética resumida en la Tabla 2 del capítulo, y sin tomar en

consideración diferencias por sexo, determine el tamaño de muestra (n) mínimo requerido, si el

intervalo de confianza es del 95% y la estimación (margen de error) aceptada con relación a la

media real es de 2 puntos. La varianza estimada a través de otros estudios semejantes fue de

121 puntos.

8. Un investigador desea hacer una estimación de la puntuación promedio de la ansiedad, de un

grupo de estudiantes que pertenecen a cierta área de la ciudad. El investigador desea que su

estimación se encuentre a 0.25 puntos del valor verdadero, con un intervalo de confianza del

99%. La desviación estándar obtenida en estudios previos fue de 0.75. ¿Qué tamaño de muestra

debe tener el estudio?

Page 126: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

109

CAPÍTULO 11

INTRODUCCIÓN A LA PRUEBA DE HIPÓTESIS

Uno de los objetivos de la inferencia estadística es la prueba de hipótesis. Para tener una idea más

clara de su real significado, es necesario discutir el concepto hipótesis estadística. En el plano de la

investigación psicológica, una hipótesis es una afirmación referente al comportamiento esperado de

una o más variables y de las posibles relaciones que pueden existir entre las mismas. Las hipótesis

de investigación se plantean, por lo general, desde una perspectiva conceptual, y se fundamentan en

modelos teóricos, evidencia empírica obtenida a través de otras investigaciones, e inclusive, la

intuición, experiencia o sentido común del investigador. Las hipótesis de investigación requieren ser

verificadas empíricamente, lo cual permitirá decidir sobre la veracidad o no de la afirmación

efectuada. La verificación de las hipótesis de investigación se realiza a través de una herramienta de

la estadística inferencial denominada hipótesis estadísticas.

FIGURA 11—1

El problema básico al que se enfrenta el investigador es el de establecer un vínculo entre la(s)

hipótesis de investigación que se refieren a variables y las relaciones de las mismas definidas

conceptualmente, y el comportamiento observable de las mismas en el contexto de la investigación.

En las ciencias del comportamiento, ese vínculo se logra a través de las definiciones operacionales

de dichas variables, o sea, la descripción precisa de la forma en que las mismas serán medidas. A

través de la medición podemos pasar del concepto (constructo o variable) al dato, favoreciéndose de

esta manera, la aplicación de procedimientos matemáticos y estadísticos capaces de verificar con

objetividad, las afirmaciones (o conjeturas) planteadas a través de las hipótesis de investigación.

Veamos un ejemplo hipotético.

Un psicólogo cree poseer evidencias como para considerar que el razonamiento analógico está

relacionado con el rendimiento en las matemáticas. Para ser más específico, conjetura que la

relación entre ambas variables es directamente proporcional, o sea que, incrementos en una, van

acompañados de incrementos en la otra. Para solucionar esta sospecha, el primer paso que debe

satisfacer el investigador es el de determinar si estas variables pueden ser definidas

operacionalmente, o sea, que puedan ser medidas. Descubrió que el razonamiento analógico se

puede medir a través de la Prueba del WISC mientras que el rendimiento en las matemáticas lo

Problemas

Teorías

Hipótesis de

investigación

Hipótesis

estadísticas

Page 127: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

110

mide a través de las notas obtenidas en el colegio; bajo estas perspectivas, ambas variables

pueden ser transformadas de conceptos a datos o valores cuantitativos. De cada sujeto

investigado se puede obtener información que permita determinar: si poseen los atributos y la

magnitud (cantidad) de los mismos. A partir de la cuantificación, el investigador está en

capacidad de verificar si su hipótesis es acertada o no, sobre la base de la aplicación de las

estadísticas inferenciales, específicamente a través de una prueba de hipótesis.

L A P R U E B A D E H I P Ó T E S I S

Es un procedimiento que permite establecer si el comportamiento esperado de los datos estadísticos

provenientes de una investigación, se han cumplido tal y como conjeturó el investigador, o si por el

contrario, dicho comportamiento no se manifestó de acuerdo a lo esperado. Para desarrollar esta

acción se requiere de evidencia estadística proveniente de la(s) muestra(s) de estudio y de una

acertada aplicación de la teoría de la probabilidad. Esto último es fundamental, en vista de que las

investigaciones comportamentales se desarrollan sobre muestras extraídas de poblaciones y toda la

teoría del muestreo está basada en probabilidades.

FIGURA 11—2

La Prueba de Hipótesis es un procedimiento que consta de seis pasos que deben ser cumplidos con

la mayor objetividad posible. A continuación se desarrolla cada uno de ellos. El estudiante debe

comprender, analizar y sintetizar el contenido, de tal manera que al momento de llevar a la práctica

el procedimiento, el mismo esté correctamente sustentado.

Evidencia muestral

Teoría de probabilidad

Hipótesis estadística

Page 128: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

111

FIGURA 11—3

P A S O 1 : H i p ó t e s i s E s t a d í s t i c a

Una hipótesis estadística es una que hace el investigador acerca del comportamiento de uno o más

parámetros poblacionales, de acuerdo a la hipótesis de investigación planteada en el estudio. La

hipótesis estadística se hace sobre valores cuantitativos que deben representar la misma relación

planteada en la hipótesis de investigación. Para tal efecto, la Prueba de Hipótesis está constituida

por dos hipótesis que deben ser rivales y mutuamente excluyentes: la Hipótesis nula (H0) y la

Hipótesis alterna (H1).

La Hipótesis Nula, H0, se plantea de manera opuesta a la hipótesis de investigación; en otras

palabras, rivaliza con la hipótesis de investigación. Por otro lado, la Hipótesis Alterna, H1, se

plantea de tal manera que debe coincidir totalmente con la hipótesis de investigación, por lo tanto,

es opuesta a la hipótesis nula. Bajo estas circunstancias, la Prueba de Hipótesis se diseña con la

intención de rechazar la H0 y confirmar la H1. Si se rechaza la H0, se confirma la H1; si no se

rechaza la H0, no se confirma la H1 y por lo tanto, tampoco se confirma la hipótesis de

investigación. El planteamiento formal de ambas hipótesis es el siguiente:

H0: Se plantea la hipótesis nula

H1: Se plantea la hipótesis alterna

Veamos el ejemplo del razonamiento analógico y el rendimiento en matemáticas. La hipótesis del

investigador se verifica con un procedimiento de correlación del cual se desprende un coeficiente

que él espera que sea positivo y mayor que cero (0). Las hipótesis estadísticas correspondientes

serían:

0

0

PASO 1:

•Hipótesis estadísticas

PASO 2:

•Nivel de significación

PASO 3

•Identificar el estadístico de prueba

PASO 4

•Formular una regla de decisión

PASO 5

•Tomar una muestra y llegar a una decisión

PASO 6

•Decisión

Page 129: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

112

Como se puede observar, la H1 coincide con la hipótesis de investigación que decía que la relación

esperada debía ser directamente proporcional entre ambas variables, situación que se corrobora

cuando el coeficiente rxy es mayor que cero (0). Lo importante en el ejemplo es observar que si se

rechaza la H0, automáticamente se considera confirmada la H1; de no ser rechazada la H0, no se

podría confirmar o aceptar la H1. Este es un ejemplo, y más adelante, explicaremos los diversos

estadísticos que se utilizan al plantear las hipótesis.

Otros ejemplos de planteamiento de hipótesis estadísticas

1. El Ingreso mensual promedio de los jubilados panameños es menor de B/385.00

00

00

2. El índice académico de las estudiantes de psicología del sexo femenino es mayor que el de los

estudiantes del sexo masculino

3. El nivel de conocimientos de matemáticas básicas es diferente entre los bachilleres en letras y

los bachilleres en comercio.

Como se puede observar en los ejemplos, la Hi se puede plantear en una dirección (> ó <) al igual

que en dos direcciones ( ≠ ). Cuando se plantea en una dirección, la prueba es de una cola a la

derecha y el operador utilizado es >, o de una cola a la izquierda y el operador corresponde a <. En

el caso de una cola a la derecha se indica que el resultado esperado debe ser positivo y se ubicará a

la derecha de la distribución de probabilidad que se esté utilizando. Por el contrario, si la prueba es

de una cola a la izquierda se indica que el resultado esperado debe ser negativo y debe ubicarse a la

izquierda de la distribución de probabilidad correspondiente. En el caso de dos colas se indica que

no hay certeza por parte de investigador con relación a la dirección en que se darán los resultados, o

sea, que pueden darse a la derecha y ser positivos, o pueden darse a la izquierda y ser negativos. Es

importante volver a destacar que la hipótesis alterna debe ser semejante a la hipótesis de

investigación, lo que significa que la dirección de la prueba de hipótesis debe corresponder a lo

planteado en la hipótesis de investigación.

P A S O I I : N i v e l D e S i g n i f i c a c i ó n

El nivel de significación se refiere a una zona de probabilidad bajo la distribución probabilística,

que determinará el rechazo de la Ho y por consiguiente la confirmación de la Hi. Siempre que los

resultados de la prueba de hipótesis caigan dentro del nivel de significación, se ha verificado la

hipótesis alterna. El nivel de significación se identifica por el símbolo α el cual se lee como alfa y

por lo general, en las investigaciones comportamentales puede tener uno de los siguientes valores:

1. α = 0.05.

Page 130: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

113

En ese caso se indica que la probabilidad asignada a la ocurrencia de la H1 por azar, es

de 0.05, y la misma se ubicará siempre en los extremos de la distribución de

probabilidad, ya sea para una o para dos colas.

2. α = 0.01

Para este caso, la probabilidad asignada a la ocurrencia de la Hi por azar, es de 0.01 y,

al igual que en el caso anterior, se ubicará en los extremos de la distribución, tanto

para una como para dos colas.

Como se puede observar, los alfas tienen tamaños diferentes y esta situación es importante al

momento de diseñar y desarrollar la prueba de hipótesis. Cuando se establece un alfa de 0.05, se

comete lo que se denomina el error de tipo I. Este error se refiere a la probabilidad de rechazar la

Ho y confirmar la Hi cuando la primera no debió de haberse rechazado. O sea, que el rechazo se

debe principalmente a que alfa tiene un tamaño grande y de esa manera aumenta la probabilidad de

que los resultados caigan en esta zona. Esta situación nos lleva a concluir que cada vez que

decidimos tomar un alfa más grande, se aumenta la probabilidad de cometer el error de tipo I, o sea,

verificar su hipótesis alterna, cuando no debió ser verificada. Cuando se establece un alfa de 0.01,

se comete lo que se denomina el error de tipo II, que se refiere a la probabilidad de no rechazar la

Ho y por lo tanto, no confirmar su Hi, cuando la primera debió haberse rechazado. En este caso,

como alfa es tan pequeña, se ubica muy al extremo de la distribución de probabilidad haciendo

difícil que resultados muy importantes sean considerados como tales en vista de que no caen en

dicha zona de probabilidades. A continuación se presentan algunas figuras que favorecen la

comprensión del tema.

Page 131: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

114

Error de tipo I:

α grande

Error de tipo II:

α pequeña

FIGURA 11—4

La figura anterior presenta la situación típica de una prueba de hipótesis en la que se ha definido

alfa. Como se puede observar, la distribución ha sido dividida en dos áreas: la del extremo derecho,

la más pequeña, representa a alfa, la cual puede ser de 0.05 ó de 0.01 de acuerdo a las necesidades

del investigador. Este es el caso típico de una prueba de una cola a la derecha, porque se está

indicando que la zona de alfa está en el extremo derecho. Si por el contrario, la prueba hubiese sido

de una cola hacia la izquierda, entonces la zona de alfa se hubiese ubicado en la cola de la izquierda

de la distribución.

Tal y como hemos observado, al definirse alfa, se divide la distribución en dos partes: una para alfa

que es la más pequeña y otra mayor que se denomina beta y se identifica por el símbolo β. Beta

representa la probabilidad asociada con la H0, es complementaria con alfa y ambas son mutuamente

Page 132: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

115

excluyentes. Por lo tanto, la prueba de hipótesis puede caer en alguna de las dos áreas: si cae en alfa

se rechaza la H0 y se confirma la Hi; si cae en beta, no se rechaza la H0 y no se ha podido confirmar

la Hi.

En el caso de que la prueba de hipótesis sea de dos colas, entonces alfa se divide entre dos (α / 2) y

se asignan las correspondientes probabilidades a cada extremo de la curva; o sea, que hay dos zonas

de rechazo probables para la H0. El área central que queda entre las dos zonas de alfa corresponde a

beta.

La figura a continuación permite observar la situación anteriormente señalada, identificando cada

uno de los componentes de la situación de prueba de hipótesis planteada.

FIGURA 11—5

Es importante destacar que α + β = 1, por ser eventos mutuamente excluyentes y complementarios.

Cambios en alfa representan automáticamente cambios en beta. El investigador decide cuál valor de

alfa va a utilizar, o sea, cuál tipo de error está dispuesto a cometer. Es evidente que mientras más

importante sea la decisión a tomar, más exigente se hace la prueba de hipótesis, y por lo tanto, más

pequeño será alfa. En psicología, educación y ciencias sociales, estos dos niveles de significación

son los que se estudian y utilizan con mayor generalidad. Sin embargo, es importante señalar que

existen procedimientos muy específicos para determinar estos niveles de probabilidad, tales como la

determinación de la potencia y eficiencia de una prueba de hipótesis. Estos temas se estudian en

niveles superiores de educación universitaria.

α = 0.025 ó 0.005 α = 0.025 ó 0.005

Β = 0.95 ó 0.99

α representa la probabilidad de ocurrencia de H1 por azar

β representa la probabilidad de ocurrencia de Ho por azar

Page 133: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

116

P A S O I I I : E s t a d í s t i c o D e P r u e b a

Una vez definidas las hipótesis y establecido el nivel de significación, se debe establecer el

procedimiento estadístico a través del cual se va a desarrollar la prueba de hipótesis. El

procedimiento estadístico seleccionado debe tomar en consideración varios aspectos críticos:

El tamaño de la muestra: si la muestra es ≤ a 30, el estadístico a seleccionar debe ser adecuado

para esta restricción del muestreo, o en otras palabras, debe corresponder a una muestra

pequeña. Si la muestra es > 30, el estadístico debe corresponder a una muestra grande.

El nivel de medición de la(s) variable(s): se debe considerar si la(s) variable(s) han sido

medidas como continuas o discretas, y si corresponden al nivel nominal, ordinal, de intervalo o

de proporción.

El tipo de parámetro poblacional que está bajo estudio a través de la evidencia muestral

Si las muestras analizadas (estimadores a someter a prueba) provienen de poblaciones

semejantes o diferentes.

Bajo estas consideraciones, los estadísticos de prueba que se utilizarán para el estudio de las

pruebas de hipótesis son:

1. El estadístico z para las pruebas de hipótesis de dos medias o dos proporciones provenientes de

muestras grandes y que supongan que las variables son continuas, se distribuyen normalmente

y la σ es conocida.

2. El estadístico “t” de Student, para las pruebas de hipótesis de dos medias aritméticas,

desarrolladas en muestras pequeñas (o grandes) y que se asume que las variables son continuas

y la σ es desconocida por lo que se utiliza la S muestral.

3. El estadístico “F” de Fisher para las pruebas de hipótesis de medias aritméticas, muestras

pequeñas y variables continuas, cuando se comparan dos o medias aritméticas.

4. La prueba Chi Cuadrado para muestras pequeñas, variables discretas medidas en escala

nominal. La prueba de proporción y asociación de Chi Cuadrado requiere de muestras grandes.

Recuerde que si la frecuencia esperada es menor a 5 no aplica; para el caso de muestras

pequeñas y tablas sólo 2x2, la prueba sería la Exacta de Fisher.

Para el caso de pruebas de hipótesis para medias aritméticas, a continuación presentamos una tabla

en la que se resumen los valores críticos de Z, a diferentes niveles α, a una o a dos colas.

TABLA 11-1:

Valores críticos de z para diferentes niveles de α, a una o a dos colas

Alfa 0.05 0.01

Una cola 1.96 ó -1.64 2.33 ó -2.33

Dos colas 1.96 ó -1.96 2.58 ó - 2.58

Page 134: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

117

Para cada uno de los estadísticos señalados, se ha definido una regla (fórmula) para calcular su

valor exacto, las cuales serán presentadas a medida que se vayan desarrollando los diferentes tipos

de pruebas de hipótesis.

P A S O I V : R e g l a D e D e c i s i ó n

La regla de decisión identifica los hechos estadísticos que permitirán determinar si la H0 se rechaza

o no se rechaza. Al momento de determinarse alfa, la distribución de probabilidad utilizada se

divide en dos partes: la zona de aceptación y la de rechazo. El punto en que se divide la distribución

debe ser representado por un valor crítico proveniente de la Tabla de Probabilidades

correspondiente a la distribución de probabilidad utilizada para el estudio, el alfa de la prueba y el

tipo de cola de la hipótesis alterna. Esto significa que se determinarán valores críticos para z, t, F y

Chi Cuadrado, y que los mismos serán los criterios contra lo que vamos a comparar los resultados

obtenidos al aplicar las pruebas estadísticas. La regla de decisión establecerá que se rechazará la H0,

si el estadístico obtenido de los datos de la investigación, supera el valor crítico obtenido en la tabla.

Por ejemplo, si está haciendo una prueba de hipótesis para una media poblacional, con alfa de 0.05,

una cola a la derecha y una muestra grande, el valor crítico que separa alfa de beta se obtiene de la

Tabla de la Curva Normal y el mismo es igual a Zc = 1.64. Quiere decir que para rechazar la H0, la

z que obtenga de los datos de la investigación (Zo) debe ser superior al valor crítico de 1.64. Si esto

sucede, la z de los datos cae en la zona de alfa y por lo tanto se rechaza la Ho confirmándose la

alterna; de lo contrario, no se puede rechazar la H0. Esto debe estar debidamente explicado en la

prueba de hipótesis, más o menos en los siguientes términos:

Se rechaza la H0 si la Zo (z obtenida) es mayor que la Zc (z crítica) que es igual a 1.64.

Región de aceptación

Región

de

rechazo

Probabilidad 0.95

0 Z = 1.64

Probabilidad

0.05

FIGURA 11—6

P A S O V : A p l i c a c i ó n d e l a P r u e b a E s t a d í s t i c a

Se refiere al procesamiento estadístico de los datos provenientes de la(s) muestra(s) de estudio y del

desarrollo de la prueba estadística seleccionada. Como ya hemos dicho anteriormente, se utilizarán

Page 135: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

118

las pruebas z, t, F y Chi Cuadrado de acuerdo a las necesidades. Los resultados obtenidos serán

comparados con los correspondientes valores críticos provenientes de las Tablas y se determinará si

los valores observados superan o no a los críticos lo cual permitirá tomar una decisión final.

P A S O V I : D e c i s i ó n

La decisión se refiere al rechazo o no de la H0, atendiendo al planteamiento de la prueba de

hipótesis, a los resultados de la prueba estadística y a la regla de decisión establecida en el estudio.

Si el valor observado en la prueba supera al valor crítico de la Tabla, se rechaza la Ho y se confirma

la alterna; de no ser así, no se rechaza la Ho y por lo tanto no se confirma la hipótesis alterna.

C O N C E P T O S I M P O R T A N T E S

Hipótesis estadística

Prueba de hipótesis

Hipótesis nula

Hipótesis alterna

Nivel de significación

Alfa y Beta

Errores Tipo I y Tipo II

Prueba de una cola

Prueba de dos colas

Page 136: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

119

CAPÍTULO 12

PRINCIPALES TIPOS DE PRUEBA DE HIPÓTESIS

Al iniciar el capítulo de “Poblaciones y Muestras” señalamos que se haría énfasis en los estudios

relacionados con la media aritmética, en vista de que este estadístico es posiblemente el más

importante, junto con la desviación estándar, para los análisis de resultados provenientes de

investigaciones comportamentales. Por tal razón, las pruebas de hipótesis que a continuación se

discutirán, se dirigen en particular hacia este estadístico.

P R U E B A S D E H I P Ó T E S I S P A R A P O B L A C I O N E S O D A T O S

D I S T R I B U I D O S N O R M A L M E N T E .

Cuando se presume que los datos están distribuidos normalmente, ya sea porque la muestra es

grande o porque se tiene suficiente evidencia como para aseverar la distribución normal, se puede

estudiar la significancia de las puntuaciones correspondientes a la(s) media(s), utilizando el

estadístico estandarizado “z”. Para tal efecto se deben satisfacer ciertas condiciones:

Los datos se distribuyen normalmente

Los datos han sido medidos por lo menos en una escala de intervalos

La µ poblacional es conocida

La σ2 poblacional es conocida

Si la σ2

es desconocida, pero la muestra es lo suficientemente grande, la S2 muestral puede ser

utilizada como estimadora de su correspondiente parámetro poblacional.

Si las condiciones anteriores son satisfechas, se pueden desarrollar dos tipos de pruebas de hipótesis

para la media: a) el caso de una media poblacional y, b) el caso de dos medias poblacionales. A

continuación presentaremos las principales características de ambos procedimientos.

E l C a s o D e U n a M e d i a P o b l a c i o n a l

En muchas ocasiones, los investigadores están interesados en evaluar si una media poblacional

conocida ha variado o se mantiene igual. En estos casos, una vez verificadas las propiedades

anteriormente señaladas, se extrae una muestra aleatoria de la población y se calcula la media

aritmética de la misma. El estadístico de análisis es:

√ ⁄

A continuación presentamos un ejemplo de una prueba de hipótesis para el caso de una media

poblacional.

Page 137: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

120

La media de las aptitudes generales de los aspirantes a ingresar a la Universidad A, en los

últimos diez años, es de 43, con una σ = 8.56. Una muestra de 275 aspirantes del año 2010

obtuvo una media de 46.65. Con alfa de 0.05 determine si la media de las aptitudes generales de

los aspirantes ha aumentado en comparación con los últimos diez años.

1. Hipótesis estadíst icas

2. Nivel de significación

0 0

3. Estadíst ico de prueba

√ ⁄

4. Regla de decisión

Rechazar Ho si la Zo es mayor que la Zc = 1.64

5. Resultados

0 0

6. Decisión:

En vista de que zo > zc, hay evidencias estadísticas para rechazar la Ho y confirmar la H1;

la media de la muestra actual es mayor que la de la población de los últimos 10 años.

En este problema, la información correspondiente a la σ2 poblacional formaba parte de los datos del

mismo. Sin embargo, en la mayoría de los casos, este dato se desconoce y el error estándar de la

media no es posible determinarlo, por lo que el investigador debe echar mano de otros recursos que

la estadística inferencial pone a su disposición, los cuales analizaremos a continuación.

Page 138: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

121

Si el tamaño de la muestra es grande (se considera una muestra grande la que es de al menos 30

sujetos), es factible hacer una estimación de la σ poblacional, y a partir de ella calcular el error

estándar de la media aritmética. Esto es factible por el poder de los números grandes (muestras

grandes) combinados con el Teorema Central del Límite.

Si la variable objeto de estudio está distribuida normalmente, o existe suficiente evidencia

estadística para considerar que esta situación está presente, se puede asumir que la distribución

muestral de las medias aritméticas de tamaño “n” se distribuye normalmente. En tal caso, la

prueba “z” es pertinente para llevar adelante la prueba de hipótesis.

E l C a s o D e D o s M e d i a s P o b l a c i o n a l e s

Muchas investigaciones en el campo de la psicología se refieren a la comparación de dos medias

poblacionales. Para tal efecto, el procedimiento es semejante al seguido en el ejemplo de una media

poblacional, aunque en este caso, se comparan las medias muestrales obtenidas de muestras que

fueron seleccionadas de dos poblaciones. Para el desarrollo de este tipo de prueba de hipótesis se

deben cumplir con los siguientes requisitos:

Los datos se distribuyen normalmente en ambas poblaciones o existen suficientes evidencias

que le permiten al investigador lanzar este supuesto

Los datos han sido medidos por lo menos en una escala de intervalos

Las σ2 poblacionales pueden ser conocidas como también desconocidas; por lo general son

desconocidas.

Si la σ2

es desconocida, pero la muestra es lo suficientemente grande, la S2 muestral puede ser

utilizada como estimadora de su correspondiente parámetro poblacional.

El estadístico requerido para desarrollar este tipo de prueba de hipótesis es:

, en donde, σ √

, que representa el error estándar de la diferencia de dos

medias.

A continuación se presenta un ejemplo:

El nivel promedio de la ansiedad evaluada en una muestra de 50 estudiantes femeninas de una

universidad fue de 68.2 puntos con una desviación estándar de 2.5 puntos. Una muestra

semejante de varones, obtuvo una media de 67.5 con una desviación estándar de 2.8. Verifique

la hipótesis de que los niveles de ansiedad de las mujeres fueron mayor que los de los varones,

con alfa de 0.05.

1. Hipótesis estadíst icas

Page 139: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

122

2. Nivel de significación

0 0

( )

3. Estadíst ico de prueba

, en donde, σ √

,

4. Regla de decisión

Rechazar Ho si la Zo es mayor que la Zc = 1.64

5. Resultados

0

0

0

0

0

0

√( )

0 ( )

0 0

0 0

0

6. Decisión:

En vista de que Zo = 1.32 es menor que la Zc = 1.64, no hay evidencias estadísticas para

rechazar Ho y considerar confirmada la hipótesis alterna. No hay diferencias

estadísticamente significativas entre las medias de la ansiedad de las estudiantes femeninas

y la de los estudiantes masculinos.

Como se pudo observar, ambos grupos satisfacen los requerimientos exigidos para desarrollar

pruebas de hipótesis para muestras grandes, o sea, que la aproximación normal es favorable: los

tamaños son mayores de 30, la variable de interés es continua porque la medición de la misma

refleja magnitud, y dicha variable ha sido medida en una escala de intervalos; se asume la

aleatoriedad.

Page 140: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

123

¿Pero qué sucede si la normalidad no se puede asumir, principalmente porque las muestras son

pequeñas, o sea n < 30? En tales casos, las propiedades de la normal no se satisfacen y se requiere

tomar en consideración la teoría estadística de las muestras pequeñas, la cual discutiremos, de

manera sencilla, a continuación.

P R U E B A D E H I P Ó T E S I S P A R A M U E S T R A S P E Q U E Ñ A S

En muchas ocasiones, los investigadores del comportamiento requieren desarrollar estudios

poblacionales, sin contar con los supuestos básicos de las grandes poblaciones: tamaño de muestra

grande, desviación estándar conocida, etc. En tales situaciones, los investigadores tienen que

fundamentar sus decisiones a partir de la información obtenida en las muestras pequeñas, las cuales

presentan limitaciones en lo referente a la aproximación normal, especialmente el Teorema Central

del Límite.

A pesar de estas limitaciones, el procedimiento de prueba de hipótesis no difiere con relación al

utilizado en las muestras grandes, excepto que no se puede asumir que las distribuciones muestrales

son normales y por lo tanto, las propiedades asociadas con la normalidad no se pueden sostener. En

el caso de las grandes muestras, se supone que las distribuciones muestrales son normales, mientras

que en las pequeñas muestras este supuesto no puede mantenerse, en vista de que ellas pueden

asumir diversas formas. A pesar de esta limitación, las muestras pequeñas mantienen una gran

relación con la teoría de las muestras grandes, a tal punto, que si la n muestral aumentara, se

aproximaría a la normal, siendo esta aproximación más evidente, a medida que n aumenta. Es como

si consideráramos que las muestras pequeñas se transforman y funcionan como muestras grandes.

G r a d o s D e L i b e r t a d

La introducción a la prueba de hipótesis para muestras pequeñas, nos obliga a analizar el concepto

de grados de libertad, que a partir de este momento se indicará por gl. Este concepto es aplicable

tanto en las muestras pequeñas como en las grandes, aunque su importancia fundamental radica en

las muestras pequeñas.

Si se tuviera la oportunidad de comparar la varianza de una población con la varianza de una

muestra (σ2 vs s

2) se observaría que entre ambas hay una diferencia, la cual se denomina sesgo, el

cual es más pronunciado a medida que n < N. Para corregir este sesgo muestral, la varianza

muestral se calcula dividiendo las diferencias cuadráticas obtenidas entre los puntajes X y la media

muestral entre n-1, de tal manera que la s2

se considera un estimador insesgado de la varianza

poblacional

∑( )

o sea, que corrige el sesgo y permite la utilización de la varianza de la muestra como un estimador

eficiente de la varianza muestral.

Page 141: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

124

Al denominador de la varianza muestral, n – 1, se le denomina grados de libertad (gl), y significa, el

número de observaciones muestrales que pueden variar libremente (asumir cualquier valor) cuando

se estima un parámetro poblacional.

Veamos un ejemplo: suponga que a cinco sujetos se les ha hecho una medición sobre un atributo

psicológico X, y que la media obtenida por los cinco sujetos fue de 25 puntos. ¿Cuántos puntos

ganó cada uno de los sujetos?

Sujeto X (puntuaciones arbitrarias)

1 15

2 16

3 29

4 30

5 ?

Los cuatro primeros sujetos pudieron obtener cualquier puntaje dentro del rango establecido por

la escala de medición utilizada. Pero el sujeto número 5, sólo tenía una opción: su puntaje debía

ser aquel que asegurara que al sumarse los 5 datos y dividirse entre n = 5, la media aritmética

sería igual a 25, tal y como se observa a continuación.

Sujeto X

1 15

2 16

3 29

4 30

5 35

que comprueba lo planteado anteriormente.

Page 142: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

125

Otro ejemplo de los gl lo podríamos observar en la propiedad de que la ∑d (sumatoria de las

diferencias) alrededor de la media real es igual a cero; para tal efecto, utilizaremos el ejemplo

anterior.

Sujeto X D

1 15 15-25=-10

2 16 16-25=-9

3 29 29-25=4

4 30 30-25=5

5 35 35-25=10

∑ ∑0

Como se puede observar, siempre que se estime un parámetro a partir de un valor muestral, podrán

variar libremente n – 1 de los valores muestrales; el último, corresponde al valor requerido para

calcular el estadístico muestral. Por esta razón, en las muestras pequeñas, al estimar el valor de la

varianza o la desviación estándar, es necesario que se utilicen los grados de libertad, con el fin de

que dichas medidas de variabilidad sean consideradas estimadoras eficientes de sus

correspondientes parámetros poblacionales. Recuerde que la variabilidad es fundamental en la

prueba de hipótesis, especialmente para determinar el error estándar de la estimación.

A partir de los conceptos presentados anteriormente, daremos inicio al estudio de las principales

pruebas de hipótesis para muestras pequeñas: la prueba “t” de student para una y dos medias, y la

prueba “F” para tres o más medias.

L a P r u e b a “ t ” d e S t u d e n t

La prueba “t” está respaldada por la distribución muestral del mismo nombre, en la cual las

variables se consideran normales, estandarizadas e independientes. Es una distribución continua y

se aplica tanto en muestras pequeñas como en las grandes. Varía entre -∞ hasta +∞, es simétrica con

una media igual a cero. En realidad es una familia de distribuciones, asociadas cada una de ellas a

su correspondiente grado de libertad; de acuerdo al tamaño de la muestra sus “s” varían. En

comparación con la normal, “t” es menos aguda en el centro que la normal y es más extendida. A

medida que n aumenta, la curva de “t” se aproxima a la curva normal. Sus valores estandarizados se

denominan “t” y tiene una Tabla asociada con las probabilidades de cada uno de estos valores.

Para desarrollar pruebas de hipótesis con “t”, es necesario tener evidencias de que las varianzas

muestrales no son estadísticamente diferentes. A esta condición se le denomina homogeneidad de

las varianzas, y debe ser comprobada en cada prueba; más sin embargo, en la mayoría de las

ocasiones los investigadores suponen que dicha condición está presente siempre y cuando las

muestras comparadas estén formadas por la misma cantidad de sujetos (n).

Además, debe conocerse la media de la(s) muestra(s), aunque la σ es desconocida. La misma será

estimada a partir de la “S” de la muestra tomando en consideración los grados de libertad (gl).

Page 143: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

126

Es importante señalar que la Distribución “t” de Student cuenta con una Tabla de valores “t”

críticos, definida por los grados de libertad y el nivel de significación, tanto para una como para dos

colas. La comparación de los valores t observados y críticos, determinará si se rechaza o no la Ho.

P r u e b a “ t ” p a r a e l c a s o d e u n a m e d i a p o b l a c i o n a l

El estadístico “t” para el caso de una media poblacional es el siguiente:

( )

, en donde ∑ (∑ )

; y

Hay ocasiones en que se sospecha que una media poblacional conocida ha sufrido cambios: ya sea a

favor o en contra de los valores conocidos sobre la misma. En estos casos, se sigue el procedimiento

de los 5 pasos estudiados en las muestras grandes, tal y como lo presentamos en el siguiente

ejemplo a continuación.

Una investigadora sospecha que el peso corporal de una población de adolescentes infractoras

internadas en un Centro de Observación, ha sufrido cambios recientemente. La última medición

desarrollada hace tres años, señalaba un promedio 61 kilos y no se tenía información sobre la

desviación estándar del pesos corporal. La investigadora toma una muestra aleatoria de 8

menores y mide sus pesos corporales, obteniendo los siguientes resultados: 63, 60, 59, 65, 67,

66, 59 y 65. Con estos datos desarrolla una prueba de hipótesis con alfa (α) = 0.01. ¿A qué

conclusión llegó la investigadora?

Para desarrollar la prueba de hipótesis, es recomendable que resuma los datos que va a requerir y

con los mismos desarrolle la prueba.

DATOS

( )

( )

0

1. Hipótesis estadíst icas

2. Nivel de significación

0 0

0

Page 144: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

127

3. Estadíst ico de prueba

( )

, en donde ∑ (∑ )

4. Regla de decisión

Rechazar Ho si “to” > 3.50 ó si “to” < -3.50

5. Resultados

( 0 )

√ ( )

6. Decisión:

En vista de que “to” = 1.74 es < que tc = 3.50, no hay evidencias estadísticas para rechazar

la Ho. La µ poblacional del peso no es diferente que 61, por lo tanto, la sospecha de la

investigadora no se ha demostrado

Como se pudo observar, se trató de una prueba de hipótesis de una media poblacional de dos colas.

El procedimiento es semejante al seguido para muestras grandes.

P r u e b a “ t ” p a r a e l c a s o d e d o s m e d i a s i n d e p e n d i e n t e s

Este caso se refiere a la situación en la que el investigador desea determinar si dos medias

muestrales difieren en alguna medida entre ellas, y si esa diferencia es significativa, o sea, que va

más allá de una simple fluctuación muestral. Está claro que las dos medias provienen de dos

muestras independientes las que presentan los efectos de dos condiciones diferentes; el interés

radica en determinar, de acuerdo a la hipótesis planteada, si ambas medias son estadísticamente

diferentes.

Para estos casos se sugiere que se presenten las siguientes condiciones previas:

Las muestras son pequeñas y se desconoce la varianza poblacional de cada una,

Los sujetos han sido, preferiblemente seleccionados aleatoriamente de la población y

distribuidos de la misma manera en ambas condiciones.

A continuación se presenta un ejemplo de una prueba de hipótesis para dos medias.

Un Psicólogo Escolar considera que el nivel de ansiedad de los hombres es mayor que el de las

mujeres, antes de desarrollar un examen. Para demostrar esta sospecha, aplica una prueba de

ansiedad antes de un examen de física a una muestra de 10 estudiantes varones y 10 estudiantes

Page 145: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

128

mujeres, seleccionados ambos grupos de manera aleatoria de sus correspondientes poblaciones.

Los resultados obtenidos en la medición de la ansiedad fueron los siguientes:

Grupos Puntuaciones de ansiedad

Hombres 10 10 12 6 8 7 9 9 7 11

Mujeres 6 6 4 3 6 8 6 5 4 8

Con los resultados anteriores, se desarrolló una prueba de hipótesis con un alfa α de 0.05. ¿A

qué conclusión llegó el Psicólogo?

Se recomienda que resuma los datos que necesitará para desarrollar su prueba de hipótesis.

Hombres Mujeres

0 0

1. Hipótesis estadíst icas

2. Nivel de significación

0 0

0 0

3. Estadíst ico de prueba

, en donde √(

) (

); y ∑

(∑ )

4. Regla de decisión

Rechazar Ho si to > 1.73

5. Resultados

( )

( )

√(

)(

0

0) 0 0

Page 146: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

129

0 0

6. Decisión:

En vista de que to = 4.12 es > que tc = 1.73, se rechaza Ho y se confirma H1: la media de

la ansiedad de los hombres es > que la media de la ansiedad de las mujeres.

P r u e b a “ t ” p a r a d o s m u e s t r a s c o r r e l a c i o n a d a s

Se considera que dos muestras están correlacionadas, si los resultados obtenidos en una de ellas

afectan los resultados obtenidos en la otra. Esto es característico de las situaciones siguientes:

Un mismo grupo es medido dos veces y se intenta determinar las diferencias observadas entre

las medias de ambos. Tal es el caso de las investigaciones de carácter experimental o cuasi

experimental, en las cuales la condición de antes-después es característica.

Cuando se organizan dos grupos “apareados” y se intenta establecer las diferencias existentes

entre ambos. Apareados debe ser interpretado como la situación en que se intenta que parejas de

sujetos que pertenecen a grupos diferentes, mantengan las mismas características que rivalizan

con la variable independiente (por ejemplo, CI, género, edad, aptitudes, etc.). En estos casos, la

aleatoriedad no fue el factor que distribuyó a los sujetos de manera semejante en cada muestra,

sino la acción del investigador: el apareamiento.

En estas situaciones, no se cuenta con la condición previa de independencia estadística que se

considera se alcanza plenamente con la aleatoriedad, y se utiliza una forma de “t” de student,

que además de tomar en consideración la magnitud de las diferencias entre ambas mediciones,

toma en consideración la dirección de la misma a través del signo. Para estos casos, los grados

de libertad son iguales a n-1

A continuación presentamos un problema en el cual, una muestra de sujetos se mide antes y después

de aplicada una intervención o tratamiento. Ambas mediciones se desarrollan en el mismo grupo de

sujetos, lo que hace de las mismas mediciones correlacionadas.

A fin de motivar a los ciudadanos al ahorro en el consumo de luz , una ONG estudia la idea de

emprender una campaña nacional a favor del ahorro de la misma. Sin embargo, antes de

emprender dicha campaña, la organización decide realizar un experimento que le permita

evaluar la eficiencia de la campaña. Para el experimento, realiza la campaña de ahorro de luz

en un área geográfica representativa. Doce (12) familias de esa área son elegidas al azar y se

determina el costo (en balboas) del consumo durante el mes anterior al lanzamiento de la

campaña de publicidad; al mes siguiente de la campaña de publicidad, nuevamente se

determina el costo del consumo. La idea de los investigadores es la de determinar si hubo o no

diferencias entre el consumo de luz, antes y después de la campaña publicitaria, y de esta forma,

evaluar la capacidad de dicha campaña para modificar los hábitos de consumo. Como se puede

observar, se trata de 12 personas medidas dos veces, antes y después, caso típico de muestras

correlacionadas. A continuación se presenta un ejemplo de la prueba de hipótesis

correspondiente

Page 147: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

130

Familia Antes

(costo) Después (costo)

Diferencia D

Diferencia D2

A 65 58 7 49

B 53 48 5 25

C 61 63 -2 4

D 72 68 4 16

E 45 46 -1 1

F 58 52 6 36

G 68 65 3 9

H 55 50 5 25

I 58 59 -1 1

J 64 60 4 16

K 66 68 -2 4

J 42 35 7 49

Totales ∑ 235

1. Hipótesis estadíst icas

0

0

2. Nivel de significación

0 0

0

3. Estadíst ico de prueba

en donde √

( ); y ∑

(∑ )

4. Regla de decisión

Rechazar H0, si to > 2.201 ó rechazar H0, si to < 2.201

5. Resultados

( )

Page 148: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

131

( ) 00

00 0

6. Decisión:

En vista de que to = 2.90 > tc = 2.201, se rechaza H0 y se confirma la H1. La campaña

publicitaria si afectó a la comunidad experimental, en vista de que se disminuyó el consumo

de luz en al grupo experimental.

Como se pudo observar en el ejemplo anterior, el procedimiento de prueba de hipótesis se mantiene

igual que en los casos anteriores, haciéndose las modificaciones requeridas por el tipo de problema

y el modelo estadístico a utilizar, siendo en éste caso la “t” de student para datos correlacionados.

Este ejemplo se aplicó en un caso de antes-después; de igual manera se hubiese procedido si se

tratara de grupos apareados. Cómo se pudo observar, para éste caso, los grados de libertad son

iguales a n – 1.

P r u e b a “ t ” p a r a c o r r e l a c i o n e s

Las correlaciones son uno de los procedimientos más utilizados en el análisis de resultados

obtenidos en investigaciones del comportamiento. Siendo el comportamiento humano un factor

afectado por un número plural de variables, es evidente que las mismas interactúan mutuamente y

se afectan unas a otras, asociándose de diversas maneras. La correlación es una técnica estadística

que permite estudiar el nivel de asociación de dos o más variables. Para efectos de este curso de

prueba de hipótesis, vamos a estudiar si el coeficiente de correlación obtenido entre dos variables es

estadísticamente diferente que cero y por lo tanto, si la asociación de estas variables es válida.

Para representar al coeficiente correlación se utilizará en símbolo rxy, y la prueba de hipótesis se

desarrollará siguiendo el mismo procedimiento que en los casos anteriores: los cinco pasos. La H0

que dice que entre las dos variables no existe correlación, contra las hipótesis alternas de que: 1) la

H1: r > 0 si se espera una correlación positiva, 2) H1: r < 1 si la correlación esperada es menor que 1,

3), r ≠ 0 si el investigador sospecha de que hay correlación pero no puede señalar de antemano una

dirección en especial. Para este caso, los grados de libertad son iguales a n – 2. A continuación

presentamos un ejemplo.

A una muestra de 20 estudiantes universitarios se les aplicó una prueba de razonamiento verbal,

con el fin de determinar si esta variable se asocia positivamente con los puntajes

correspondientes al índice académico de los dos primeros semestres de una carrera

universitaria. El coeficiente de correlación obtenido fue de 0.38. ¿Es esta correlación

estadísticamente significativa, o sea, es verdaderamente positiva? Sea alfa igual a 0.05.

1. Hipótesis estadíst icas

0

0

Page 149: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

132

2. Nivel de significación

0 0

0 0

3. Estadíst ico de prueba

4. Regla de decisión

Rechazar Ho si to > tc = 2.101

5. Resultados

0

√ (0 )

0

0

0

6. Decisión:

En vista de que to = 1.810 es < que tc = 2.101, no hay evidencias para rechazar la H0; la

correlación entre estas variables no es diferente que cero.

Como se ha podido observar, en el caso de una correlación es posible determinar si la relación entre

las variables es estadísticamente significativa o es simplemente una fluctuación de la muestra, como

lo fue el caso anterior. De esta misma manera, pero con su estadístico correspondiente, se puede

determinar la significancia de otros valores correlacionales (comparación de dos correlaciones) y de

parámetros de regresión (a0 y a1), los cuales no serán tratados en este libro.

C O N C E P T O S I M P O R T A N T E S

Muestras grandes

Muestras pequeñas

Sesgo muestral

“t” de Student

Homogeneidad de varianzas

Page 150: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

133

E J E R C I C I O S P R Á C T I C O S

M u e s t r a s g r a n d e s : p r u e b a s d e h i p ó t e s i s p a r a m e d i a s

1. Una muestra de 42 sujetos infractores, seleccionada de una población de sujetos privados de

libertad, obtuvo una media de 42 con una desviación típica de 9, en una prueba de razonamiento

abstracto. En los últimos 5 años, los resultados obtenidos indicaban una media de 48. ¿De

acuerdo a estos resultados se puede concluir que el promedio de la población de infractores ha

disminuido en comparación de los últimos cinco años? Sea alfa 0.05.

2. Los aspirantes a ingresar al servicio de Guardia Costera de los últimos 10 años obtuvieron un

promedio de ansiedad de 26 puntos con una desviación típica de 4 puntos. Se seleccionó una

muestra de 45 sujetos que aspiraron en el presente año, los cuales obtuvieron una media de 29

puntos. De acuerdo a estos resultados se puede considerar que los niveles de ansiedad de los

aspirantes han aumentado en comparación con los años anteriores? Utilice alfa de 0.05 y 0.01.

3. Un estudio desarrollado en 75 personas que residen en una comunidad sub urbana indicó que el

promedio de ingreso familiar fue de B/235.00 mensuales, con una desviación típica de 25.00.

Verifique la hipótesis de que el promedio salarial en ésta comunidad es menor a B/250.00. Sea

alfa = 0.05.

4. Se analizó el rendimiento académico de dos muestras independientes de estudiantes

universitarias de sexo femenino, pertenecientes a la misma carrera en una Facultad, pero

matriculadas en turnos diferentes. En el grupo matutino, el promedio del rendimiento

académico fue de 3.66 con una desviación estándar típica de 0.15. Por otro lado, el grupo

vespertino obtuvo una media de 3.53 con una desviación típica de 0.19. De acuerdo a estos

resultados, ¿existen diferencias en el rendimiento académico de ambos grupos? Sea alfa = 0.05

y 0.01.

5. Un grupo de estudiantes de primer ingreso a la Facultad de Ciencias Sociales se dividió

aleatoriamente en dos, uno denominado experimental y otro control. El grupo de experimental

constituido por 40 personas, recibió en el verano un programa de matemáticas generales,

mientras que el grupo de control, compuesto por 43 personas, recibió un placebo. Al finalizar el

primer semestre, se determinó el promedio de la puntuación final obtenida por cada grupo en el

curso de de Estadísticas Aplicadas. El grupo experimental obtuvo una media de 67 con una

desviación estándar de 9. Por otro lado, el grupo de control obtuvo un promedio de 62 con una

desviación típica 12. Con alfa de 0.05 determine si hay diferencias entre los dos grupos con

relación al conocimiento alcanzado en la asignatura. Sea alfa = 0.05 y 0.01.

Page 151: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

134

6. Se desarrolla una investigación para determinar si las horas dedicadas diariamente al estudio

afectan el rendimiento académico de los estudiantes. Se distribuyeron aleatoriamente en dos

grupos a 30 estudiantes, del mismo nivel académico y que tenían al mismo profesor: 15 en el

Grupo A y 15 en el Grupo B. El Grupo A dedicó 5 horas diarias al estudio, mientras que el

grupo B dedicó 3.5 horas diarias a la misma actividad. Al terminar el año académico se evaluó

el rendimiento promedio de cada grupo, los cuales se presentan a continuación:

Grupo Promedio Desviación

A 3.97 0.56 B 3.77 0.87

Con alfa de 0.05, determiné si el promedio del grupo A fue mayor que el grupo B.

M u e s t r a s p e q u e ñ a s : p r u e b a s d e h i p ó t e s i s p a r a m e d i a s y

c o r r e l a c i o n e s

7. Los problemas 1, 2, 3, desarróllelos utilizando la distribución “t” de Student

8. Un Psicólogo Industrial está interesado en evaluar la efectividad de un programa de incentivos

en la producción de vestidos en una fábrica. Para tal efecto, seleccionó a 26 operarios para que

trabajaran siguiendo el plan tradicional (T) de incentivos, y por otro lado, seleccionó a otros 26

operarios a quienes pusieron a trabajar con el nuevo plan de incentivos (N). El programa duró

10 días y a continuación se presentan el número de trajes confeccionado por cada operario, en

cada uno de los planes:

Plan T 75 72 73 76 78 72 80 74 76 75 Plan N 80 83 84 78 79 81 84 85 78 56

Los salarios por hora para ambos grupos eran iguales; la diferencia la hacía el plan de

incentivos. ¿Se puede concluir que el nuevo plan de incentivos es más eficiente y

productivo que el tradicional? Sea alfa = 0.05

9. Una investigación se diseñó para establecer si cierto tipo de comportamiento estaba o no

influenciado por una droga. La variable criterio fue el número de intentos que se requerían para

alcanzar el comportamiento evaluado. Se organizaron dos grupos: el experimental (Ex) que

recibió la droga, y el control (CL) que recibió un placebo. Los resultados se presentan a

continuación:

Número de intentos

EX 6 8 14 9 10 4 7 CL 4 5 3 7 4 2 1 3

Con alfa de 0.01, determine si hay diferencias entre los promedios de intentos entre los

dos grupos.

Page 152: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

135

10. Un Psicólogo Clínico desarrolla un estudio del autoconcepto familiar en dos grupos de sujetos

adultos con problemas de adicción: un grupo masculino (A) y otro femenino (B) Los resultados

obtenidos con la Escala de Autoconcepto Tennessee fueron los siguientes:

A 72 83 57 71 72 68 70 68 77 67

B 36 52 41 44 39 51 47 41 55 46

Con alfa de 0.05, determine si hay diferencias en las medias del autoconcepto familiar

entre ambos grupos.

11. En un estudio dirigido para determinar la efectividad de una nueva dieta, una compañía de

seguros seleccionó una muestra de 10 sujetos con sobrepeso entre las edades de 40 y 50 años.

Se les midió el peso al iniciar el tratamiento (A) y se volvió a medir 60 días después (D). Los

resultados fueron los siguientes:

A 202 237 173 161 185 210 209 191 200 189 D 180 221 175 158 180 197 205 196 185 187

Con alfa de 0.05, determine si la nueva dieta produjo los resultados esperados.

12. Una muestra de 10 niños fueron diagnosticados inicialmente con el trastorno de Déficit de

Atención tipo Hiperactivo-Impulsivo. Se kles aplicó un tratamiento co0n el fin de disminuir los

síntomas de éste trastorno. A continuación se presentan los puntajes obtenidos en la Escala de

Conners antes y después del tratamiento.

Antes 80 75 78 82 71 79 73 86 79 84

Después 70 71 70 71 71 73 74 78 74 79

Con alfa de 0.05, determine si el tratamiento logró disminuir los puntajes obtenidos en la

prueba.

13. Dos investigadores del comportamiento desarrollaron un estudio para determinar si existe una

correlación significativa entre ansiedad y razonamiento lógico. Seleccionaron una muestra de

28 sujetos, obtuvieron mediciones de estas variables y correlacionaron las mismas,

obteniéndose u coeficiente de correlación r=0.30. Determine la significancia de esta

correlación, con alfa de 0.05.

14. Una muestra de 45 estudiantes fue evaluada en los factores depresión y rendimiento en

matemáticas. Los resultados obtenidos obtuvieron un coeficiente de correlación r= 0.29. Es ésta

correlación significativa, a un nivel alfa de 0.05?

Page 153: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

136

CAPÍTULO 13

ANÁLISIS DE LA VARIANZA

Las pruebas de hipótesis analizadas en los capítulos anteriores, hacían énfasis en la comparación de

la media aritmética de una muestra con una media poblacional, o se comparaban dos medias

aritméticas provenientes de dos muestras. Estas situaciones se analizaron tanto para el caso de

muestras grandes (n>30 sujetos), en los cuales se utilizaba el estadístico “z” y la curva normal como

modelo de probabilidades, al igual que para las muestras pequeñas (n≤ 30) casos en los que se

utilizaba la prueba “t de student”, respaldada por el modelo de probabilidades denominado t de

student. En ambos casos, el número máximo de medias aritméticas que se podían comparar era de

dos; pero si hay tres o más medias, ninguno de los dos modelos probabilísticos anteriormente

discutidos, sería el adecuado para la comparación de dicho número de medias. En estos casos, el

procedimiento adecuado se denomina ANOVA o Análisis de la Varianza, que utiliza como modelo

de probabilidades una distribución denominada F de Fisher y la Prueba F como procedimiento de

análisis estadístico.

L A D I S T R I B U C I Ó N F

El ANOVA es un procedimiento de análisis estadístico que se aplica cuando estamos interesados en

determinar si tres o más medias son estadísticamente diferentes. Aunque este procedimiento permite

determinar la diferencia entre las medias, se vale de la varianza de los datos para determinar si hay

o no diferencias. El procedimiento permite obtener una Fo que proviene del cociente de la

estimación de dos varianzas que provienen de la misma población:

1. : que es la estimación de la varianza que proviene de los efectos observados en las muestras

que se están analizando, los cuales son independientes entre sí,

2. : que es la estimación de los errores aleatorios dentro de cada una de las muestras analizadas.

Esta relación se puede presentar a través de la siguiente ecuación:

El resultado obtenido a través de este cociente, Fo, se compara con la F crítica (Fc) obtenida de la

tabla correspondiente, de acuerdo al nivel alfa establecido y los grados de libertad correspondientes

al problema. Esto significa que, al igual que como sucede con la normal y la “t”, existe una

distribución muestral resumida en una tabla, en la cual se asocian los valores teóricos de F con sus

correspondientes probabilidades, dando como resultado los valores Fc que son los que separan la

zona de rechazo de Ho con la zona de no rechazo de dicha hipótesis.

Por ser la Prueba F un procedimiento aplicado en muestras pequeñas, los valores de Fc variarán de

acuerdo con los grados de libertad, que para efectos de esta distribución, se deben tomar en cuenta

dos valores: los gl para el numerador (efectos de cada muestra) que son iguales a n1-1 y los gl para

el denominador (efectos aleatorios dentro de cada muestra) que son iguales a n-1.

Page 154: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

137

La prueba F tiene algunas propiedades particulares que pasaremos a señalar a continuación:

no tiene valores negativos, por ser el cociente de dos σ2,

es una distribución sesgada positivamente

el valor mediano de F es aproximadamente igual a 1

Para la prueba F existe una familia de curvas, tal y como sucede con la “t”, aunque en este caso, hay

un valor de F para cada combinación de S2 en el numerador y en el denominador, lo cual está

debidamente contemplado en las tablas de valores críticos de F. Para determinar si se rechaza o no

la Ho, se compara el valor Fo que proviene de los datos experimentales, con la Fc de la tabla; si Fo

> Fc, se rechaza Ho y se considera confirmada la H1, lo cual significa que por lo menos una de las

medias es estadísticamente diferente al resto.

Es importante destacar que la H1 no se presenta direccionadamente, o sea, que no se plantea hacia

la derecha o hacia la izquierda, tal y como sucede con “t”. Esto se debe a que Fo por provenir de

comparaciones de S2, siempre tendrá valores positivos y los valores críticos de la tabla siempre

serán positivos. Por lo tanto, la H1 sería del tipo: µ1 ≠ µ2 ≠ …….≠ µk. Si se diera el caso de que se

rechaza la Ho y se confirma la H1, los resultados indican únicamente que por lo menos una media

aritmética es diferente; para determinar cuál o cuáles son las diferentes, hay que desarrollar otras

pruebas adicionales que arrojarían luces sobre las diferencias existentes en el modelo.

Los valores críticos de F (Fc), asociados con la distribución de probabilidad F, se presentan

resumidos en Tablas para valores α de 0.05 y 0.01, los cuales están relacionados con los grados de

libertad. Para efectos de la distribución F, los grados de libertad dentro se refieren a los efectos

dentro de los grupos o de error (gldentro); por otro lado, los grados de libertad entre, están

asociados con los efectos entre los tratamientos. En algunos casos, la Tabla se presenta para 0.05 y

0.01 de manera independiente, pero en otros casos, en una misma Tabla, se presentan los dos alfas

para cada grado de libertad. En estos casos, 0.05 se coloca arriba y 0.01 se coloca abajo, y en

muchas ocasiones el valor está en negrita.

A continuación presentaremos un ejemplo de este último tipo de organización de la Tabla F, aunque

el estudiante debe estar preparado para interpretar los valores de Fcrítica cuando estos provienen de

tablas separadas.

Page 155: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

138

Ejemplo de la Tabla de valores críticos de la Distribución F

gl

dentro(denominador)

gl entre (numerador)

1 2 3 4 5 …..∞…

1 161

4052

200

4999

216

5403

225

5625

230

5764

254

6366

2 18.51

98.49

19.00

99.00

19.16

99.17

19.25

88.25

19.30

99.30

19.50

99.50

3 10.13

34.12

9.55

30.82

9.28

29.46

9.12

28.71

9.01

28.24

8.53

26.12

4 7.71

21.20

6.94

18.00

6.59

16.69

6.39

15.98

6.26

15.52

5.63

13.46

5 6.61

16.26

5.79

13.27

5.41

12.06

5.19

11.39

5.05

10.97

4.36

9.02

……∞…… 3.84

6.64

2.99

4.60

2.60

3.78

2.37

3.32

2.21

3.02

1.00

1.00

Para utilizar la Tabla de F, se combinan los grados de libertad entre, con los grados de libertad

dentro. Por ejemplo, si un experimento presenta glentre=3 y gldentro= 5, con alfa de 0.05, la F(c) =

5.41. Debe recordar que los valores críticos se presentan en pares: el primero corresponde a 0.05 y

el segundo a 0.01 (negrita).

Otro aspecto a destacar es que la Prueba F se utiliza para evaluar los efectos de una variable

independiente a varios niveles, al igual que en los casos en que hay más de una variable

independiente también a varios niveles. Para ambos casos, los efectos de la(s) variable(s)

independiente(s) se asocian con una sola variable dependiente; si hay más de una variable

dependiente, tendríamos que analizar dichos efectos a través de modelos multivariados, los cuales

escapan a los objetivos de este libro.

P r i n c i p i o s d e l A N O V A

Tal y como se mencionó anteriormente, el ANOVA es una técnica estadística que permite evaluar

experimentos en los que intervienen tres o más grupos. El objetivo final es el de establecer si las

medias aritméticas de dichos grupos difieren o las mismas son estadísticamente iguales. Si nos

refiriéramos a tratamientos psicológicos, estaríamos interesados en determinar a través de las

medias aritméticas, si los tratamientos ejercen efectos diferentes sobre las muestras o si todos ellos

Page 156: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

139

producen efectos semejantes. Existen diversos tipos de ANOVA que se aplican para situaciones

experimentales en las cuales hay tres o más muestras. En primera instancia, presentaremos y

discutiremos el modelo denominado ANOVA SIMPLE O EN UN SOLO SENTIDO,

A n o v a S i m p l e o e n u n s o l o s e n t i d o

Esta técnica de análisis estadístico se caracteriza porque se refiere a una sola fuente de variación, o

sea, una variable independiente a distintos niveles, tal y como se puede observar en el siguiente

ejemplo.

Tres psicólogos de la Escuela de Psicología han desarrollado, de manera independiente, tres

tratamientos dirigidos a disminuir la ansiedad en los estudiantes que desarrollan las pruebas de

admisión a dicha escuela. Como se puede observar, se trata de una sola variable independiente, la

cual se aplica en tres niveles, considerándose como nivel, cada tratamiento desarrollado por cada

uno de los profesores. Se supone que los tres tratamientos van dirigidos a modificar una sola

variable dependiente: la ansiedad. El experimento trata de verificar el efecto de los tratamientos

sobre la ansiedad y si se observan diferencias entre dichos tratamientos con relación al efecto

producido en la ansiedad. Como son tres grupos, se ha decidido aplicar una ANOVA para

determinar la efectividad de los tratamientos.

Para que ANOVA pueda aplicarse de manera válida, es necesario que se cumplan algunos

requisitos de carácter metodológico y estadístico:

Las muestras deben estar constituidas preferiblemente por igual número de sujetos,

Los sujetos deben ser elegidos aleatoriamente para cada muestra y los tratamientos deben ser

asignados de la misma forma para cada una de ellas,

Se supone o demuestra estadísticamente, que las varianzas de los grupos son iguales; a esto, se

le denomina homogeneidad de las varianzas

Los grupos se suponen independientes entre sí, o sea, que cada grupo recibe un nivel de la

variable independiente diferente al recibido por cualquiera de los otros grupos.

El objetivo del ANOVA es el de establecer cuánto de la variabilidad observada en los grupos se

debe a los efectos entre los tratamientos y cuanto se debe a efectos aleatorios dentro de los

tratamientos. El supuesto básico es que las medias deben ser afectadas por la calidad de los

tratamientos y no las varianzas dentro de cada grupo. La siguiente figura describe el procedimiento

del ANOVA simple:

Page 157: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

140

ESTRUCTURA DEL ANOVA

SC total

SCentre

SCdentro

S2entre

S2dentro

Fobt= S2entre

S2dentro

•SCtotal: Variabilidad total de los datos

•Scentre: Variabilidad entre lo grupos

•Scdentro: Variabilidad dentro de los grupos

•S2entre: Varianza entre los grupos: S2B

•S2dentro: Varianza dentro de los grupos: S2w

•Fobt: Razón F

La SC total se puede interpretar como la totalidad de la variabilidad observada en las puntuaciones

individuales, sin tomar en consideración cuánto de esta variabilidad proviene de los efectos de

tratamiento y cuánto proviene de la aleatoriedad dentro de las muestras: es una variabilidad confusa

en la cual no se discrimina entre las fuentes de variabilidad. El ANOVA divide esta variabilidad en

dos componentes: el que corresponde a los efectos de los tratamientos entre cada uno de los grupos

(SCentre), y el que corresponde a la variabilidad proveniente del azar dentro de cada grupo (SCdentro).

Posteriormente se determina la cantidad de varianza que proviene de cada fuente: S2entre que es el

numerador, y la S2

dentro que es el denominador. Se dividen ambas varianzas y se obtiene la

La comparación de la Fo con la Fc determina si se rechaza o no se rechaza la Ho siguiendo el

modelo que a continuación presentamos:

Si Fo > Fc, se rechaza la Ho,

Si Fo ≤ Fc, no se rechaza la Ho

Para determinar la variabilidad proveniente de cada una de las fuentes, SCentre, SCdentro y SCtotal, se

utilizan las siguientes fórmulas:

[∑(∑ )

]

(∑ )

∑ [∑

(∑ )

]

Page 158: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

141

Una vez desarrollada la partición de la varianza, que no es otra cosa que determinar cuánto de la

varianza total proviene de las dos fuentes principales: tratamientos y error, se organizan estos datos

en un cuadro resumen que permite la integración de todos los elementos requeridos para rechazar o

no la hipótesis nula, o sea: verificar o no la hipótesis alterna. El cuadro resumen está constituido por

los siguientes elementos:

CUADRO RESUMEN DEL ANOVA

Fuente SC Gl S2 Fo

Entre grupos [∑(∑ )

] (∑ )

Dentro de grupos ∑ [∑

(∑ )

]

Total

La Fo se compara con la F de la Tabla de Fisher, la cual se denomina Fcrítica (Fc): si la Fo es > que la

Fc, se rechaza la Ho que dice que todas las medias son iguales: Ho: µ1=µ2=…….=µk, y se considera

confirmada la H1 que dice que por lo menos una de las medias es diferente; µ1≠µ2….≠µk. En este

caso, los resultados indican que hay medias que son diferentes, pero no da información sobre cuál o

cuáles medias lo son. Para determinar esta(s) diferencia(s), se requiere la aplicación de pruebas

especializadas que permitirán obtener dicha información. Para efectos de este texto, presentaremos

la Prueba de Tukey como un ejemplo de pruebas especiales para determinar cuáles medias son las

diferentes. Si la Fo no fuese significativa, o sea, que la misma es igual o menor que la Fc, se ha

determinado que las medias son iguales estadísticamente y el ANOVA finalizaría con este

indicador.

A continuación presentamos los resultados del experimento de la ansiedad, al que nos referimos con

anterioridad, y el desarrollo estadístico del Anova Simple correspondiente:

Page 159: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

142

Tres psicólogos clínicos han desarrollado, de manera independiente, tres tratamientos para

reducir la ansiedad en estudiantes que aspiran a ingresar a la Escuela de Psicología. Los

tratamientos se aplican a tres muestras aleatorias de aspirantes, y posteriormente se les evalúa

su nivel de ansiedad, con el fin de evaluar si los tratamientos ejercen distintos efectos sobre los

grupos. A continuación se presentan los resultados obtenidos.

RESULTADOS DE LOS TRATAMIENTOS APLICADOS

T1 T2 T3

12 15 9 14 14 6 15 17 7 14 18 8 13 15 7 12 19 8 13 20 6 10 17 7 12 16 8

n 9 9 9 115 151 66 ( ) 13225 22801 4356 1487 2565 492

12.78 16.78 7.33

1.48 1.99 1.00

Pasos sugeridos para el desarrollo de anova simple

A partir de las puntuaciones originales obtenidas por cada sujeto en cada tratamiento, determine los

estadísticos básicos para el cálculo de ANOVA, tal y como se muestra en la Tabla anterior. Estos

estadísticos permitirán la partición de la varianza y el desarrollo del cuadro resumen, anteriormente

explicados.

A continuación se desarrolla la prueba de hipótesis.

1. Hipótesis estadíst icas

2. Nivel de significación

0 0

0

Page 160: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

143

3. Estadíst ico de prueba

4. Regla de decisión

Rechazar H0, si Fo > Fc = 3.40

5. Resultados

[

]

( )

(

) ( 0 ) 0

( 0

)

0

CUADRO RESUMEN DEL ANOVA

Fuente SC Gl S2 Fo

Entre grupos 404.51 0

0

0

Dentro de grupos 57.12

Total 461.63

6. Decisión:

En vista de que Fo = 84.98 > Fc = 3.40, se rechaza la H0 y se confirma la H1: por lo menos

una de las medias es estadísticamente significativa.

De esta manera se ha concluido con esta etapa del ANOVA, y en vista de que los resultados son

significativos, es necesario determinar estadísticamente cuál o cuáles medias han resultado

diferentes. Este objetivo se alcanza desarrollando pruebas de significación que permiten comparar

las medias entre sí, tales como: la Prueba de Tukey, la Prueba de Newman-Keuls, la Prueba “t” si la

comparación es planeada previamente, la prueba de Scheffe, etc. En este caso, desarrollaremos la

prueba de Tukey para dos medias, por ser la misma de fácil desarrollo y comprensión.

Es importante que el estudiante recuerde que si la Fo no es significativa, no hay que desarrollar

ninguna prueba de comparación de medias, en vista de que la hipótesis nula no se ha rechazado, lo

cual indica que las medias aritméticas analizadas no son estadísticamente diferentes.

L a P r u e b a d e c o m p a r a c i ó n d e d o s m e d i a s d e T u k e y .

La prueba de Tukey ha sido diseñada para comparar todos los pares de medias aritméticas

provenientes de un experimento; además, requiere que los tamaños muestrales sean iguales para

Page 161: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

144

todas las muestras que participan del experimento. El estadístico de prueba es Qobtenida (Qo), cuya

fórmula es la siguiente

La prueba Q se utiliza para comparar las medias tomadas de dos en dos y su valor será siempre

positivo en vista de que en el numerador, la primera media será siempre la mayor y la segunda será

la media menor. Además, para estimar el error estándar en el denominador, se utiliza la varianza

dentro de los grupos (S2

d) que ya fue determinada en el cuadro resumen.

La Qo se compara con la Qcrítica (obtenida de la Tabla Q de Rangos estudiantizados) a la cual se

ingresa con el número de medias del experimento (columnas) y los gl dentro para las filas. En el

punto en que se cruzan ambos valores, se obtiene la Qcrítica (Qc) o Q de la tabla, el cual será el

criterio de comparación de la Qo. Si la Qo es > que la Qc, se rechaza la H0 que dice que ambas

medias son iguales y se verifica la H1 que dice que dichas medias son diferentes, específicamente, la

primera es mayor que la segunda. A continuación se presenta la aplicación de la prueba Q,

utilizando el ejemplo con el que se desarrolló el ANOVA.

7. Prueba Q

Las tres medias ordenadas de mayor a menor:

0 0

( )

1. Comparación

00

0

Decisión: en vista de que Qo = 7.84 > Qc = 3.53, se rechaza Ho y se confirma H1. La media

del tratamiento 2 es mayor que la del tratamiento 1. El tratamiento 1 presentó un promedio

de ansiedad menor que el tratamiento 2. Dicho tratamiento es más efectivo en la reducción

de la ansiedad.

2. Comparación

0

Decisión: en vista de que Qo = 18.53 > Qc = 3.53, se rechaza Ho y se confirma H1. La

media del tratamiento 2 es mayor que la media del tratamiento 3. El tratamiento 3 presentó

Page 162: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

145

un promedio de ansiedad menor que el del tratamiento 2. Este tratamiento es más efectivo

en la reducción de la ansiedad.

3. Comparación

0 0

Decisión: en vista de que Qo = 10.69 > Qc = 3.53, se rechaza Ho y se confirma H1. La

media del tratamiento 1 es mayor que la media del tratamiento 3. El tratamiento 3 presentó

un promedio de ansiedad menor que el del tratamiento 1. Este tratamiento es más efectivo

en la reducción de la ansiedad.

El nivel de efectividad de los tratamientos para reducir la ansiedad fue el siguiente: 3, 1 y 2.

A continuación presentaremos los fundamentos del Anova Factorial, que es una aplicación de

dicha técnica pero para el caso en que hay más de una variable independiente afectando a una

variable dependiente. Se hará énfasis en el caso de dos variables independientes a distintos niveles

cada una, pero queda claro que el modelo se puede generalizar a más de dos variables

independientes.

A n o v a F a c t o r i a l ( d o s o m á s v a r i a b l e s i n d e p e n d i e n t e s )

En muchas ocasiones, la investigación del comportamiento se enfrenta a situaciones en las cuales,

una variable dependiente se encuentra afectada o intervenida por dos o más variables

independientes. A estos casos se les denomina Diseño factorial, y el procedimiento de análisis es a

través del desarrollo de un ANOVA especializado para el caso. No hay muchas diferencias con

relación al modelo simple, salvo que la fuente de variación entre (tratamiento) se divide y toma en

consideración cada una de las variables independientes participantes del modelo.

Para aplicar el ANOVA Factorial, es necesario satisfacer los siguientes supuestos:

La población original de la cual se extraen las muestras tiene una distribución normal

Hay homogeneidad de varianzas en cada una de las condiciones experimentales analizadas

(celdillas)

Los tamaños muestrales deben ser iguales, de tal manera que se minimicen las violaciones a

algunos supuestos.

Veamos un ejemplo basado en la variable dependiente ansiedad.

Un psicólogo investigador está interesado en evaluar los efectos que tienen dos tratamientos

experimentales en la reducción de la ansiedad en aspirantes a ingresar a la Escuela de

Psicología. Además considera que la ansiedad también estará afectada al momento del

experimento por la situación laboral de los sujetos, la cual ha dividido en dos categorías:

trabaja y no trabaja.

Page 163: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

146

Como se puede observar, la variable dependiente (ansiedad) estará afectada por dos variables

independientes: en primer lugar está la variable tratamiento a la que denominaremos (A), que

se presenta a dos niveles: el tratamiento 1 (A1) y el tratamiento 2 (A2); en segundo lugar, está la

variable situación laboral a la que denominaremos B y que se presenta también a dos niveles

trabaja (B1), no trabaja (B2).

El modelo se puede describir de la siguiente manera:

DISEÑO FACTORIAL 2 X 2

Situación

Laboral(B)

Tratamientos(A)

A1 A2

B1 A1B1 A2B2

B2 A1B2 A2B1

La variable A está colocada de manera vertical y sub dividida en dos categorías, las cuales

corresponden a los dos tratamientos. La variable B, está colocada horizontalmente y corresponde

a la situación laboral en los niveles trabaja y no trabaja. El modelo se denomina de acuerdo al

número de variables participantes. En este caso, son 2 variables a 2 niveles, que generan un 2x2.

Si hubiese una variable a 3 niveles y otra a dos, el modelo se denominaría 2x3 ó 3x2, y así

sucesivamente. La colocación de las variables (columnas o filas) es una decisión que no afecta el

resultado del ANOVA.

En las celdillas A1B1…..hasta A2B2, se deben presentar, los puntajes de ansiedad de cada sujeto,

dependiendo del tratamiento recibido más su condición laboral. Es evidente que para cada

celdilla habrá una muestra de sujetos, preferiblemente asignados aleatoriamente y con igual

número de sujetos

El modelo de Anova Factorial determina que la variable dependiente, en este caso la ansiedad,

está afectada por cuatro fuentes principales de variabilidad:

1. Las diferencias en la ansiedad por recibir el tratamiento A1 en comparación con haber recibido

el tratamiento A2; En este caso, los efectos observados en A son independientes de los efectos

de la variable B.

2. Las diferencias en la ansiedad por pertenecer a una de las dos condiciones laborales: trabaja

(B1) o no trabaja (B2), son independientes de los efectos de la variable A.

3. Las diferencias en la ansiedad por haber recibido la combinación de las dos variables A y B, en

sus diferentes niveles, a lo cual se le denomina, interacción

4. Las diferencias en la ansiedad que provienen de la variabilidad aleatoria dentro de cada grupo,

la cual se considera que no es aditiva con ninguna de las fuentes anteriormente señaladas.

Page 164: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

147

Al igual que en el ANOVA Simple, se estima la variación total proveniente de todas las fuentes,

y luego se hace una partición de la misma para evaluar cuánto aporta cada uno de los factores

participantes, tal y como se presenta a continuación:

Suma de

cuadrados

(SC)

Grados de

libertad (gl)

Estimación de

la varianza

(σ2)

Valor Fo

Suma de

Cuadrados

total

(SCT)

Número de

filas – 1

Número de

columnas - 1

Total de

sujetos – celdas

A continuación se presentan las fórmulas y los gl requeridos para desarrollar la partición de los

cuadrados correspondientes al Anova Factorial.

1. ⌊(∑ )

(∑ )

(∑ )

1.1.

2. ⌊(∑ )

(∑ )

(∑ )

2.1.

3. [(∑ )

(∑ ) (∑ )

(∑ )

]

(∑ )

1.1.

4. ∑ [

(∑ ) (∑ )

(∑ ) (∑ )

]

1.1.

5.

El desarrollo de la prueba de hipótesis para el problema de la ansiedad en estudiantes

universitarios, se presenta a continuación:

Page 165: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

148

DATOS GENERALES

DISEÑO FACTORIAL 2 X 2

Situación

Laboral(B)

Tratamientos(A)

Totales

A1 A2

B1

12

10

9

11

9

Media: 10.2

16

15

12

13

14

∑ 0

Media: 14

∑X

∑X2= 1517

n = 10

Media= 12.1

B2

17

15

14

15

16

Media: 15.4

20

21

18

16

15

∑ 0

Media: 18

∑X 167

∑X2= 2837

n = 10

Media=16.7

Totales

∑X

∑X2= 1718

n = 10

Media= 12.8

∑X 0

∑X2= 2636

n = 10

Media= 16

∑Xt

∑X2t= 4354

1. Hipótesis estadíst icas

(efectos por fila)

(efectos por columna)

(efectos por interacción)

2. Nivel de significación

0 0

0

( )

Page 166: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

149

3. Estadíst ico de prueba

4. Regla de decisión

Rechazar Ho si Fo > Fc = 4.49 para las tres principales fuentes de variación: filas, columnas

e interacción.

5. Resultados

Partición de cuadrados

⌊( ) ( )

0⌋

( )

0 0

⌊( ) ( 0)

0⌋

( )

0

[( ) ( 0) ( ) ( 0)

]

( )

0 0

[( ) ( 0) ( ) ( 0)

] 0

0 0

CUADRO RESUMEN DEL ANOVA

Fuente SC Gl σ2 Fo

Fila (B) 105.8 1 105.8 35.27*

Columna (A) 51.2 1 51.2 17.07*

Interacción (A*B) 1.8 1 1.8 0.60

Dentro 48 16 3.0

Total 206.8 16

* Fo > Fc: estadísticamente significativa

6. Decisión:

De acuerdo a los resultados obtenidos, se rechaza la Ho para las filas y las columnas, pero

no se rechaza para la interacción. Estos resultados indican que:

Page 167: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

150

a. Las medias de ansiedad son diferentes atendiendo a la condición laboral. Los que laboran

presentaron un promedio de ansiedad inferior a los que no laboran.

b. Las medias de ansiedad son diferentes atendiendo al tipo de tratamiento recibido. Los que

recibieron el tratamiento A1 presentaron un promedio de ansiedad inferior a los que

recibieron el tratamiento A2.

c. No hay diferencias significativas entre los promedios por la interacción de ambas variables

observados en cada una de las celdillas

Como se puede observar, la interacción (AxB) no resultó significativa, o sea, que los niveles de

ansiedad no son diferentes por la combinación de las dos variables independientes. En estos

casos, el análisis de la interacción finaliza al señalarse la ausencia de significatividad estadística.

Cuando la interacción es significativa, debe confeccionarse un Gráfico que refleje las diferencias

observadas entre las celdillas, específicamente entre las medias de las mismas; de no ser así, este

gráfico no es necesario confeccionarlo. Sin embargo, con el fin de que se observe como se

refleja la no significatividad en este ejemplo, presentaremos el gráfico de estos resultados.

Como se puede observar en la figura anterior, la línea azul representa las medias aritméticas

correspondientes al efecto combinado del tratamiento A1 con las dos condiciones laborales,

observándose que la ansiedad es más baja en los sujetos que trabajan en comparación con los

que no trabajan. Si se observa la línea rosada, representa los efectos combinados del tratamiento

A2 con las condiciones laborales: también en este caso, la condición de trabajo al combinarse

con dicho tratamiento, produce un nivel de ansiedad más bajo que con la condición de no

trabajar. En ambos casos el comportamiento es el mismo, lo que indica que no hay diferencias en

la ansiedad cuando se combinan ambos factores. Por esta razón, la interacción fue no

significativa.

¿Pero, qué sucede cuando los resultados indican efectos diferentes por interacción? A

continuación utilizaremos el mismo ejemplo de la ansiedad, pero cambiaremos las medias de

manera premeditada, para observar los efectos producidos. Suponga que las medias fueron las

siguientes:

A1, 10

A1, 15 A2, 14

A2, 18

0

2

4

6

8

10

12

14

16

18

20

B1 B2

A

N

S

I

E

D

A

D

LABORAL

INTERACCIÓN

Page 168: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

151

A1B1 = 18

A1B2 = 10

A2B1 = 11

A2B1 = 16

En este caso, el gráfico sería el siguiente:

Al inspeccionar este gráfico se observa, a diferencia del anterior, que las dos rectas se cortan, lo

cual es una evidencia inequívoca de que existe interacción entre las variables. Cuando A1 se

combina con B1, el promedio de la ansiedad es más elevado que cuando se combina con B2.

Sucede lo contrario con el tratamiento A2, que al combinarse con B1, el promedio de la ansiedad

es menor que cuando se combina con B2. Si esta combinación de valores se hubiese sometido al

ANOVA, la Fo hubiese resultado significativa, lo cual obliga a la confección del gráfico y a su

debida explicación.

Recapitulamos:

Si la Fo para la interacción resulta estadísticamente significativa, es necesario desarrollar el

gráfico de interacción y explicar el comportamiento de las variables. Este gráfico se caracteriza

porque las líneas rectas que representan las combinaciones de las variables, tienden a cortarse,

o, por lo menos, no tienden a ser paralelas.

Si la Fo para la interacción resulta no significativa, no se rechaza la Ho, lo que significa que las

medias dentro de las celdas no son estadísticamente significativas; las combinaciones de

variables no producen efectos diferentes. En estos casos, no hay necesidad de desarrollar el

gráfico.

B1, 18

B1, 11

B2, 10

B2, 16

0

2

4

6

8

10

12

14

16

18

20

A1 A2

A

N

S

I

E

D

A

D

TRATAMIENTOS

INTERACCIÓN

B1

B2

Page 169: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

152

C O N C E P T O S I M P O R T A N T E S

Anova

F obtenida (Fo)

F crítica (Fc)

Anova simple

Suma de cuadrados (SC)

Partición de la varianza

Prueba de Tukey

Anova Factorial

Niveles de tratamiento

Interacción

Page 170: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

153

E J E R C I C I O S P R Á C T I C O S

A n á l i s i s d e l a V a r i a n z a S i m p l e o d e U n S o l o f a c t o r

1. Un psicólogo escolar de un colegio comercial está interesado en comparar la velocidad que

alcanzan en el teclado de una computadora (palabras por minuto) las estudiantes graduandas de

cuatro colegios( C ) diferentes. Selecciona cuatro colegios, de cada uno de ellos selecciona seis

estudiantes graduandas y les aplica una prueba de velocidad al escribir en una computadora.

Los resultados fueron los siguientes:

C1 C2 C3 C4

51 56 51 71 50 60 65 80 56 66 76 66 60 55 55 70 45 71 61 76 55 65 65 60

¿Hay diferencias significativas en la velocidad de escritura en la computadora, entre las

estudiantes de los cuatro colegios. Si la hay, determine las diferencias. Sea alfa de 0.05.

2. Se desarrolla una investigación para establecer la eficacia de tres métodos de enseñanza de un

curso de psicofisiología. Los métodos investigados son los siguientes: 1. Lectura personalizada,

2. Discusión de grupos y 3. Tutorías. Se conforman aleatoriamente 3 grupos de 10 estudiantes

cada uno, con los mismos pre-requisitos para recibir el curso. Los resultados con los siguientes:

G1 5 8 10 7 10 7 6 8 8 10 G2 6 7 4 9 4 3 6 7 8 6

G3 4 6 2 5 5 6 8 4 6 4

Con alfa de 0.05, determine si hay diferencias significativas entre los tratamientos. De

ser así, determine las mismas.

3. Un psicólogo escolar está interesado en establecer si la ansiedad en los exámenes está afectada

por. A. el sexo (masculino y femenino) y B. situación laboral (trabaja tiempo completo, trabaja

parcialmente y no trabaja. Se Seleccionan 24 estudiantes universitarios de una misma carrera y

nivel académico, 12 hombres y 12 mujeres, y se distribuyen aleatoriamente en las condiciones

experimentales. Además, se les aplica una prueba de ansiedad una hora antes del desarrollo de

una prueba de matemáticas. Los resultados son los siguientes:

Page 171: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

154

A

A1 A2

B

B1

10 8

10 10

5 4 6 5

B2

6 8 7 5

8 6 6 6

B3

4 5 5 4

8 7 7 6

Con los datos resumidos en el cuadro anterior, desarrolle el ANOVA en dos sentidos

correspondiente. Debe determinar:

Efectos de fila

Efectos de columna

Efectos de interacción

En los casos en que se encuentren diferencias estadísticamente significativas,

debe aplicar la Prueba de Tukey.

4. Un psicólogo organizacional desarrolló un estudio en una empresa para determinar si la

productividad en las bodegas, se veía afectada por la presencia de dos variables: tipo de trabajo

(A) (individual o grupal), y ansiedad inducida (B) (alta y baja). Para desarrollar el proyecto,

selecciona 16 trabajadores y los organiza en dos grupos de 8; un grupo trabajará

individualmente y otro lo hará de manera compartida. Se escoge un día de alto nivel de

actividad y a un grupo se le reúne una hora antes de iniciar las labores y se les indica que, por

razones económicas, serán suspendidos por espacio de dos meses; al otro grupo no se les da

ninguna información adicional. A lo largo del día experimental, se evalúa la productividad de

cada sujeto, la cual se resume a continuación:

Ansiedad inducida

Trabajo Alta Baja

Individual

9 7 5 8

3 5 5 3

Grupal

12 10 11 10

7 5 7 5

Con los datos resumidos en el cuadro anterior, desarrolle el ANOVA en dos sentidos

correspondiente. Debe determinar:

Efectos de fila

Page 172: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

155

Efectos de columna

Efectos de interacción

En los casos en que se encuentren diferencias estadísticamente significativas,

debe aplicar la Prueba de Tukey.

Page 173: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

APÉNDICE

Page 174: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

157

APÉNDICE 1

Distribución normal

√ ⁄

La primera columna muestra los incrementos de Z en décimos.

La primera fila muestra los incrementos de Z en centésimos.

La intersección de ambos muestra el área correspondiente entre el valor Z

representado y la línea central. Como la curva normal es simétrica, el valor será el

mismo tanto para el valor positivo como el valor negativo del puntaje Z.

Para encontrar el área complementaria del valor Z, reste de 0.5000 el valor del

área encontrada en la tabla.

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359

0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753

0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141

0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517

0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879

0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224

0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549

0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852

0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133

0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389

1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621

1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830

1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015

1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177

1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319

1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441

1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545

1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633

1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706

1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767

2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817

2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857

2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890

2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916

2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936

2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952

2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964

2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974

2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981

2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986

3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990

Page 175: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

158

-t 0 t

𝛼 ⁄

APÉNDICE 2

Valores críticos de la Distribución t de Student

Grados de libertad Niveles de significancia a dos colas

0.500 0.250 0.200 0.100 0.050 0.025 0.020 0.010 0.005

1 1.00 2.41 3.08 6.31 12.71 25.45 31.82 63.66 127.32 2 0.82 1.60 1.89 2.92 4.30 6.21 6.96 9.92 14.09 3 0.76 1.42 1.64 2.35 3.18 4.18 4.54 5.84 7.45 4 0.74 1.34 1.53 2.13 2.78 3.50 3.75 4.60 5.60 5 0.73 1.30 1.48 2.02 2.57 3.16 3.36 4.03 4.77 6 0.72 1.27 1.44 1.94 2.45 2.97 3.14 3.71 4.32 7 0.71 1.25 1.41 1.89 2.36 2.84 3.00 3.50 4.03 8 0.71 1.24 1.40 1.86 2.31 2.75 2.90 3.36 3.83 9 0.70 1.23 1.38 1.83 2.26 2.69 2.82 3.25 3.69

10 0.70 1.22 1.37 1.81 2.23 2.63 2.76 3.17 3.58 11 0.70 1.21 1.36 1.80 2.20 2.59 2.72 3.11 3.50 12 0.70 1.21 1.36 1.78 2.18 2.56 2.68 3.05 3.43 13 0.69 1.20 1.35 1.77 2.16 2.53 2.65 3.01 3.37 14 0.69 1.20 1.35 1.76 2.14 2.51 2.62 2.98 3.33 15 0.69 1.20 1.34 1.75 2.13 2.49 2.60 2.95 3.29 16 0.69 1.19 1.34 1.75 2.12 2.47 2.58 2.92 3.25 17 0.69 1.19 1.33 1.74 2.11 2.46 2.57 2.90 3.22 18 0.69 1.19 1.33 1.73 2.10 2.45 2.55 2.88 3.20 19 0.69 1.19 1.33 1.73 2.09 2.43 2.54 2.86 3.17 20 0.69 1.18 1.33 1.72 2.09 2.42 2.53 2.85 3.15 21 0.69 1.18 1.32 1.72 2.08 2.41 2.52 2.83 3.14 22 0.69 1.18 1.32 1.72 2.07 2.41 2.51 2.82 3.12 23 0.69 1.18 1.32 1.71 2.07 2.40 2.50 2.81 3.10 24 0.68 1.18 1.32 1.71 2.06 2.39 2.49 2.80 3.09 25 0.68 1.18 1.32 1.71 2.06 2.38 2.49 2.79 3.08 26 0.68 1.18 1.31 1.71 2.06 2.38 2.48 2.78 3.07 27 0.68 1.18 1.31 1.70 2.05 2.37 2.47 2.77 3.06 28 0.68 1.17 1.31 1.70 2.05 2.37 2.47 2.76 3.05 29 0.68 1.17 1.31 1.70 2.05 2.36 2.46 2.76 3.04 30 0.68 1.17 1.31 1.70 2.04 2.36 2.46 2.75 3.03 31 0.68 1.17 1.31 1.70 2.04 2.36 2.45 2.74 3.02 32 0.68 1.17 1.31 1.69 2.04 2.35 2.45 2.74 3.01 33 0.68 1.17 1.31 1.69 2.03 2.35 2.44 2.73 3.01 34 0.68 1.17 1.31 1.69 2.03 2.35 2.44 2.73 3.00 35 0.68 1.17 1.31 1.69 2.03 2.34 2.44 2.72 3.00 36 0.68 1.17 1.31 1.69 2.03 2.34 2.43 2.72 2.99 37 0.68 1.17 1.30 1.69 2.03 2.34 2.43 2.72 2.99 38 0.68 1.17 1.30 1.69 2.02 2.33 2.43 2.71 2.98

39 0.68 1.17 1.30 1.68 2.02 2.33 2.43 2.71 2.98

40 0.68 1.17 1.30 1.68 2.02 2.33 2.42 2.70 2.97

0.250 0.125 0.100 0.050 0.025 0.013 0.010 0.005 0.003

Niveles de significancia a una cola

-t 0 t

𝛼

Page 176: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

159

APÉNDICE 3

Valores críticos de la de Distribución F de Fisher

gld

α=0.05 (normal) y α 0 01 (negritas) glentre

1 2 3 4 5 6 7 8 9 10 11 12 14 16 20 24 30 40 50 75 100 200 500 ∞

1 161 199 216 225 230 234 237 239 241 242 243 244 245 246 248 249 250 251 252 253 253 254 254 254

4052 4999 5404 5624 5764 5859 5928 5981 6022 6056 6083 6107 6143 6170 6209 6234 6260 6286 6302 6324 6334 6350 6360 6366

2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.40 19.41 19.42 19.43 19.45 19.45 19.46 19.47 19.48 19.48 19.49 19.49 19.49 19.50 98.50 99.00 99.16 99.25 99.30 99.33 99.36 99.38 99.39 99.40 99.41 99.42 99.43 99.44 99.45 99.46 99.47 99.48 99.48 99.48 99.49 99.49 99.50 99.50

3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.76 8.74 8.71 8.69 8.66 8.64 8.62 8.59 8.58 8.56 8.55 8.54 8.53 8.53 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.34 27.23 27.13 27.05 26.92 26.83 26.69 26.60 26.50 26.41 26.35 26.28 26.24 26.18 26.15 26.13

4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.94 5.91 5.87 5.84 5.80 5.77 5.75 5.72 5.70 5.68 5.66 5.65 5.64 5.63

21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55 14.45 14.37 14.25 14.15 14.02 13.93 13.84 13.75 13.69 13.61 13.58 13.52 13.49 13.46

5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.70 4.68 4.64 4.60 4.56 4.53 4.50 4.46 4.44 4.42 4.41 4.39 4.37 4.37

16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05 9.96 9.89 9.77 9.68 9.55 9.47 9.38 9.29 9.24 9.17 9.13 9.08 9.04 9.02

6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.03 4.00 3.96 3.92 3.87 3.84 3.81 3.77 3.75 3.73 3.71 3.69 3.68 3.67

13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.79 7.72 7.60 7.52 7.40 7.31 7.23 7.14 7.09 7.02 6.99 6.93 6.90 6.88

7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.60 3.57 3.53 3.49 3.44 3.41 3.38 3.34 3.32 3.29 3.27 3.25 3.24 3.23

12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62 6.54 6.47 6.36 6.28 6.16 6.07 5.99 5.91 5.86 5.79 5.75 5.70 5.67 5.65

8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.31 3.28 3.24 3.20 3.15 3.12 3.08 3.04 3.02 2.99 2.97 2.95 2.94 2.93

11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81 5.73 5.67 5.56 5.48 5.36 5.28 5.20 5.12 5.07 5.00 4.96 4.91 4.88 4.86

9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.10 3.07 3.03 2.99 2.94 2.90 2.86 2.83 2.80 2.77 2.76 2.73 2.72 2.71

10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.18 5.11 5.01 4.92 4.81 4.73 4.65 4.57 4.52 4.45 4.41 4.36 4.33 4.31

10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.94 2.91 2.86 2.83 2.77 2.74 2.70 2.66 2.64 2.60 2.59 2.56 2.55 2.54

10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.77 4.71 4.60 4.52 4.41 4.33 4.25 4.17 4.12 4.05 4.01 3.96 3.93 3.91

Page 177: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

160

gld

α=0.05 (normal) y α 0 01 (negritas) glentre

1 2 3 4 5 6 7 8 9 10 11 12 14 16 20 24 30 40 50 75 100 200 500 ∞

11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.82 2.79 2.74 2.70 2.65 2.61 2.57 2.53 2.51 2.47 2.46 2.43 2.42 2.40 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 4.54 4.46 4.40 4.29 4.21 4.10 4.02 3.94 3.86 3.81 3.74 3.71 3.66 3.62 3.60

12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.72 2.69 2.64 2.60 2.54 2.51 2.47 2.43 2.40 2.37 2.35 2.32 2.31 2.30 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30 4.22 4.16 4.05 3.97 3.86 3.78 3.70 3.62 3.57 3.50 3.47 3.41 3.38 3.36

13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67 2.63 2.60 2.55 2.51 2.46 2.42 2.38 2.34 2.31 2.28 2.26 2.23 2.22 2.21 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19 4.10 4.02 3.96 3.86 3.78 3.66 3.59 3.51 3.43 3.38 3.31 3.27 3.22 3.19 3.17

14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.57 2.53 2.48 2.44 2.39 2.35 2.31 2.27 2.24 2.21 2.19 2.16 2.14 2.13 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.94 3.86 3.80 3.70 3.62 3.51 3.43 3.35 3.27 3.22 3.15 3.11 3.06 3.03 3.00

15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 2.51 2.48 2.42 2.38 2.33 2.29 2.25 2.20 2.18 2.14 2.12 2.10 2.08 2.07 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80 3.73 3.67 3.56 3.49 3.37 3.29 3.21 3.13 3.08 3.01 2.98 2.92 2.89 2.87

16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.46 2.42 2.37 2.33 2.28 2.24 2.19 2.15 2.12 2.09 2.07 2.04 2.02 2.01 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.69 3.62 3.55 3.45 3.37 3.26 3.18 3.10 3.02 2.97 2.90 2.86 2.81 2.78 2.75

17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.45 2.41 2.38 2.33 2.29 2.23 2.19 2.15 2.10 2.08 2.04 2.02 1.99 1.97 1.96 8.40 6.11 5.19 4.67 4.34 4.10 3.93 3.79 3.68 3.59 3.52 3.46 3.35 3.27 3.16 3.08 3.00 2.92 2.87 2.80 2.76 2.71 2.68 2.65

18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.37 2.34 2.29 2.25 2.19 2.15 2.11 2.06 2.04 2.00 1.98 1.95 1.93 1.92 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 3.51 3.43 3.37 3.27 3.19 3.08 3.00 2.92 2.84 2.78 2.71 2.68 2.62 2.59 2.57

19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.38 2.34 2.31 2.26 2.21 2.16 2.11 2.07 2.03 2.00 1.96 1.94 1.91 1.89 1.88 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 3.43 3.36 3.30 3.19 3.12 3.00 2.92 2.84 2.76 2.71 2.64 2.60 2.55 2.51 2.49

20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.31 2.28 2.22 2.18 2.12 2.08 2.04 1.99 1.97 1.93 1.91 1.88 1.86 1.84 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37 3.29 3.23 3.13 3.05 2.94 2.86 2.78 2.69 2.64 2.57 2.54 2.48 2.44 2.42

21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37 2.32 2.28 2.25 2.20 2.16 2.10 2.05 2.01 1.96 1.94 1.90 1.88 1.84 1.83 1.81 8.02 5.78 4.87 4.37 4.04 3.81 3.64 3.51 3.40 3.31 3.24 3.17 3.07 2.99 2.88 2.80 2.72 2.64 2.58 2.51 2.48 2.42 2.38 2.36

22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 2.30 2.26 2.23 2.17 2.13 2.07 2.03 1.98 1.94 1.91 1.87 1.85 1.82 1.80 1.78 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.26 3.18 3.12 3.02 2.94 2.83 2.75 2.67 2.58 2.53 2.46 2.42 2.36 2.33 2.31

23 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32 2.27 2.24 2.20 2.15 2.11 2.05 2.01 1.96 1.91 1.88 1.84 1.82 1.79 1.77 1.76 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3.30 3.21 3.14 3.07 2.97 2.89 2.78 2.70 2.62 2.54 2.48 2.41 2.37 2.32 2.28 2.26

24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25 2.22 2.18 2.13 2.09 2.03 1.98 1.94 1.89 1.86 1.82 1.80 1.77 1.75 1.73 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.17 3.09 3.03 2.93 2.85 2.74 2.66 2.58 2.49 2.44 2.37 2.33 2.27 2.24 2.21

25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 2.24 2.20 2.16 2.11 2.07 2.01 1.96 1.92 1.87 1.84 1.80 1.78 1.75 1.73 1.71 7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32 3.22 3.13 3.06 2.99 2.89 2.81 2.70 2.62 2.54 2.45 2.40 2.33 2.29 2.23 2.19 2.17

26 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27 2.22 2.18 2.15 2.09 2.05 1.99 1.95 1.90 1.85 1.82 1.78 1.76 1.73 1.71 1.69 7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18 3.09 3.02 2.96 2.86 2.78 2.66 2.58 2.50 2.42 2.36 2.29 2.25 2.19 2.16 2.13

27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25 2.20 2.17 2.13 2.08 2.04 1.97 1.93 1.88 1.84 1.81 1.76 1.74 1.71 1.69 1.67 7.68 5.49 4.60 4.11 3.78 3.56 3.39 3.26 3.15 3.06 2.99 2.93 2.82 2.75 2.63 2.55 2.47 2.38 2.33 2.26 2.22 2.16 2.12 2.10

28 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24 2.19 2.15 2.12 2.06 2.02 1.96 1.91 1.87 1.82 1.79 1.75 1.73 1.69 1.67 1.65 7.64 5.45 4.57 4.07 3.75 3.53 3.36 3.23 3.12 3.03 2.96 2.90 2.79 2.72 2.60 2.52 2.44 2.35 2.30 2.23 2.19 2.13 2.09 2.06

Page 178: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

161

gld

α=0.05 (normal) y α 0 01 (negritas) glentre

1 2 3 4 5 6 7 8 9 10 11 12 14 16 20 24 30 40 50 75 100 200 500 ∞

29 4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28 2.22 2.18 2.14 2.10 2.05 2.01 1.94 1.90 1.85 1.81 1.77 1.73 1.71 1.67 1.65 1.64 7.60 5.42 4.54 4.04 3.73 3.50 3.33 3.20 3.09 3.00 2.93 2.87 2.77 2.69 2.57 2.49 2.41 2.33 2.27 2.20 2.16 2.10 2.06 2.03

30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16 2.13 2.09 2.04 1.99 1.93 1.89 1.84 1.79 1.76 1.72 1.70 1.66 1.64 1.62 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.98 2.91 2.84 2.74 2.66 2.55 2.47 2.39 2.30 2.25 2.17 2.13 2.07 2.03 2.01

32 4.15 3.29 2.90 2.67 2.51 2.40 2.31 2.24 2.19 2.14 2.10 2.07 2.01 1.97 1.91 1.86 1.82 1.77 1.74 1.69 1.67 1.63 1.61 1.59 7.50 5.34 4.46 3.97 3.65 3.43 3.26 3.13 3.02 2.93 2.86 2.80 2.70 2.62 2.50 2.42 2.34 2.25 2.20 2.12 2.08 2.02 1.98 1.96

34 4.13 3.28 2.88 2.65 2.49 2.38 2.29 2.23 2.17 2.12 2.08 2.05 1.99 1.95 1.89 1.84 1.80 1.75 1.71 1.67 1.65 1.61 1.59 1.57 7.44 5.29 4.42 3.93 3.61 3.39 3.22 3.09 2.98 2.89 2.82 2.76 2.66 2.58 2.46 2.38 2.30 2.21 2.16 2.08 2.04 1.98 1.94 1.91

36 4.11 3.26 2.87 2.63 2.48 2.36 2.28 2.21 2.15 2.11 2.07 2.03 1.98 1.93 1.87 1.82 1.78 1.73 1.69 1.65 1.62 1.59 1.56 1.55 7.40 5.25 4.38 3.89 3.57 3.35 3.18 3.05 2.95 2.86 2.79 2.72 2.62 2.54 2.43 2.35 2.26 2.18 2.12 2.04 2.00 1.94 1.90 1.87

38 4.10 3.24 2.85 2.62 2.46 2.35 2.26 2.19 2.14 2.09 2.05 2.02 1.96 1.92 1.85 1.81 1.76 1.71 1.68 1.63 1.61 1.57 1.54 1.53 7.35 5.21 4.34 3.86 3.54 3.32 3.15 3.02 2.92 2.83 2.75 2.69 2.59 2.51 2.40 2.32 2.23 2.14 2.09 2.01 1.97 1.90 1.86 1.84

40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08 2.04 2.00 1.95 1.90 1.84 1.79 1.74 1.69 1.66 1.61 1.59 1.55 1.53 1.51 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.80 2.73 2.66 2.56 2.48 2.37 2.29 2.20 2.11 2.06 1.98 1.94 1.87 1.83 1.81

42 4.07 3.22 2.83 2.59 2.44 2.32 2.24 2.17 2.11 2.06 2.03 1.99 1.94 1.89 1.83 1.78 1.73 1.68 1.65 1.60 1.57 1.53 1.51 1.49 7.28 5.15 4.29 3.80 3.49 3.27 3.10 2.97 2.86 2.78 2.70 2.64 2.54 2.46 2.34 2.26 2.18 2.09 2.03 1.95 1.91 1.85 1.80 1.78

44 4.06 3.21 2.82 2.58 2.43 2.31 2.23 2.16 2.10 2.05 2.01 1.98 1.92 1.88 1.81 1.77 1.72 1.67 1.63 1.59 1.56 1.52 1.49 1.48 7.25 5.12 4.26 3.78 3.47 3.24 3.08 2.95 2.84 2.75 2.68 2.62 2.52 2.44 2.32 2.24 2.15 2.07 2.01 1.93 1.89 1.82 1.78 1.75

46 4.05 3.20 2.81 2.57 2.42 2.30 2.22 2.15 2.09 2.04 2.00 1.97 1.91 1.87 1.80 1.76 1.71 1.65 1.62 1.57 1.55 1.51 1.48 1.46 7.22 5.10 4.24 3.76 3.44 3.22 3.06 2.93 2.82 2.73 2.66 2.60 2.50 2.42 2.30 2.22 2.13 2.04 1.99 1.91 1.86 1.80 1.76 1.73

48 4.04 3.19 2.80 2.57 2.41 2.29 2.21 2.14 2.08 2.03 1.99 1.96 1.90 1.86 1.79 1.75 1.70 1.64 1.61 1.56 1.54 1.49 1.47 1.45 7.19 5.08 4.22 3.74 3.43 3.20 3.04 2.91 2.80 2.71 2.64 2.58 2.48 2.40 2.28 2.20 2.12 2.02 1.97 1.89 1.84 1.78 1.73 1.70

50 4.03 3.18 2.79 2.56 2.40 2.29 2.20 2.13 2.07 2.03 1.99 1.95 1.89 1.85 1.78 1.74 1.69 1.63 1.60 1.55 1.52 1.48 1.46 1.44 7.17 5.06 4.20 3.72 3.41 3.19 3.02 2.89 2.78 2.70 2.63 2.56 2.46 2.38 2.27 2.18 2.10 2.01 1.95 1.87 1.82 1.76 1.71 1.68

55 4.02 3.16 2.77 2.54 2.38 2.27 2.18 2.11 2.06 2.01 1.97 1.93 1.88 1.83 1.76 1.72 1.67 1.61 1.58 1.53 1.50 1.46 1.43 1.41 7.12 5.01 4.16 3.68 3.37 3.15 2.98 2.85 2.75 2.66 2.59 2.53 2.42 2.34 2.23 2.15 2.06 1.97 1.91 1.83 1.78 1.71 1.67 1.64

60 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99 1.95 1.92 1.86 1.82 1.75 1.70 1.65 1.59 1.56 1.51 1.48 1.44 1.41 1.39 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.63 2.56 2.50 2.39 2.31 2.20 2.12 2.03 1.94 1.88 1.79 1.75 1.68 1.63 1.60

65 3.99 3.14 2.75 2.51 2.36 2.24 2.15 2.08 2.03 1.98 1.94 1.90 1.85 1.80 1.73 1.69 1.63 1.58 1.54 1.49 1.46 1.42 1.39 1.37 7.04 4.95 4.10 3.62 3.31 3.09 2.93 2.80 2.69 2.61 2.53 2.47 2.37 2.29 2.17 2.09 2.00 1.91 1.85 1.77 1.72 1.65 1.60 1.57

70 3.98 3.13 2.74 2.50 2.35 2.23 2.14 2.07 2.02 1.97 1.93 1.89 1.84 1.79 1.72 1.67 1.62 1.57 1.53 1.48 1.45 1.40 1.37 1.35 7.01 4.92 4.07 3.60 3.29 3.07 2.91 2.78 2.67 2.59 2.51 2.45 2.35 2.27 2.15 2.07 1.98 1.89 1.83 1.74 1.70 1.62 1.57 1.54

80 3.96 3.11 2.72 2.49 2.33 2.21 2.13 2.06 2.00 1.95 1.91 1.88 1.82 1.77 1.70 1.65 1.60 1.54 1.51 1.45 1.43 1.38 1.35 1.33 6.96 4.88 4.04 3.56 3.26 3.04 2.87 2.74 2.64 2.55 2.48 2.42 2.31 2.23 2.12 2.03 1.94 1.85 1.79 1.70 1.65 1.58 1.53 1.50

100 3.94 3.09 2.70 2.46 2.31 2.19 2.10 2.03 1.97 1.93 1.89 1.85 1.79 1.75 1.68 1.63 1.57 1.52 1.48 1.42 1.39 1.34 1.31 1.28 6.90 4.82 3.98 3.51 3.21 2.99 2.82 2.69 2.59 2.50 2.43 2.37 2.27 2.19 2.07 1.98 1.89 1.80 1.74 1.65 1.60 1.52 1.47 1.43

Page 179: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

162

gld

α=0.05 (normal) y α 0 01 (negritas) glentre

1 2 3 4 5 6 7 8 9 10 11 12 14 16 20 24 30 40 50 75 100 200 500 ∞

125 3.92 3.07 2.68 2.44 2.29 2.17 2.08 2.01 1.96 1.91 1.87 1.83 1.77 1.73 1.66 1.60 1.55 1.49 1.45 1.40 1.36 1.31 1.27 1.25 6.84 4.78 3.94 3.47 3.17 2.95 2.79 2.66 2.55 2.47 2.39 2.33 2.23 2.15 2.03 1.94 1.85 1.76 1.69 1.60 1.55 1.47 1.41 1.37

150 3.90 3.06 2.66 2.43 2.27 2.16 2.07 2.00 1.94 1.89 1.85 1.82 1.76 1.71 1.64 1.59 1.54 1.48 1.44 1.38 1.34 1.29 1.25 1.22 6.81 4.75 3.91 3.45 3.14 2.92 2.76 2.63 2.53 2.44 2.37 2.31 2.20 2.12 2.00 1.92 1.83 1.73 1.66 1.57 1.52 1.43 1.38 1.33

200 3.89 3.04 2.65 2.42 2.26 2.14 2.06 1.98 1.93 1.88 1.84 1.80 1.74 1.69 1.62 1.57 1.52 1.46 1.41 1.35 1.32 1.26 1.22 1.19 6.76 4.71 3.88 3.41 3.11 2.89 2.73 2.60 2.50 2.41 2.34 2.27 2.17 2.09 1.97 1.89 1.79 1.69 1.63 1.53 1.48 1.39 1.33 1.28

400 3.86 3.02 2.63 2.39 2.24 2.12 2.03 1.96 1.90 1.85 1.81 1.78 1.72 1.67 1.60 1.54 1.49 1.42 1.38 1.32 1.28 1.22 1.17 1.13 6.70 4.66 3.83 3.37 3.06 2.85 2.68 2.56 2.45 2.37 2.29 2.23 2.13 2.05 1.92 1.84 1.75 1.64 1.58 1.48 1.42 1.32 1.25 1.19

1000 3.85 3.00 2.61 2.38 2.22 2.11 2.02 1.95 1.89 1.84 1.80 1.76 1.70 1.65 1.58 1.53 1.47 1.41 1.36 1.30 1.26 1.19 1.13 1.08 6.66 4.63 3.80 3.34 3.04 2.82 2.66 2.53 2.43 2.34 2.27 2.20 2.10 2.02 1.90 1.81 1.72 1.61 1.54 1.44 1.38 1.28 1.19 1.12

∞ 3.84 3.00 2.60 2.37 2.21 2.10 2.01 1.94 1.88 1.83 1.79 1.75 1.69 1.64 1.57 1.52 1.46 1.39 1.35 1.28 1.24 1.17 1.11 1.00 6.63 4.61 3.78 3.32 3.02 2.80 2.64 2.51 2.41 2.32 2.25 2.18 2.08 2.00 1.88 1.79 1.70 1.59 1.52 1.42 1.36 1.25 1.15 1.00

Page 180: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

163

APÉNDICE 4

Probabilidades binomiales

n k p

0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50

1 0 0.9500 0.9000 0.8500 0.8000 0.7500 0.7000 0.6500 0.6000 0.5500 0.5000 1 1 0.0500 0.1000 0.1500 0.2000 0.2500 0.3000 0.3500 0.4000 0.4500 0.5000

2 0 0.9025 0.8100 0.7225 0.6400 0.5625 0.4900 0.4225 0.3600 0.3025 0.2500 2 1 0.0950 0.1800 0.2550 0.3200 0.3750 0.4200 0.4550 0.4800 0.4950 0.5000 2 2 0.0025 0.0100 0.0225 0.0400 0.0625 0.0900 0.1225 0.1600 0.2025 0.2500

3 0 0.8574 0.7290 0.6141 0.5120 0.4219 0.3430 0.2746 0.2160 0.1664 0.1250 3 1 0.1354 0.2430 0.3251 0.3840 0.4219 0.4410 0.4436 0.4320 0.4084 0.3750 3 2 0.0071 0.0270 0.0574 0.0960 0.1406 0.1890 0.2389 0.2880 0.3341 0.3750 3 3 0.0001 0.0010 0.0034 0.0080 0.0156 0.0270 0.0429 0.0640 0.0911 0.1250

4 0 0.8145 0.6561 0.5220 0.4096 0.3164 0.2401 0.1785 0.1296 0.0915 0.0625 4 1 0.1715 0.2916 0.3685 0.4096 0.4219 0.4116 0.3845 0.3456 0.2995 0.2500 4 2 0.0135 0.0486 0.0975 0.1536 0.2109 0.2646 0.3105 0.3456 0.3675 0.3750 4 3 0.0005 0.0036 0.0115 0.0256 0.0469 0.0756 0.1115 0.1536 0.2005 0.2500 4 4 0.0000 0.0001 0.0005 0.0016 0.0039 0.0081 0.0150 0.0256 0.0410 0.0625

5 0 0.7738 0.5905 0.4437 0.3277 0.2373 0.1681 0.1160 0.0778 0.0503 0.0313 5 1 0.2036 0.3281 0.3915 0.4096 0.3955 0.3602 0.3124 0.2592 0.2059 0.1563 5 2 0.0214 0.0729 0.1382 0.2048 0.2637 0.3087 0.3364 0.3456 0.3369 0.3125 5 3 0.0011 0.0081 0.0244 0.0512 0.0879 0.1323 0.1811 0.2304 0.2757 0.3125 5 4 0.0000 0.0005 0.0022 0.0064 0.0146 0.0284 0.0488 0.0768 0.1128 0.1563

5 5 0.0000 0.0000 0.0001 0.0003 0.0010 0.0024 0.0053 0.0102 0.0185 0.0313

6 0 0.7351 0.5314 0.3771 0.2621 0.1780 0.1176 0.0754 0.0467 0.0277 0.0156 6 1 0.2321 0.3543 0.3993 0.3932 0.3560 0.3025 0.2437 0.1866 0.1359 0.0938 6 2 0.0305 0.0984 0.1762 0.2458 0.2966 0.3241 0.3280 0.3110 0.2780 0.2344 6 3 0.0021 0.0146 0.0415 0.0819 0.1318 0.1852 0.2355 0.2765 0.3032 0.3125 6 4 0.0001 0.0012 0.0055 0.0154 0.0330 0.0595 0.0951 0.1382 0.1861 0.2344

6 5 0.0000 0.0001 0.0004 0.0015 0.0044 0.0102 0.0205 0.0369 0.0609 0.0938 6 6 0.0000 0.0000 0.0000 0.0001 0.0002 0.0007 0.0018 0.0041 0.0083 0.0156

7 0 0.6983 0.4783 0.3206 0.2097 0.1335 0.0824 0.0490 0.0280 0.0152 0.0078 7 1 0.2573 0.3720 0.3960 0.3670 0.3115 0.2471 0.1848 0.1306 0.0872 0.0547 7 2 0.0406 0.1240 0.2097 0.2753 0.3115 0.3177 0.2985 0.2613 0.2140 0.1641 7 3 0.0036 0.0230 0.0617 0.1147 0.1730 0.2269 0.2679 0.2903 0.2918 0.2734 7 4 0.0002 0.0026 0.0109 0.0287 0.0577 0.0972 0.1442 0.1935 0.2388 0.2734

7 5 0.0000 0.0002 0.0012 0.0043 0.0115 0.0250 0.0466 0.0774 0.1172 0.1641 7 6 0.0000 0.0000 0.0001 0.0004 0.0013 0.0036 0.0084 0.0172 0.0320 0.0547 7 7 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0006 0.0016 0.0037 0.0078

8 0 0.6634 0.4305 0.2725 0.1678 0.1001 0.0576 0.0319 0.0168 0.0084 0.0039 8 1 0.2793 0.3826 0.3847 0.3355 0.2670 0.1977 0.1373 0.0896 0.0548 0.0313 8 2 0.0515 0.1488 0.2376 0.2936 0.3115 0.2965 0.2587 0.2090 0.1569 0.1094 8 3 0.0054 0.0331 0.0839 0.1468 0.2076 0.2541 0.2786 0.2787 0.2568 0.2188 8 4 0.0004 0.0046 0.0185 0.0459 0.0865 0.1361 0.1875 0.2322 0.2627 0.2734

8 5 0.0000 0.0004 0.0026 0.0092 0.0231 0.0467 0.0808 0.1239 0.1719 0.2188 8 6 0.0000 0.0000 0.0002 0.0011 0.0038 0.0100 0.0217 0.0413 0.0703 0.1094 8 7 0.0000 0.0000 0.0000 0.0001 0.0004 0.0012 0.0033 0.0079 0.0164 0.0313 8 8 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0007 0.0017 0.0039

9 0 0.6302 0.3874 0.2316 0.1342 0.0751 0.0404 0.0207 0.0101 0.0046 0.0020 9 1 0.2985 0.3874 0.3679 0.3020 0.2253 0.1556 0.1004 0.0605 0.0339 0.0176

Page 181: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

164

n k p

0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50

9 2 0.0629 0.1722 0.2597 0.3020 0.3003 0.2668 0.2162 0.1612 0.1110 0.0703 9 3 0.0077 0.0446 0.1069 0.1762 0.2336 0.2668 0.2716 0.2508 0.2119 0.1641 9 4 0.0006 0.0074 0.0283 0.0661 0.1168 0.1715 0.2194 0.2508 0.2600 0.2461

9 5 0.0000 0.0008 0.0050 0.0165 0.0389 0.0735 0.1181 0.1672 0.2128 0.2461 9 6 0.0000 0.0001 0.0006 0.0028 0.0087 0.0210 0.0424 0.0743 0.1160 0.1641 9 7 0.0000 0.0000 0.0000 0.0003 0.0012 0.0039 0.0098 0.0212 0.0407 0.0703 9 8 0.0000 0.0000 0.0000 0.0000 0.0001 0.0004 0.0013 0.0035 0.0083 0.0176 9 9 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0008 0.0020

10 0 0.5987 0.3487 0.1969 0.1074 0.0563 0.0282 0.0135 0.0060 0.0025 0.0010 10 1 0.3151 0.3874 0.3474 0.2684 0.1877 0.1211 0.0725 0.0403 0.0207 0.0098 10 2 0.0746 0.1937 0.2759 0.3020 0.2816 0.2335 0.1757 0.1209 0.0763 0.0439 10 3 0.0105 0.0574 0.1298 0.2013 0.2503 0.2668 0.2522 0.2150 0.1665 0.1172 10 4 0.0010 0.0112 0.0401 0.0881 0.1460 0.2001 0.2377 0.2508 0.2384 0.2051

10 5 0.0001 0.0015 0.0085 0.0264 0.0584 0.1029 0.1536 0.2007 0.2340 0.2461 10 6 0.0000 0.0001 0.0012 0.0055 0.0162 0.0368 0.0689 0.1115 0.1596 0.2051 10 7 0.0000 0.0000 0.0001 0.0008 0.0031 0.0090 0.0212 0.0425 0.0746 0.1172 10 8 0.0000 0.0000 0.0000 0.0001 0.0004 0.0014 0.0043 0.0106 0.0229 0.0439 10 9 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0016 0.0042 0.0098 10 10 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0010

11 0 0.5688 0.3138 0.1673 0.0859 0.0422 0.0198 0.0088 0.0036 0.0014 0.0005 11 1 0.3293 0.3835 0.3248 0.2362 0.1549 0.0932 0.0518 0.0266 0.0125 0.0054 11 2 0.0867 0.2131 0.2866 0.2953 0.2581 0.1998 0.1395 0.0887 0.0513 0.0269 11 3 0.0137 0.0710 0.1517 0.2215 0.2581 0.2568 0.2254 0.1774 0.1259 0.0806 11 4 0.0014 0.0158 0.0536 0.1107 0.1721 0.2201 0.2428 0.2365 0.2060 0.1611

11 5 0.0001 0.0025 0.0132 0.0388 0.0803 0.1321 0.1830 0.2207 0.2360 0.2256 11 6 0.0000 0.0003 0.0023 0.0097 0.0268 0.0566 0.0985 0.1471 0.1931 0.2256 11 7 0.0000 0.0000 0.0003 0.0017 0.0064 0.0173 0.0379 0.0701 0.1128 0.1611 11 8 0.0000 0.0000 0.0000 0.0002 0.0011 0.0037 0.0102 0.0234 0.0462 0.0806 11 9 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0018 0.0052 0.0126 0.0269

11 10 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0007 0.0021 0.0054 11 11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0005

12 0 0.5404 0.2824 0.1422 0.0687 0.0317 0.0138 0.0057 0.0022 0.0008 0.0002 12 1 0.3413 0.3766 0.3012 0.2062 0.1267 0.0712 0.0368 0.0174 0.0075 0.0029 12 2 0.0988 0.2301 0.2924 0.2835 0.2323 0.1678 0.1088 0.0639 0.0339 0.0161 12 3 0.0173 0.0852 0.1720 0.2362 0.2581 0.2397 0.1954 0.1419 0.0923 0.0537 12 4 0.0021 0.0213 0.0683 0.1329 0.1936 0.2311 0.2367 0.2128 0.1700 0.1208

12 5 0.0002 0.0038 0.0193 0.0532 0.1032 0.1585 0.2039 0.2270 0.2225 0.1934 12 6 0.0000 0.0005 0.0040 0.0155 0.0401 0.0792 0.1281 0.1766 0.2124 0.2256 12 7 0.0000 0.0000 0.0006 0.0033 0.0115 0.0291 0.0591 0.1009 0.1489 0.1934 12 8 0.0000 0.0000 0.0001 0.0005 0.0024 0.0078 0.0199 0.0420 0.0762 0.1208 12 9 0.0000 0.0000 0.0000 0.0001 0.0004 0.0015 0.0048 0.0125 0.0277 0.0537

12 10 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0008 0.0025 0.0068 0.0161 12 11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0010 0.0029 12 12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002

13 0 0.5133 0.2542 0.1209 0.0550 0.0238 0.0097 0.0037 0.0013 0.0004 0.0001 13 1 0.3512 0.3672 0.2774 0.1787 0.1029 0.0540 0.0259 0.0113 0.0045 0.0016 13 2 0.1109 0.2448 0.2937 0.2680 0.2059 0.1388 0.0836 0.0453 0.0220 0.0095 13 3 0.0214 0.0997 0.1900 0.2457 0.2517 0.2181 0.1651 0.1107 0.0660 0.0349 13 4 0.0028 0.0277 0.0838 0.1535 0.2097 0.2337 0.2222 0.1845 0.1350 0.0873

13 5 0.0003 0.0055 0.0266 0.0691 0.1258 0.1803 0.2154 0.2214 0.1989 0.1571 13 6 0.0000 0.0008 0.0063 0.0230 0.0559 0.1030 0.1546 0.1968 0.2169 0.2095 13 7 0.0000 0.0001 0.0011 0.0058 0.0186 0.0442 0.0833 0.1312 0.1775 0.2095 13 8 0.0000 0.0000 0.0001 0.0011 0.0047 0.0142 0.0336 0.0656 0.1089 0.1571

Page 182: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

165

n k p

0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50

13 9 0.0000 0.0000 0.0000 0.0001 0.0009 0.0034 0.0101 0.0243 0.0495 0.0873

13 10 0.0000 0.0000 0.0000 0.0000 0.0001 0.0006 0.0022 0.0065 0.0162 0.0349 13 11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0012 0.0036 0.0095 13 12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0016 13 13 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001

14 0 0.4877 0.2288 0.1028 0.0440 0.0178 0.0068 0.0024 0.0008 0.0002 0.0001 14 1 0.3593 0.3559 0.2539 0.1539 0.0832 0.0407 0.0181 0.0073 0.0027 0.0009 14 2 0.1229 0.2570 0.2912 0.2501 0.1802 0.1134 0.0634 0.0317 0.0141 0.0056 14 3 0.0259 0.1142 0.2056 0.2501 0.2402 0.1943 0.1366 0.0845 0.0462 0.0222 14 4 0.0037 0.0349 0.0998 0.1720 0.2202 0.2290 0.2022 0.1549 0.1040 0.0611

14 5 0.0004 0.0078 0.0352 0.0860 0.1468 0.1963 0.2178 0.2066 0.1701 0.1222 14 6 0.0000 0.0013 0.0093 0.0322 0.0734 0.1262 0.1759 0.2066 0.2088 0.1833 14 7 0.0000 0.0002 0.0019 0.0092 0.0280 0.0618 0.1082 0.1574 0.1952 0.2095 14 8 0.0000 0.0000 0.0003 0.0020 0.0082 0.0232 0.0510 0.0918 0.1398 0.1833 14 9 0.0000 0.0000 0.0000 0.0003 0.0018 0.0066 0.0183 0.0408 0.0762 0.1222

14 10 0.0000 0.0000 0.0000 0.0000 0.0003 0.0014 0.0049 0.0136 0.0312 0.0611 14 11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0010 0.0033 0.0093 0.0222 14 12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0019 0.0056 14 13 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0009 14 14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001

15 0 0.4633 0.2059 0.0874 0.0352 0.0134 0.0047 0.0016 0.0005 0.0001 0.0000 15 1 0.3658 0.3432 0.2312 0.1319 0.0668 0.0305 0.0126 0.0047 0.0016 0.0005 15 2 0.1348 0.2669 0.2856 0.2309 0.1559 0.0916 0.0476 0.0219 0.0090 0.0032 15 3 0.0307 0.1285 0.2184 0.2501 0.2252 0.1700 0.1110 0.0634 0.0318 0.0139 15 4 0.0049 0.0428 0.1156 0.1876 0.2252 0.2186 0.1792 0.1268 0.0780 0.0417

15 5 0.0006 0.0105 0.0449 0.1032 0.1651 0.2061 0.2123 0.1859 0.1404 0.0916 15 6 0.0000 0.0019 0.0132 0.0430 0.0917 0.1472 0.1906 0.2066 0.1914 0.1527 15 7 0.0000 0.0003 0.0030 0.0138 0.0393 0.0811 0.1319 0.1771 0.2013 0.1964 15 8 0.0000 0.0000 0.0005 0.0035 0.0131 0.0348 0.0710 0.1181 0.1647 0.1964 15 9 0.0000 0.0000 0.0001 0.0007 0.0034 0.0116 0.0298 0.0612 0.1048 0.1527

15 10 0.0000 0.0000 0.0000 0.0001 0.0007 0.0030 0.0096 0.0245 0.0515 0.0916 15 11 0.0000 0.0000 0.0000 0.0000 0.0001 0.0006 0.0024 0.0074 0.0191 0.0417 15 12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0004 0.0016 0.0052 0.0139 15 13 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0010 0.0032 15 14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 15 15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000

16 0 0.4401 0.1853 0.0743 0.0281 0.0100 0.0033 0.0010 0.0003 0.0001 0.0000 16 1 0.3706 0.3294 0.2097 0.1126 0.0535 0.0228 0.0087 0.0030 0.0009 0.0002 16 2 0.1463 0.2745 0.2775 0.2111 0.1336 0.0732 0.0353 0.0150 0.0056 0.0018 16 3 0.0359 0.1423 0.2285 0.2463 0.2079 0.1465 0.0888 0.0468 0.0215 0.0085 16 4 0.0061 0.0514 0.1311 0.2001 0.2252 0.2040 0.1553 0.1014 0.0572 0.0278

16 5 0.0008 0.0137 0.0555 0.1201 0.1802 0.2099 0.2008 0.1623 0.1123 0.0667 16 6 0.0001 0.0028 0.0180 0.0550 0.1101 0.1649 0.1982 0.1983 0.1684 0.1222 16 7 0.0000 0.0004 0.0045 0.0197 0.0524 0.1010 0.1524 0.1889 0.1969 0.1746 16 8 0.0000 0.0001 0.0009 0.0055 0.0197 0.0487 0.0923 0.1417 0.1812 0.1964 16 9 0.0000 0.0000 0.0001 0.0012 0.0058 0.0185 0.0442 0.0840 0.1318 0.1746

16 10 0.0000 0.0000 0.0000 0.0002 0.0014 0.0056 0.0167 0.0392 0.0755 0.1222 16 11 0.0000 0.0000 0.0000 0.0000 0.0002 0.0013 0.0049 0.0142 0.0337 0.0667 16 12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0011 0.0040 0.0115 0.0278 16 13 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0008 0.0029 0.0085 16 14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0018

16 15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 16 16 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000

Page 183: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

166

n k p

0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50

17 0 0.4181 0.1668 0.0631 0.0225 0.0075 0.0023 0.0007 0.0002 0.0000 0.0000 17 1 0.3741 0.3150 0.1893 0.0957 0.0426 0.0169 0.0060 0.0019 0.0005 0.0001 17 2 0.1575 0.2800 0.2673 0.1914 0.1136 0.0581 0.0260 0.0102 0.0035 0.0010 17 3 0.0415 0.1556 0.2359 0.2393 0.1893 0.1245 0.0701 0.0341 0.0144 0.0052 17 4 0.0076 0.0605 0.1457 0.2093 0.2209 0.1868 0.1320 0.0796 0.0411 0.0182

17 5 0.0010 0.0175 0.0668 0.1361 0.1914 0.2081 0.1849 0.1379 0.0875 0.0472 17 6 0.0001 0.0039 0.0236 0.0680 0.1276 0.1784 0.1991 0.1839 0.1432 0.0944 17 7 0.0000 0.0007 0.0065 0.0267 0.0668 0.1201 0.1685 0.1927 0.1841 0.1484 17 8 0.0000 0.0001 0.0014 0.0084 0.0279 0.0644 0.1134 0.1606 0.1883 0.1855 17 9 0.0000 0.0000 0.0003 0.0021 0.0093 0.0276 0.0611 0.1070 0.1540 0.1855

17 10 0.0000 0.0000 0.0000 0.0004 0.0025 0.0095 0.0263 0.0571 0.1008 0.1484 17 11 0.0000 0.0000 0.0000 0.0001 0.0005 0.0026 0.0090 0.0242 0.0525 0.0944 17 12 0.0000 0.0000 0.0000 0.0000 0.0001 0.0006 0.0024 0.0081 0.0215 0.0472 17 13 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0021 0.0068 0.0182 17 14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0004 0.0016 0.0052

17 15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0010 17 16 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 17 17 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000

18 0 0.3972 0.1501 0.0536 0.0180 0.0056 0.0016 0.0004 0.0001 0.0000 0.0000 18 1 0.3763 0.3002 0.1704 0.0811 0.0338 0.0126 0.0042 0.0012 0.0003 0.0001 18 2 0.1683 0.2835 0.2556 0.1723 0.0958 0.0458 0.0190 0.0069 0.0022 0.0006 18 3 0.0473 0.1680 0.2406 0.2297 0.1704 0.1046 0.0547 0.0246 0.0095 0.0031 18 4 0.0093 0.0700 0.1592 0.2153 0.2130 0.1681 0.1104 0.0614 0.0291 0.0117

18 5 0.0014 0.0218 0.0787 0.1507 0.1988 0.2017 0.1664 0.1146 0.0666 0.0327 18 6 0.0002 0.0052 0.0301 0.0816 0.1436 0.1873 0.1941 0.1655 0.1181 0.0708 18 7 0.0000 0.0010 0.0091 0.0350 0.0820 0.1376 0.1792 0.1892 0.1657 0.1214 18 8 0.0000 0.0002 0.0022 0.0120 0.0376 0.0811 0.1327 0.1734 0.1864 0.1669 18 9 0.0000 0.0000 0.0004 0.0033 0.0139 0.0386 0.0794 0.1284 0.1694 0.1855

18 10 0.0000 0.0000 0.0001 0.0008 0.0042 0.0149 0.0385 0.0771 0.1248 0.1669 18 11 0.0000 0.0000 0.0000 0.0001 0.0010 0.0046 0.0151 0.0374 0.0742 0.1214 18 12 0.0000 0.0000 0.0000 0.0000 0.0002 0.0012 0.0047 0.0145 0.0354 0.0708 18 13 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0012 0.0045 0.0134 0.0327 18 14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0011 0.0039 0.0117

18 15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0009 0.0031 18 16 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0006 18 17 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 18 18 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000

19 0 0.3774 0.1351 0.0456 0.0144 0.0042 0.0011 0.0003 0.0001 0.0000 0.0000 19 1 0.3774 0.2852 0.1529 0.0685 0.0268 0.0093 0.0029 0.0008 0.0002 0.0000 19 2 0.1787 0.2852 0.2428 0.1540 0.0803 0.0358 0.0138 0.0046 0.0013 0.0003 19 3 0.0533 0.1796 0.2428 0.2182 0.1517 0.0869 0.0422 0.0175 0.0062 0.0018 19 4 0.0112 0.0798 0.1714 0.2182 0.2023 0.1491 0.0909 0.0467 0.0203 0.0074

19 5 0.0018 0.0266 0.0907 0.1636 0.2023 0.1916 0.1468 0.0933 0.0497 0.0222 19 6 0.0002 0.0069 0.0374 0.0955 0.1574 0.1916 0.1844 0.1451 0.0949 0.0518 19 7 0.0000 0.0014 0.0122 0.0443 0.0974 0.1525 0.1844 0.1797 0.1443 0.0961 19 8 0.0000 0.0002 0.0032 0.0166 0.0487 0.0981 0.1489 0.1797 0.1771 0.1442 19 9 0.0000 0.0000 0.0007 0.0051 0.0198 0.0514 0.0980 0.1464 0.1771 0.1762

19 10 0.0000 0.0000 0.0001 0.0013 0.0066 0.0220 0.0528 0.0976 0.1449 0.1762 19 11 0.0000 0.0000 0.0000 0.0003 0.0018 0.0077 0.0233 0.0532 0.0970 0.1442 19 12 0.0000 0.0000 0.0000 0.0000 0.0004 0.0022 0.0083 0.0237 0.0529 0.0961 19 13 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0024 0.0085 0.0233 0.0518 19 14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0006 0.0024 0.0082 0.0222

Page 184: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

167

n k p

0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50

19 15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0022 0.0074 19 16 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0018 19 17 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 19 18 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 19 19 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000

20 0 0.3585 0.1216 0.0388 0.0115 0.0032 0.0008 0.0002 0.0000 0.0000 0.0000 20 1 0.3774 0.2702 0.1368 0.0576 0.0211 0.0068 0.0020 0.0005 0.0001 0.0000 20 2 0.1887 0.2852 0.2293 0.1369 0.0669 0.0278 0.0100 0.0031 0.0008 0.0002 20 3 0.0596 0.1901 0.2428 0.2054 0.1339 0.0716 0.0323 0.0123 0.0040 0.0011 20 4 0.0133 0.0898 0.1821 0.2182 0.1897 0.1304 0.0738 0.0350 0.0139 0.0046

20 5 0.0022 0.0319 0.1028 0.1746 0.2023 0.1789 0.1272 0.0746 0.0365 0.0148 20 6 0.0003 0.0089 0.0454 0.1091 0.1686 0.1916 0.1712 0.1244 0.0746 0.0370 20 7 0.0000 0.0020 0.0160 0.0545 0.1124 0.1643 0.1844 0.1659 0.1221 0.0739 20 8 0.0000 0.0004 0.0046 0.0222 0.0609 0.1144 0.1614 0.1797 0.1623 0.1201 20 9 0.0000 0.0001 0.0011 0.0074 0.0271 0.0654 0.1158 0.1597 0.1771 0.1602

20 10 0.0000 0.0000 0.0002 0.0020 0.0099 0.0308 0.0686 0.1171 0.1593 0.1762 20 11 0.0000 0.0000 0.0000 0.0005 0.0030 0.0120 0.0336 0.0710 0.1185 0.1602 20 12 0.0000 0.0000 0.0000 0.0001 0.0008 0.0039 0.0136 0.0355 0.0727 0.1201 20 13 0.0000 0.0000 0.0000 0.0000 0.0002 0.0010 0.0045 0.0146 0.0366 0.0739 20 14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0012 0.0049 0.0150 0.0370

20 15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0003 0.0013 0.0049 0.0148 20 16 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0003 0.0013 0.0046 20 17 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0011 20 18 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 20 19 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 20 20 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000

Page 185: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

168

APÉNDICE 5

Distribución t de Student:

Significancia de correlaciones de Pearson

Grados de libertad gl= N-2

Niveles de significación a dos colas 0.050 0.025 0.010 0.005

1 0.988 0.997 1.000 1.000

2 0.900 0.950 0.980 0.990

3 0.805 0.878 0.934 0.959

4 0.729 0.811 0.882 0.917

5 0.669 0.754 0.833 0.874

6 0.622 0.707 0.789 0.834

7 0.582 0.666 0.750 0.798

8 0.549 0.632 0.716 0.765

9 0.521 0.602 0.685 0.735

10 0.497 0.576 0.658 0.708

11 0.476 0.553 0.634 0.684

12 0.458 0.532 0.612 0.661

13 0.441 0.514 0.592 0.641

14 0.426 0.497 0.574 0.623

15 0.412 0.482 0.558 0.606

16 0.400 0.468 0.542 0.590

17 0.389 0.456 0.528 0.575

18 0.378 0.444 0.516 0.561

19 0.369 0.433 0.503 0.549

20 0.360 0.423 0.492 0.537

21 0.352 0.413 0.482 0.526

22 0.344 0.404 0.472 0.515

23 0.337 0.396 0.462 0.505

24 0.330 0.388 0.453 0.496

25 0.323 0.381 0.445 0.487

26 0.317 0.374 0.437 0.479

27 0.311 0.367 0.430 0.471

28 0.306 0.361 0.423 0.463

29 0.301 0.355 0.416 0.456

30 0.296 0.349 0.409 0.449

35 0.275 0.325 0.381 0.418

40 0.257 0.304 0.358 0.393

45 0.243 0.288 0.338 0.372

50 0.231 0.273 0.322 0.354

60 0.211 0.250 0.295 0.325

70 0.195 0.232 0.274 0.303

80 0.183 0.217 0.256 0.283

90 0.173 0.205 0.242 0.267

100 0.164 0.195 0.230 0.254

0.10 0.050 0.02 0.01

Niveles de significación a una cola

Page 186: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

169

APÉNDICE 6

Valores críticos del estadístico de Q

Gl (N – K)

α 0 0 ( r a ) y α 0 0 ( e r tas) K niveles de K

2 3 4 5 6 7 8 9 10

5 3.64 4.60 5.22 5.67 6.03 6.33 6.58 6.80 6.99 5.70 6.98 7.80 8.42 8.91 9.32 9.67 9.97 10.24

6 3.46 4.34 4.90 5.30 5.63 5.90 6.12 6.32 6.49 5.24 6.33 7.03 7.56 7.97 8.32 8.61 8.87 9.10

7 3.34 4.16 4.68 5.06 5.36 5.61 5.82 6.00 6.16 4.95 5.92 6.54 7.01 7.37 7.68 7.94 8.17 8.37

8 3.26 4.04 4.53 4.89 5.17 5.40 5.60 5.77 5.92 4.75 5.64 6.20 6.62 6.96 7.24 7.47 7.68 7.86

9 3.20 3.95 4.41 4.76 5.02 5.24 5.43 5.59 5.74 4.60 5.43 5.96 6.35 6.66 6.91 7.13 7.33 7.49

10 3.15 3.88 4.33 4.65 4.91 5.12 5.30 5.46 5.60 4.48 5.27 5.77 6.14 6.43 6.67 6.87 7.05 7.21

11 3.11 3.82 4.26 4.57 4.82 5.03 5.20 5.35 5.49 4.39 5.15 5.62 5.97 6.25 6.48 6.67 6.84 6.99

12 3.08 3.77 4.20 4.51 4.75 4.95 5.12 5.27 5.39 4.32 5.05 5.50 5.84 6.10 6.32 6.51 6.67 6.81

13 3.06 3.73 4.15 4.45 4.69 4.88 5.05 5.19 5.32 4.26 4.96 5.40 5.73 5.98 6.19 6.37 6.53 6.67

14 3.03 3.70 4.11 4.41 4.64 4.83 4.99 5.13 5.25 4.21 4.89 5.32 5.63 5.88 6.08 6.26 6.41 6.54

15 3.01 3.67 4.08 4.37 4.59 4.78 4.94 5.08 5.20 4.17 4.84 5.25 5.56 5.80 5.99 6.16 6.31 6.44

16 3.00 3.65 4.05 4.33 4.56 4.74 4.90 5.03 5.15 4.13 4.79 5.19 5.49 5.72 5.92 6.08 6.22 6.35

17 2.98 3.63 4.02 4.30 4.52 4.70 4.86 4.99 5.11 4.10 4.74 5.14 5.43 5.66 5.85 6.01 6.15 6.27

18 2.97 3.61 4.00 4.28 4.49 4.67 4.82 4.96 5.07 4.07 4.70 5.09 5.38 5.60 5.79 5.94 6.08 6.20

19 2.96 3.59 3.98 4.25 4.47 4.65 4.79 4.92 5.04 4.05 4.67 5.05 5.33 5.55 5.73 5.89 6.02 6.14

20 2.95 3.58 3.96 4.23 4.45 4.62 4.77 4.90 5.01 4.02 4.64 5.02 5.29 5.51 5.69 5.84 5.97 6.09

24 2.92 3.53 3.90 4.17 4.37 4.54 4.68 4.81 4.92 3.96 4.55 4.91 5.17 5.37 5.54 5.69 5.81 5.92

30 2.89 3.49 3.85 4.10 4.30 4.46 4.60 4.72 4.82 3.89 4.45 4.80 5.05 5.24 5.40 5.54 5.65 5.76

40 2.86 3.44 3.79 4.04 4.23 4.39 4.52 4.63 4.73 3.82 4.37 4.70 4.93 5.11 5.26 5.39 5.50 5.60

60 2.83 3.40 3.74 3.98 4.16 4.31 4.44 4.55 4.65 3.76 4.28 4.59 4.82 4.99 5.13 5.25 5.36 5.45

120 2.80 3.36 3.68 3.92 4.10 4.24 4.36 4.47 4.56 3.70 4.20 4.50 4.71 4.87 5.01 5.12 5.21 5.30

∞ 2.77 3.31 3.63 3.86 4.03 4.17 4.29 4.39 4.47 3.64 4.12 4.40 4.60 4.76 4.88 4.99 5.08 5.16

Page 187: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

170

APÉNDICE 7

Tabla de números al azar

Primera serie

1 - 4 5 - 8 9 - 12 13 - 16 17 - 20 21 - 24 25 - 28 29 - 32 33 - 36 37 - 40 1 20 77 81 43 63 92 68 61 70 79 88 81 05 47 63 07 13 10 46 19 2 09 42 70 58 14 76 27 02 29 73 87 66 47 73 31 59 02 96 41 07 3 93 04 55 07 83 92 26 76 50 57 05 97 12 85 01 30 82 45 52 08 4 95 99 93 67 54 96 35 98 84 64 80 88 29 39 07 00 97 95 59 24 5 40 82 40 08 05 80 60 50 33 93 68 58 83 62 06 09 20 56 91 36

6 78 11 44 01 19 42 06 02 32 19 99 23 94 02 29 27 29 38 17 82 7 56 41 30 34 77 26 83 55 26 08 69 53 66 16 19 43 77 69 70 77 8 76 42 48 52 69 11 70 01 23 21 99 22 30 75 42 61 99 20 91 90 9 41 14 93 39 41 11 56 76 60 04 24 75 18 06 14 42 91 25 31 92

10 17 42 51 18 60 28 10 87 61 25 88 92 04 30 90 80 32 26 91 22

11 96 66 80 87 48 97 22 47 84 24 58 51 41 10 54 26 93 19 90 20 12 24 81 91 42 70 40 96 75 48 30 48 66 21 54 20 98 12 00 86 61 13 78 65 68 07 07 95 15 50 67 10 01 62 36 75 93 76 40 54 97 68 14 29 27 78 63 25 00 14 51 15 18 18 14 03 96 63 08 85 49 16 14 15 34 16 38 45 71 04 00 72 44 03 63 46 49 56 50 76 57 32 84 43

16 82 76 24 97 43 39 05 39 93 69 61 80 25 47 90 15 70 06 74 13 17 18 93 50 05 65 07 39 37 51 99 78 42 52 78 82 86 81 17 69 09 18 46 84 90 64 55 19 12 20 32 11 56 30 00 54 75 95 54 22 80 38 19 59 52 94 41 54 33 08 80 51 39 35 64 22 90 59 82 79 76 23 22 20 38 12 76 09 53 32 80 07 19 34 18 55 60 86 33 22 36 15 79 85

21 14 72 18 71 55 19 09 25 27 36 10 35 60 87 96 55 74 86 08 54 22 44 29 94 19 34 91 62 94 56 81 35 00 79 15 62 92 66 16 67 29 23 50 10 67 79 43 27 66 85 52 00 97 65 07 58 31 74 90 09 24 75 24 11 19 88 34 80 11 94 03 56 28 53 52 86 83 51 38 97 02 50 20 25 12 16 81 62 90 38 45 23 13 08 18 57 67 45 15 75 86 07 77 57

Page 188: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

171

Segunda serie

1 - 4 5 - 8 9 - 12 13 - 16 17 - 20 21 - 24 25 - 28 29 - 32 33 - 36 37 - 40 1 83 79 21 68 54 51 23 50 78 17 73 51 94 71 91 31 29 97 13 16 2 27 98 04 97 52 48 19 33 82 16 00 34 30 67 58 00 80 80 92 26 3 75 57 42 55 59 91 72 75 66 75 39 70 55 24 09 19 70 22 42 10 4 60 73 07 27 71 94 68 70 48 81 40 91 16 24 45 24 54 03 18 03 5 27 42 15 67 94 44 48 62 37 53 83 15 90 90 60 19 78 62 44 70

6 57 27 77 75 38 18 24 32 91 53 78 91 33 38 31 95 85 11 33 87 7 22 79 42 39 32 65 83 60 74 63 56 77 47 21 88 36 43 10 19 41 8 61 94 32 42 83 81 92 40 99 00 05 66 33 61 32 10 43 15 49 25 9 24 28 53 76 13 61 73 22 50 51 75 08 10 90 71 58 22 42 46 83

10 06 75 46 13 77 68 97 05 56 73 34 86 42 22 37 75 94 87 57 72

11 83 81 98 41 67 38 97 30 12 31 87 76 81 07 32 88 42 29 94 58 12 33 66 09 91 21 26 52 57 47 14 27 75 07 84 50 96 95 12 25 01 13 63 14 10 59 10 68 27 91 00 17 36 79 01 79 65 43 13 98 52 21 14 84 43 66 38 65 72 14 55 93 78 24 57 38 10 54 53 92 41 82 56 15 36 75 92 36 76 77 89 27 06 57 37 70 36 09 99 90 66 44 91 89

16 17 23 20 39 81 03 49 79 68 20 94 45 95 92 63 06 55 29 20 82 17 57 09 57 60 40 64 00 77 31 05 83 44 96 62 56 42 42 68 46 42 18 33 49 47 96 50 21 75 68 28 12 46 25 72 64 50 72 75 16 67 00 19 80 52 82 00 02 12 67 61 43 23 14 53 10 66 16 29 06 60 23 20 20 45 29 44 64 44 70 22 10 70 26 43 49 28 51 69 52 85 95 98 58

21 16 04 54 67 60 53 51 60 82 45 56 26 08 89 42 25 93 76 69 73 22 81 09 97 91 19 60 91 96 53 66 45 33 75 09 67 42 59 02 18 97 23 20 61 83 96 58 12 64 99 78 24 94 36 99 60 07 70 27 40 97 15 24 43 17 00 05 86 39 95 58 12 35 84 31 97 75 50 52 06 88 27 79 25 27 84 00 90 41 44 05 43 36 93 01 37 91 93 24 78 00 12 04 12

Page 189: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

172

Tercera serie

1 - 4 5 - 8 9 - 12 13 - 16 17 - 20 21 - 24 25 - 28 29 - 32 33 - 36 37 - 40 1 35 87 68 11 29 27 78 34 74 92 86 13 33 22 34 75 59 44 61 63 2 16 58 21 36 34 35 92 56 72 85 03 91 31 33 26 62 08 30 95 09 3 44 20 51 20 95 87 87 37 37 05 06 43 61 75 51 99 52 03 23 29 4 36 04 26 10 46 13 47 92 34 02 53 54 97 57 24 18 37 62 98 35 5 92 15 17 81 81 67 17 00 76 64 77 34 20 18 88 01 88 31 18 40

6 29 12 08 74 26 94 48 03 85 60 23 69 65 52 53 18 26 72 47 62 7 19 37 78 71 07 12 90 53 13 34 19 49 81 36 85 96 19 81 68 65 8 14 92 75 64 31 51 00 20 86 47 07 04 40 26 57 62 34 95 57 17 9 02 19 07 98 20 98 21 10 69 15 39 55 80 23 80 26 63 33 81 26

10 31 18 25 46 66 31 15 27 09 80 13 44 72 58 42 93 71 72 69 17

11 51 96 70 26 99 94 81 55 72 29 57 37 29 36 99 55 35 99 22 79 12 11 78 29 90 66 21 63 60 39 87 77 34 55 26 56 94 74 43 71 04 13 93 10 34 79 41 18 07 79 30 84 77 27 07 40 54 24 90 96 43 63 14 19 32 42 52 58 31 29 38 39 31 00 68 71 25 28 05 27 55 56 18 15 26 84 50 36 62 73 35 95 56 00 76 61 16 40 08 80 71 87 20 48

16 05 50 36 40 59 22 90 33 76 82 58 66 30 65 68 23 38 98 39 92 17 45 14 18 03 19 34 32 93 93 37 97 11 37 04 64 62 60 53 86 33 18 71 44 13 65 14 74 67 80 11 11 01 90 47 58 36 86 13 68 85 64 19 47 46 52 39 25 41 96 96 98 22 11 51 90 91 82 16 96 43 11 05 20 33 95 58 94 59 65 09 99 47 45 70 06 60 66 75 22 43 93 79 62

21 28 74 81 01 28 31 47 96 55 75 26 61 48 51 10 20 50 43 83 28 22 33 68 25 37 96 38 70 64 36 19 60 48 71 41 05 53 77 56 81 78 23 85 38 32 52 85 14 64 87 82 11 85 11 19 29 80 35 09 99 54 23 24 04 29 07 21 28 33 85 69 93 51 57 30 02 14 58 12 84 34 30 71 25 47 20 21 03 47 88 47 25 51 49 70 21 07 71 07 03 08 69 69 35

Page 190: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

173

Cuarta serie

1 - 4 5 - 8 9 - 12 13 - 16 17 - 20 21 - 24 25 - 28 29 - 32 33 - 36 37 - 40 1 72 43 49 72 61 99 36 48 80 20 10 31 66 31 84 83 87 39 93 25 2 34 71 89 58 13 15 56 47 41 24 57 70 96 69 59 17 28 25 55 05 3 94 75 59 95 98 99 88 03 83 67 75 75 92 73 56 60 91 80 59 53 4 28 97 88 17 22 80 49 80 81 22 07 83 41 63 15 27 25 72 00 01 5 75 89 87 84 83 13 56 59 46 28 26 11 62 28 81 61 42 86 35 50

6 77 44 16 92 59 93 41 27 08 86 09 45 47 43 35 19 66 71 81 08 7 46 06 66 76 61 89 59 75 61 68 68 50 47 98 47 21 84 05 52 95 8 53 46 28 21 43 74 40 07 15 60 52 15 39 94 67 29 90 83 08 61 9 55 23 44 40 08 34 48 33 12 12 28 12 69 81 14 58 25 01 00 13

10 38 44 74 56 06 24 85 13 22 04 07 70 00 18 43 99 03 53 77 98

11 08 12 50 56 81 86 61 59 77 00 11 71 00 47 29 62 68 87 25 30 12 34 27 77 14 64 22 20 77 22 41 50 92 51 67 70 54 14 26 54 47 13 19 98 90 19 27 12 80 34 87 97 73 09 98 80 66 74 77 59 11 54 14 39 05 72 32 69 87 95 50 82 76 50 79 82 18 72 77 88 60 92 11 15 38 96 83 88 05 76 23 20 09 33 08 02 10 74 93 22 09 75 83 23

16 72 94 21 37 57 90 48 48 43 96 66 75 33 08 09 65 62 00 94 38 17 86 61 52 23 80 46 97 81 15 83 88 88 71 98 73 73 43 63 93 74 18 14 78 87 24 89 77 62 94 19 26 16 08 78 08 97 24 19 03 47 46 19 24 17 92 19 81 85 71 91 02 41 45 08 44 99 72 36 84 23 59 51 20 92 52 08 30 47 44 31 36 80 12 73 65 98 06 15 69 59 18 38 58

21 94 47 16 55 89 88 64 29 02 59 48 90 06 90 57 14 65 55 75 97 22 47 21 92 90 36 20 85 34 96 73 11 69 71 36 65 16 49 89 41 78 23 76 89 16 29 20 24 00 47 33 89 74 11 59 62 84 53 03 14 74 77 24 90 93 86 13 61 32 15 62 99 30 63 47 88 87 86 12 59 30 69 44 25 44 93 41 83 33 43 31 74 85 47 44 45 91 36 40 48 56 84 10 09

Page 191: ESTADÍSTICAS APLICADAS EN PSICOLOGÍAhumberto-r-alvarez-a.webs.com/Varios/ESTADISTICAS.pdf · medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos

174

BIBLIOGRAFÍA

1. Aron, A., Aron E. (2001). Estadística para Psicología. Buenos Aires: Pearson Education, S.A.

2. Cohen, R., Swerdlik, M. (2001). Pruebas y Evaluación Psicológica. México: McGraw-

Hill/Interamericana de México, S.A.

3. Chow, Ya-Lun (1977). Análisis Estadístico. México: Nueva Editorial Interamericana, S.A.

4. Daniel, Wayne (1995). Estadísticas con Aplicaciones a las Ciencias Sociales y a la Educación.

México: McGraw-Hill/Interamericana de México, S.A.

5. Hopkins K., Hopkins, B.R., Glass, Gene (1997). Estadísticas Básica par a las Ciencias

Sociales y del Comportamiento. 3ª. Edición. México: Pearson Education

6. Kerlinger, F., Lee,H. (2002) Investigación del Comportamiento. Métodos de Investigación en

Ciencias Sociales. México: McGraw-Hill/Interamericana de México, S.A.

7. Pagano, Robert (2006). Estadísticas para las Ciencias del Comportamiento. 7ª. Edición.

México: Editorial Thompson.

8. Pagano, Robert (2001). Bioestadísticas. México: Editorial Thompson.

9. Pérez, César (2002). Estadística aplicada a través de Excel. México: Pearson Education, S.A.

10. Ritchey, Ferris (2008). Estadísticas para las Ciencias Sociales. 2ª. Edición. México: McGraw-

Hill/Interamericana de México, S.A.

11. Triola, Mario (2004). Estadística. 9ª. Edición. México: Pearson Education.

12. Walpole,R, Myers, R. (1992). Probabilidad y Estadística. México: Editorial McGraw-

Hill/Interamericana de México, S.A.