Contenidos:
.........................................................................................
3
1. Generación de los reportes estadísticos en base a intervalos de
confianza
..........................................................................................
9
2. Determinación de valores atípicos
.................................................15
3. Generación de diagramas de caja
..................................................18
Aplicar el análisis exploratorio para identificar valores atípicos
y realizar comparaciones entre grupos.
ANÁLISIS EXPLORATORIO
Objetivo:
Contenidos:
1. Generación de reportes estadísticos en base a intervalos de
confianza
2. Determinación de valores atípicos
3. Generación de diagramas de caja
Introducción al diseño de una muestra aleatoria.
En este apartado consideraremos la generación de una muestra de una
población con distribución conocida pero de la que no disponemos de
datos. Por ejemplo, de una población con distribución Normal de
media 20 y desviación típica 5 vamos a generar 100 datos.
al que podemos llamar Normal .
SPSS genera los datos de una determinada distribución y los sitúa
en una columna con la longitud que tenga el banco de datos; es
decir, el número de filas con datos que aparezcan en el Editor de
datos. Dado que acabamos de crear el fichero, no contendrá ningún
dato, por lo que la primera operación a realizar será el rellenar
la primera columna con datos.
Para ello basta con que nos situemos en la casilla correspondiente
a la columna 1, fila 40 e insertemos el número 40.
Seleccionamos Transformar/Calcular y nos aparece la ventana de
calcular variables.
Página | 5
En el campo Variable de destino, escribimos m1 como nombre de la
variable que vamos a crear. De la lista de funciones que nos ofrece
el SPSS, seleccionamos RV.NORMAL (media,desv_típ)del grupo de
funciones
números aleatorios y , con el puntero la situamos en el campo
Expresión
numérica.
Página | 6
Página | 7
Página | 8
La siguiente tabla muestra algunas de las funciones que
proporcionan un valor aleatorio de una distribución determinada.
Los argumentos son los parámetros de la distribución. Pueden
consultar la ayuda del SPSS para obtener una lista exhaustiva de
todas las funciones disponibles.
Expresión Descripción
RV.UNIFORM(mín,máx) Devuelve un valor aleatorio de la distribución
uniforme, con el mínimo y el máximo especificados.
RV.NORMAL(media,desv_típ) Devuelve un valor aleatorio de la
distribución normal, con la media y la desviación típica
especificadas.
RV.GAMMA(forma,escala) Devuelve un valor aleatorio de la
distribución Gamma, con los parámetros de forma y escala
especificados.
RV.CHISQ(gl) Devuelve un valor aleatorio de la distribución de chi-
cuadrado, con los grados de libertad gl especificados.
Página | 9
Expresión Descripción
RV.WEIBULL(a,b) Devuelve un valor aleatorio de la distribución de
Weibull, con los parámetros especificados.
RV.BETA(forma1,forma2) Devuelve un valor aleatorio de una
distribución Beta, con los parámetros de forma especificados.
RV.T(gl) Devuelve un valor aleatorio de la distribución t de
Student, con los grados de libertad gl especificados.
1. Generación de los reportes estadísticos en base a
intervalos de confianza
En base a los datos de ventas presentado el mes de mayo (ver tabla
adjunta), se desea generar 20 datos aleatorios para pronosticar el
mes de junio. (RECUERDE QUE ESTAMOS EN MAYO Y EL OBJETIVO ES
POR MEDIO DE LA FUNCION RVNORMAL GENERAR LAS POSIBLES VENTAS DE
JUNIO).
Datos del mes de mayo:
Ejercicio 1:
Generar muestras de tamaño 40 para las distribuciones continuas
siguientes:
Uniforme (3,5) y Normal (3, 1.5)
Página | 13
Colocamos el nombre de la variable: “ALEATORIO” y luego en el
grupo
Números aleatorios escogemos la opción RvNormal
Página | 14
Y luego le pasamos a la expresión NUMERICA, al darle clic en
aceptar se genera los 20 números aleatorios, si en caso no pasa
dicha ventana es porque el separador del 82.01 no es el punto sino
la coma.
2. Determinación de valores atípicos
Al pulsar en el menú Analizar, se debe escoger la opción
Estadísticos descriptivos y dentro de ella Explorar,
Página | 16
En Lista de dependientes, pasamos una variable numérica para nuesto
caso VENTAS, y en la Lista de factores una variable que
segmenta para nuestro caso SEMANA,
Luego pulsamos en el botón Estadísticos :
3. Generación de diagramas de caja
De la misma forma en el menú ANALIZAR/Estadísticos
descriptivos/EXPLORAR.
Página | 19
Pulsamos sobre la opción Gráficos y verificamos que este escogido
la opción Niveles de los factores juntos.
Página | 20
La lectura se da en función de la caja que se encuentra más arriba
de las demás nos dice cuál es la semana de mayor venta, para este
ejemplo la semana cuatro, mientras que la caja más alta nos indica
la de mayor dispersión para este ejemplo la semana dos, y los
círculos representan los valores atípicos y el valor es el número
de caso al que pertenece en cada semana por ejemplo en la semana
tres un valor atípico es el caso 11, nos indica que es un valor muy
pequeño con respecto al resto.
Ejercicio 2: