33
Transform en SPSS Martin Ordoñez Ylenia Quintana

Transformar en spss

Embed Size (px)

Citation preview

Page 1: Transformar en spss

Transform en SPSS

Martin Ordoñez

Ylenia Quintana

Page 2: Transformar en spss

Transformar:

•Modificación y generación de nuevas variables. Las funciones de este menú son temporales y sólo están vigentes durante la sesión sin que afecten al archivo original de datos. Si queremos que sean permanentes debemos grabar los cambios.

Page 3: Transformar en spss

Calcular variable:Se usa para calcular los valores de una variable basándose en transformaciones numéricas de otras variables.• Puede calcular valores para las variables numéricas o

de cadena (alfanuméricas).• Puede crear nuevas variables o bien reemplazar los

valores de las variables existentes. Para las nuevas variables, también se puede especificar el tipo y la etiqueta de variable.

• Puede calcular valores de forma selectiva para subconjuntos de datos basándose en condiciones lógicas.

• Puede utilizar una gran variedad de funciones pre-incorporadas, incluyendo funciones aritméticas, funciones estadísticas, funciones de distribución y funciones de cadena.

Page 4: Transformar en spss
Page 5: Transformar en spss

Contar valores dentro de los casos:• Este cuadro de diálogo crea una variable

que, para cada caso, cuenta las apariciones del mismo valor, o valores, en una lista de variables. Por ejemplo, un estudio podrá contener una lista de revistas con las casillas de verificación sí/no para indicar qué revistas lee cada encuestado. Se podría contar el número de respuestas sí de cada encuestado para crear una nueva variable que contenga el número total de revistas leídas.

Page 6: Transformar en spss
Page 7: Transformar en spss

Valores de cambio.Cambiar valores crea nuevas variables que contienen los valores de variables existentes de casos anteriores o posteriores.• Nombre. Nombre de la nueva variable. Debe ser un

nombre que ya no existe en el conjunto de datos activo.

• Obtener el valor de un caso anterior (retardo). Obtener el valor de un caso anterior en el conjunto de datos activo. Por ejemplo, con el número predeterminado del valor de casos 1, cada caso de la nueva variable tiene el valor de la variable original del caso que la precede.

• Obtener el valor del caso posterior (adelanto). Obtener el valor de un caso posterior en el conjunto de datos activo. Por ejemplo, con el número predeterminado del valor de casos 1, cada caso de la nueva variable tiene el valor de la variable original del caso siguiente.

Page 8: Transformar en spss

Número de casos que se cambiarán. Obtener el valor del caso nanterior o siguiente, donde n es el valor especificado. El valor debe ser un entero no negativo.• Si se activa el procesamiento de segmentación de archivos, el cambio

se limita a cada grupo de segmentación. Un valor de cambio no se puede obtener a partir de un caso en un grupo de segmentación anterior o posterior.

• El estado del filtro se ignora.• El valor de la variable de resultado está definido como valores

perdidos del sistema para el primer o último caso n del conjunto de datos o grupo de segmentación, donde n es el valor especificado para Número de casos que se cambiarán. Por ejemplo, si utiliza el método de retardo con un valor de 1, definirá la variable de resultados como valor perdidos del sistema para el primer caso del conjunto de datos (o el primer caso en cada grupo de segmentación).

• Se conservan los valores perdidos del usuario.• La información del diccionario de la variable original, incluyendo

etiquetas de valor definidas y asignaciones de valores perdidos del usuario, se aplica a la nueva variable. (Nota: los atributos de la variable personalizada no se incluyen).

• Se genera automáticamente una etiqueta de variable que describe la operación de cambio que ha creado la variable.

Page 9: Transformar en spss
Page 10: Transformar en spss

Recodificar en las mismas variable.•El cuadro de diálogo Recodificar en las

mismas variables le permite reasignar los valores de las variables existentes o agrupar rangos de valores existentes en nuevos valores. Por ejemplo, podría agrupar los salarios en categorías que sean rangos de salarios.

•Puede recodificar las variables numéricas y de cadena. Si selecciona múltiples variables, todas deben ser del mismo tipo. No se pueden recodificar juntas las variables numéricas y de cadena.

Page 11: Transformar en spss
Page 12: Transformar en spss

Recodificar en distintas variables• El cuadro de diálogo Recodificar en distintas variables

le permite reasignar los valores de las variables existentes o agrupar rangos de valores existentes en nuevos valores para una variable nueva. Por ejemplo, podría agrupar los salarios en una nueva variable que contenga categorías de rangos de salarios.

• Puede recodificar las variables numéricas y de cadena.• Puede recodificar variables numéricas en variables de

cadena y viceversa.• Si selecciona múltiples variables, todas deben ser del

mismo tipo. No se pueden recodificar juntas las variables numéricas y de cadena.

Page 13: Transformar en spss
Page 14: Transformar en spss

Recodificación automática• El cuadro de diálogo Recodificación automática le permite convertir

los valores numéricos y de cadena en valores enteros consecutivos. Si los códigos de la categoría no son secuenciales, las casillas vacías resultantes reducen el rendimiento e incrementan los requisitos de memoria de muchos procedimientos. Además, algunos procedimientos no pueden utilizar variables de cadena y otros requieren valores enteros consecutivos para los niveles de los factores.

• La nueva variable, o variables, creadas por la recodificación automática conservan todas las etiquetas de variable y de valor definidas de la variable antigua. Para los valores que no tienen una etiqueta de valor ya definida se utiliza el valor original como etiqueta del valor recodificado. Una tabla muestra los valores antiguos, los nuevos y las etiquetas de valor.

• Los valores de cadena se recodifican por orden alfabético, con las mayúsculas antes que las minúsculas.

• Los valores perdidos se recodifican como valores perdidos mayores que cualquier valor no perdido y conservando el orden. Por ejemplo, si la variable original posee 10 valores no perdidos, el valor perdido mínimo se recodificará como 11, y el valor 11 será un valor perdido para la nueva variable.

Page 15: Transformar en spss
Page 16: Transformar en spss

Agrupación Visual • La agrupación visual está concebida para ayudarle en el

proceso de creación de nuevas variables basadas en la agrupación de los valores contiguos de las variables existentes para dar lugar a un número limitado de categorías diferentes. Puede utilizar la agrupación visual para:

• Crear variables categóricas a partir de variables de escala continuas. Por ejemplo, puede utilizar una variable de escala con los ingresos para crear una variable categórica nueva que contenga intervalos de ingresos.

• Colapsar un número elevado de categorías ordinales en un conjunto menor de categorías. Por ejemplo, es posible colapsar una escala de evaluación de nueve categorías en tres categorías que representen: bajo, medio y alto.

Page 17: Transformar en spss
Page 18: Transformar en spss

Intervalos óptimos• El procedimiento Intervalos óptimos discretiza una o más variables de

escala (a las que denominaremos en lo sucesivo variables de entrada que se van a agrupar) mediante la distribución de los valores de cada variable en intervalos. La formación de intervalos es óptima en relación con una variable guía categórica que "supervisa" el proceso de agrupación. Los intervalos se pueden utilizar en lugar de los valores de datos originales para posteriores análisis.

Ejemplos. La reducción del número de valores distintos que puede tomar una variable tiene varios usos, entre los que se incluyen:• Requisitos de los datos de otros procedimientos. Las variables

discretizadas pueden tratarse como categóricas y utilizarse en procedimientos que requieren variables categóricas. Por ejemplo, el procedimiento Tablas cruzadas requiere que todas las variables sean categóricas.

• Privacidad de los datos. Utilizar en los informes los valores agrupados en vez de los valores reales puede ayudar a proteger la privacidad de los orígenes de los datos. El procedimiento Intervalos óptimos puede ayudarle a elegir los intervalos adecuados.

• Agilización del rendimiento. Algunos procedimientos son más eficientes cuando trabajan con un número reducido de valores distintos. Por ejemplo, la velocidad de la regresión logística multinomial puede incrementarse utilizando variables discretizadas.

• Detección de la separación completa o quasi-completa de los datos.

Page 19: Transformar en spss
Page 20: Transformar en spss

Preparar datos para modelados

• La preparación de los datos para su análisis es uno de los pasos más importantes en cualquier proyecto y, tradicionalmente, uno de los que más tiempo requieren. Preparación automática de datos (ADP) controla las tareas automáticamente, analizando los datos e identificando problemas, filtrando campos problemáticos o sin posibilidades de ser útiles, derivando nuevos atributos cuando sea necesario y mejorando el rendimiento mediante técnicas de filtrado inteligente.

Page 21: Transformar en spss

• Puede utilizar el algoritmo de una forma totalmente automática, permitiendo seleccionar y aplicar soluciones; o de forma interactiva, previendo los cambios antes de que se realicen y aceptarlos o rechazarlos según sea necesario.

• ADP permite hacer que sus datos estén listos para la generación de modelos de forma rápida y fácil, sin necesidad de tener conocimientos previos de los conceptos previos implicados. Los modelos tienden a crearse y puntuarse con mayor rapidez; además, el uso de ADP mejora la solidez de los procesos de modelado automatizados.

Page 22: Transformar en spss

Asignar rango a casos• El cuadro de diálogo Asignar rangos a los casos le permite crear

nuevas variables que contienen rangos, puntuaciones de Savage y normales, y los valores de los percentiles para las variables numéricas.

• Los nombres de las nuevas variables y las etiquetas de variable descriptivas se generan automáticamente en función del nombre de la variable original y de las medidas seleccionadas. Una tabla de resumen presenta una lista de las variables originales, las nuevas variables y las etiquetas de variable. (Nota: los nombres de nuevas variables generados automáticamente se limitan a una longitud máxima de 8 bytes).

Si lo desea, puede:• Asignar los rangos a los casos en orden ascendente o descendente.• Organizar las clasificaciones en subgrupos seleccionando una o más

variables de agrupación para la lista Por. Los rangos se calculan dentro de cada grupo, y los grupos se definen mediante la combinación de los valores de las variables de agrupación. Por ejemplo, si selecciona sexo y minoría como variables de agrupación, los rangos se calcularán para cada combinación de sexo y minoría.

Page 23: Transformar en spss
Page 24: Transformar en spss

Asistente fecha y hora

•El Asistente para fecha y hora simplifica ciertas tareas comunes asociadas a las variables de fecha y hora.

Page 25: Transformar en spss
Page 26: Transformar en spss

Crear serie temporal • El cuadro de diálogo Crear serie temporal crea nuevas

variables basadas en funciones de variables de series temporales numéricas existentes. Estos valores transformados son de gran utilidad en muchos procedimientos de análisis de series temporales.

• Los nombres por defecto de las nuevas variables se componen de los seis primeros caracteres de las variables existentes utilizadas para crearlas, seguidos por un carácter de subrayado y un número secuencial. Por ejemplo, para la variable precio, el nombre de la nueva variable sería precio_1. Las nuevas variables conservarían cualquier etiqueta de valor definida de las variables originales.

• Las funciones disponibles para crear variables de series temporales incluyen las funciones de diferencias, medias móviles, medianas móviles, retardo y adelanto

Page 27: Transformar en spss
Page 28: Transformar en spss

Remplazar valores perdidos• Las observaciones perdidas pueden causar problemas en los

análisis y algunas medidas de series temporales no se pueden calcular si hay valores perdidos en la serie. En ocasiones el valor para una observación concreta no se conoce. Además, los datos perdidos pueden ser el resultado de lo siguiente:

• Cada grado de diferenciación reduce la longitud de una serie en 1.• Cada grado de diferenciación estacional reduce la longitud de una

serie en una estación.• Si genera una serie nueva que contenga predicciones que

sobrepasen el final de la serie existente (al pulsar en el botón Guardar y realizar las selecciones adecuadas), la serie original y la serie residual generada incluirán datos perdidos para las observaciones nuevas.

• Algunas transformaciones (por ejemplo, la transformación logarítmica) generan datos perdidos para determinados valores de la serie original.

Page 29: Transformar en spss

• Los valores perdidos al principio o fin de una serie no suponen un problema especial; sencillamente acortan la longitud útil de la serie. Las discontinuidades que aparecen en mitad de una serie (datos incrustados perdidos) pueden ser un problema mucho más grave. El alcance del problema depende del procedimiento analítico que se utilice.

• El cuadro de diálogo Reemplazar valores perdidos crea nuevas variables de series temporales a partir de otras existentes, reemplazando los valores perdidos por estimaciones calculadas mediante uno de los distintos métodos posibles. Los nombres por defecto de las nuevas variables se componen de los seis primeros caracteres de las variables existentes utilizadas para crearlas, seguidos por un carácter de subrayado y un número secuencial. Por ejemplo, para la variable precio, el nombre de la nueva variable sería precio_1. Las nuevas variables conservarían cualquier etiqueta de valor definida de las variables originales.

Page 30: Transformar en spss
Page 31: Transformar en spss

Generador de números aleatorios• El cuadro de diálogo Generadores de números aleatorios le permite

seleccionar el generador de números aleatorios y establecer el valor de secuencia de inicio de modo que pueda reproducir una secuencia de números aleatorios.

• Generador activo. Hay dos generadores de números aleatorios disponibles:

• Versión 12 compatible. El generador de números aleatorios utilizado en la versión 12 y versiones anteriores. Utilice este generador de números aleatorios si necesita reproducir los resultados aleatorizados generados por versiones previas basadas en una semilla de aleatorización especificada.

• Tornado de Mersenne. Un generador de números aleatorios nuevo que es más fiable en los procesos de simulación. Utilice este generador de números aleatorios si no es necesario reproducir resultados aleatorizados correspondientes a SPSS 12 o anteriores.

Page 32: Transformar en spss

• Inicialización del generador activo. La semilla de aleatorización cambia cada vez que se genera un número aleatorio para utilizarlo en las transformaciones (como las funciones de distribución aleatorias), el muestreo aleatorio o la ponderación de los casos. Para replicar una secuencia de números aleatorios, establezca el valor de inicialización del punto de inicio antes de cada análisis que utilice los números aleatorios. El valor debe ser un entero positivo.

Page 33: Transformar en spss