65
1 Curso de Apoyo y Síntesis: Facultad de CCPP y Sociología UCM Dto. Sociología IV Becario de Colaboración: 2009/2010 S. Christian Orgaz Alonso ATENCIÓN: Material incompleto pendiente de revisión, no distribuir No es una versión final, pendiente de inserción de referencias bibliográficas, corrección final, etc. NO DISTRIBUIR. MATERIAL INCOMPLETO sujeto a erratas, errores y omisiones.

Curso de Apoyo y Síntesis:

  • Upload
    zayit

  • View
    42

  • Download
    0

Embed Size (px)

DESCRIPTION

Facultad de CCPP y Sociología UCM Dto. Sociología IV. Curso de Apoyo y Síntesis:. ATENCIÓN: Material incompleto pendiente de revisión, no distribuir. No es una versión final, pendiente de inserción de referencias bibliográficas, corrección final, etc. NO DISTRIBUIR. MATERIAL INCOMPLETO - PowerPoint PPT Presentation

Citation preview

1

Curso de Apoyo y Síntesis:

Facultad de CCPP y Sociología UCMDto. Sociología IV

Becario de Colaboración: 2009/2010S. Christian Orgaz Alonso

ATENCIÓN: Material incompleto pendiente de revisión, no distribuir.

No es una versión final, pendiente de inserción de referencias bibliográficas,

corrección final, etc. NO DISTRIBUIR. MATERIAL INCOMPLETO sujeto a erratas, errores y omisiones.

2

[email protected] del grupo (comunicación y envíos):

http://groups.google.com/group/spss2010

Dirección del grupo (descarga de archivos, en adelante esta función la suplirá la página pbwork):

[email protected]

Correo personal (comentarios, dudas individuales…):

http://spss2009.pbworks.com/

Página “pbwork”(diario del curso y descarga de archivos):

3

ÍNDICEUNIDAD 1:

APROXIMACIÓN AL ENTRONO SPSSUNIDAD 2:

ANALISIS UNIVERIABLEUNIDAD 3:

TRAMIENTO DE LOS DATOSUNIDAD 4:

TABLAS DE CONTINGENCIA UNIDAD 5:

COMPARACIÓN DE MEDIASUNIDAD 6:

CORRELACIÓN

4

ÍNDICE

UNIDAD 7: ANALISIS MULTIVARIABLE I REGRESIÓN LINEAL

UNIDAD 8:ANALISIS MULTIVARIABLE II

5

UNIDAD 0Conocimiento y “realidad”

Supuestos: ontológicos, epistemológicos, lo ideológico y la ciencia. La construcción del dato y las implicaciones del conocimiento. De la “realidad” a la base de datos, propuestas de aproximación.

6

UNIDAD 1APROXIMACIÓN AL ENTRONO SPSS

Variables, medidas, escalas. Definición de conceptos. Clasificación de variables. Codificación (de preguntas a variables). Presentación del entorno SPSS. Construcción de la matriz de datos.

7

NIVEL DE MEDIDA DE LAS VARIABLES

8

NIVEL DE MEDICIÓN DE LAS VARIABLES (I)

NOMINAL

ORDINAL

INTERVALORAZÓN

““CUALITATIVAS”” ““CUANTITATIVAS””

Elaboración: S. Christian Orgaz Alonso, 2009

9

NIVEL DE MEDICIÓN DE LAS VARIABLES (I)

NOMINAL

ORDINAL

INTERVALORAZÓN

““CUALITATIVAS”” ““CUANTITATIVAS””

Elaboración: S. Christian Orgaz Alonso, 2009

Sexo Clase Social Grados Centígrados Edad

10

NIVEL DE MEDICIÓN DE LAS VARIABLES (I)

NOMINAL

ORDINAL

INTERVALORAZÓN

Clasificación

OrdenClasificación

DistanciaOrdenClasificación

0 AbsolutoDistanciaOrdenClasificación

““CUALITATIVAS”” ““CUANTITATIVAS””

Sexo Clase Social Grados Centígrados Edad

Elaboración: S. Christian Orgaz Alonso, 2009

11

VARIABLES FICTICIAS O “DUMMY” (II)

DUMMY

Elaboración: S. Christian Orgaz Alonso, 2009

Variables Nominales u Ordinales

Sexo:Hombre = 1Mujer = 2

Sexo:Hombre = 1No Hombre = 0

---------------------------------Mujer = 1No Mujer = 0

Estado Civil:Soltero = 1Casado = 2Divorciado = 3

Estado Civil:Con pareja = 1Sin pareja= 0

12

NIVEL DE RELACIÓN DE LAS VARIABLES (II) [Dependencia estadística, Contraste de Hipótesis]

INDEPENDIENTE/S DEPENDIENTE

Elaboración: S. Christian Orgaz Alonso, 2009

INTERVINIENTES

¿Nominal, Ordinal o Intervalo Razón?

ESPURIAS

¿Nominal, Ordinal o Intervalo Razón?

Tipo de pruebaDe significación

Latentes

Un ejemplo de una relación espuria puede ser ilustrado examinando las ventas de helados de una ciudad. Éstas son más altas cuando la tasa de sofocam”ientos” es mayor. Sostener que la venta de helados causa los sofocamientos sería implicar una relación espuria entre las dos. En realidad, una ola de calor puede haber causado ambas. La ola de calor es un ejemplo de variable no tenida en cuenta en este planteamiento, es decir, debido a esta variable la relación entre helados y “sofocamiento” es una relación espuria. (Fuente: Wikipedia)

13

ESQUEMA BIVARIABLE y MULTIVARIABLE

(Nominal/Ordinal)*

(Nominal/Ordinal)

(Nominal/Ordinal)*

Numérica o Sólo numérica

Numérica/s*

Numérica/s

Chi-Cuadrado Contraste de Medias y

Anova

Correlación (También

categórica) y Técnicas Multivariables

Elaboración: S. Christian Orgaz Alonso, 2009

Tema IV Tema V Tema VI-VII-VIII

14

CRITERIO DE ORDENACIÓN DE LAS PRUEBAS ESTADÍSTICAS

RELACIONES entre Variables

Tabla Contingencia (Categórica * Categórica)

Correlaciones (Numérica * Numérica/Categórica)

Regresión Lineal (Numerica Numérica [y Dummy])

COMPARAR GRUPOS o Variables

Elaboración: S. Christian Orgaz Alonso, 2009

Medias (Numérica [en realidad no es una prueba estadística, sólo es descriptivo])

Medias independientes (Numérica * Categórica)

Medias relacionadas (Numérica * Numérica)

Anova de un factor (Numérica * Categórica [> o = a 3 categorías])

15

De preguntas a variables:Del cuestionario a la matriz de datos

16

Identifica para cada pregunta el número de variables que resultan al codificarla, así como el número de categorías de cada variable.

17

DE PREGUNTAS A VARIABLES

¿Cuántas variables, de qué tipo, cuántas categorías?

Material docente de Carlos De la Puente Viedmahttp://www.ucm.es/info/socivmyt/paginas/profesorado/perfiles2.htm#puente

18

¿Cuántas variables, de qué tipo, cuántas categorías?

DE PREGUNTAS A VARIABLES

Material docente de Carlos De la Puente Viedmahttp://www.ucm.es/info/socivmyt/paginas/profesorado/perfiles2.htm#puente

19

¿Cuántas variables, de qué tipo, cuántas categorías?

DE PREGUNTAS A VARIABLES

Material docente de Carlos De la Puente Viedmahttp://www.ucm.es/info/socivmyt/paginas/profesorado/perfiles2.htm#puente

20

¿Cuántas variables, de qué tipo, cuántas categorías?

DE PREGUNTAS A VARIABLES

Material docente de Carlos De la Puente Viedmahttp://www.ucm.es/info/socivmyt/paginas/profesorado/perfiles2.htm#puente

21

¿Cuántas variables, de qué tipo, cuántas categorías?

DE PREGUNTAS A VARIABLES

Material docente de Carlos De la Puente Viedmahttp://www.ucm.es/info/socivmyt/paginas/profesorado/perfiles2.htm#puente

22

Creación de una matriz de datos a partir de los distintos modelos de preguntas presentados anteriormente.

Nombre Archivo “01_Ejercicio de Codificación”

23

Creación de una matriz de datos:

Pasos:1º) Definición y creación de las variables

(“Vista de Variables”(SPSS)), en función del libro de códigos)

2º) Introducción de datos (“vista de datos”(SPSS))

Elaboración: S. Christian Orgaz Alonso, 2009

24

ID:01Sexo: HombreEdad:23Estudios: MediosValoración: 7Ocio: TV

ID:02Sexo: MujerEdad:22Estudios: AltosValoración: 8 Ocio: Videojuegos

ID:03Sexo: MujerEdad:25Estudios: NCValoración: 4 Ocio: Lectura

ID:04Sexo: HombreEdad:24Estudios: AltosValoración: 8Ocio: Beber Cerveza

ID:05Sexo: “12” “ “Edad:24Estudios: BajosValoración: 3Ocio:

ID:06Sexo: MujerEdad:Estudios: MediosValoración: 5Ocio: TV

DE PREGUNTAS A VARIABLES Ejercicio de codificación en SPSS

V1: Nombre Id V2: Sexo

Categorías:Hombre = 1Mujer = 2

V3: Edad (en años)

V4: Estudios:Categorías:

Bajos = 1 Medios = 2Altos = 3Ns/Nc = 9

V5: Valoración del Interés:De 0 (mínimo) a 10 (máximo)

V6: Ocio: (Variable abierta/cadena)Ponemos el texto “tal cual”.

CUESTIONARIOS A CODIFICARLIBRO DE CÓDIGOS

Nombre Archivo “01_Ejercicio de Codificación” Elaboración: S. Christian Orgaz Alonso, 2009

25

Análisis descriptivo (univariable) de los datos, medidas de tendencia central, dispersión y forma. Representaciones gráficas mediante SPSS (barras, histogramas).

UNIDAD 2ANALISIS UNIVERIABLE

26

CASOS PERDIDOS i

Tipos de casos perdidos:a) Por el Sistema.b) Por el Usuario.c) Errores y “”Casos Atípicos””.

Elaboración: S. Christian Orgaz Alonso, 2009

27

VALORES PERDÍDOS y CASOS ATÍPICOS

Por Sistema

Elaboración: S. Christian Orgaz Alonso, 2009

28

VALORES PERDÍDOS y CASOS ATÍPICOS

Por Usuario

Elaboración: S. Christian Orgaz Alonso, 2009

29

VALORES PERDÍDOS y CASOS ATÍPICOS

Casos atípicos o erróneos (localización)

1) Mediante tabla de Frecuencias.a) Información de las Variablesb) “Buscar”c) “Recodificar”.

2) Mediante comandos Datos/Identificar casos atípicos

oAnalizar/Descriptivos/Explorar

(Análisis Exploratorio)

Elaboración: S. Christian Orgaz Alonso, 2009

30

Localización y tratamiento:1) Cómo es la variable, forma (utilidades) y contenido (tabla de

frecuencias)2) Localizar casos no validos (utilidades o recode)3) Tratamiento: Eliminar, imputar…

CASOS PERDIDOS

31

Localizar y tratar los valores perdidos.

Archivo: “03_ENI…”

32

Tipos de Estadísticos:a) Tendencia Central.b) Dispersión.c) Frecuencias

ESTADÍSTICOS Y RELACIÓN CON LAS VARIABLES

33

Elaboración: Asier A

mezaga Etxebarría y

S. Christian O

rgaz Alonso, 2009

Nominal Ordinal Intervalo/Razón

Tendencia CentralModa X X X

Mediana X XMedia X

DispersiónDesviación Típica X

Varianza XCV X

Decil, Cuartil, Percentil XForma

Asimetría XKurtosis X

Tabla de Frecuencia X X XGrafico Barras y sectores X X XHistograma XDiagrama Caja X

34

DIFERENCIA ENTRE GRÁFICO DE BARRAS E HISTOGRAMA

No hay distancia = Nominal/Ordinal HAY distancia = Numéricas Sexo Edad

DIAGRAMA DE BARRAS HISTOGRAMA

Elaboración: S. Christian Orgaz Alonso, 2009

35

Aplicación de estadísticos y gráficos en función del tipo de variable y lectura, para el archivo creado anteriormente.

36

UNIDAD 3TRAMIENTO DE LOS DATOS

Codificación y Recodificación de variables. Comandos de transformación/creación de variables -Compute, If y Recode-. Creación de índices y escalas. Filtros y selección de casos. Ponderación. Lectura de ficheros de datos: Importar, Exportar, Fundir archivos y Microdatos. Depuración de la matriz de datos. Tratamiento de la no respuesta y de la múltiple respuesta. Protocolo de explotación e interpretación de datos con estadísticos descriptivos.

Elaboración: S. Christian Orgaz Alonso, 2009

37

Tipos de Tablas de Frecuencias:Tipo I: Un caso = Un valor.Tipo II: Un valor = varios casos.Tipo III: Un intervalo de valores = varios casos.

TIPOS DE TABLAS DE FRECUENCIA

Elaboración: S. Christian Orgaz Alonso, 2009

38

TIPOS DE TABLAS DE FRECUENCIAS

T.1. Matriz de Datos: Un Caso = Caso

Elaboración: S. Christian Orgaz Alonso, 2009

39

TIPOS DE TABLAS DE FRECUENCIAS

T.2. Matriz Agrupada por Frecuencias: Un Valor = Varios Casos

Edad

1 14,3 14,3 14,32 28,6 28,6 42,92 28,6 28,6 71,41 14,3 14,3 85,71 14,3 14,3 100,07 100,0 100,0

2122232426Total

ValidFrequency Percent Valid Percent

CumulativePercent

Sexo

2 33,3 40,0 40,03 50,0 60,0 100,05 83,3 100,01 16,76 100,0

HombreMujerTotal

Valid

SystemMissingTotal

Frequency Percent Valid PercentCumulative

Percent

Elaboración: S. Christian Orgaz Alonso, 2009

40

TIPOS DE TABLAS DE FRECUENCIAS

T.3. Matriz Agrupada por Intervalos: Un Intervalo de Valores = Varios Casos

Edad codificada en grupos

2 33,3 40,0 40,03 50,0 60,0 100,05 83,3 100,01 16,76 100,0

De 22 a 23 añosDe 24 a 25 añosTotal

Valid

SystemMissingTotal

Frequency Percent Valid PercentCumulative

Percent

CÓMO SE HACE EN SPSS???? = Transformar / …

Elaboración: S. Christian Orgaz Alonso, 2009

41

RECODIFICACIÓN DE VARIABLES (C): Recodificación Automática (Cerrando variables abiertas)

Ejercicio:Asigna a la variable “Ocio” un valor para cada categoría.

42

Tipos :a) En la misma variable.b) En distintas variables.c) Automática

RECODIFICACIÓN DE VARIABLES(Recode)

Elaboración: S. Christian Orgaz Alonso, 2009

43

OPERADORES SPSS

Elaboración: S. Christian Orgaz Alonso, 2009

44

RECODIFICACIÓN DE VARIABLES (A):

Transforma la variable edad en una variable categórica con dos categorías, de forma que la primera categoría agrupe los valores de edad 22 y 23 años y la segunda categoría agrupe los valores 24 y 25 años)

Edad codificada en grupos

2 33,3 40,0 40,03 50,0 60,0 100,05 83,3 100,01 16,76 100,0

De 22 a 23 añosDe 24 a 25 añosTotal

Valid

SystemMissingTotal

Frequency Percent Valid PercentCumulative

Percent

45

Tipos :a) RECODE (Analizar/Trasformar)b) COMPUTE (Analizar/Calcular)c) IF (Analizar/Calcular-Si…)

RECODIFICACIÓN DE VARIABLESY OPERACIONALIZACIÓN

Elaboración: S. Christian Orgaz Alonso, 2009

46

Creación y Recodificación de Variables: Ejercicio: (Archivo “04_Venta de casas por barrios”)

1º Recodificar los barrios en tres categorías. (RECODE)2º Añadir al precio de venta de cada casa 3000€ de gastos de notaría. (COMPUTE)3º Calcular el impuesto que graba cada uno de los tres barrios agrupando las casas en tres grupos en función del del impuesto. (IF)

Clase Alta = +9000 (Casa 1)Clase Media = +6000 (Casas 2,3,4)Clase Baja = - 2000 (Casas 5,6,7)

4º ¿Qué tipo de variable obtenemos y qué estadísticos podemos aplicar?

47

Creación y Recodificación de Variables:

Ejercicio: (Archivo “03_ENI_EDAD ”)

¿Cómo sustituir los valores erróneos de la variable sexo?

48

Tipos :a) Selección mediante condición b) Mediante variable filtrod) Selección aleatoriac) Rango de tiempo o casos

SELECCIÓN DE CASOSDatos/Selección de Casos

Elaboración: S. Christian Orgaz Alonso, 2009

49

Selección de CasosEjercicio: (04_Cires 96…”)1) Crear una muestra de la matriz del 85% de los casos2) Pedir los estadísticos que correspondan para la variable “edad” y “sexo”3) Agrupar la edad en tres categorías 0 a 24/ 25 a 54/ 55 y más4) Asignar a las anteriores categorías los siguientes ingresos semanales medios. 1) 200€ 2) 400€ 3)300€ 5) Calcular a continuación una nueva variable con los ingresos mensuales de cada grupo. 6) ´¿Qué tipo de variable obtenemos y qué estadísticos podemos aplicar?

50

1) Con variable de ponderación previa. Datos/Ponderar Casos/ Variable de Ponderación2) Creación de una variable de ponderación (ver ejercicio).

PONDERACION

Elaboración: S. Christian Orgaz Alonso, 2009

51

Ponderación: Crear una tabla en SPSS a partir de datos agregados

En el periódico hemos encontrado la siguiente tabla ¿Cómo la pasamos a SPSS utilizando la ponderación?

A B CAsignamos a cada intersección, Creamos tres variables Creamos la Matriz

Un número (celda, paso C) en SPSS Celda V1 V2 V3

1.1. (200) 1.2 (30) V1 Salario (1,2,3) 1.1 1 1 200

2.1 (120) 2.2 (80) V2 Sexo (1,2) 1.2 1 2 30

3.1 (60) 3.2 (100) V3 Valores 1.3 2 1 …

DDatos/Ponderar Casos/Variable de Ponderación=V3

Ejercicio 4,3

Elaboración: S. Christian Orgaz Alonso, 2009

Ingresos Hombre (1)

Mujer (2)

Altos (1) 200 30

Medios (2) 120 80

Bajos (3) 60 100

52

Pasos :a) ¿Qué variables, cómo se distribuyen, qué nos interesa? (Exploratorio) b) Selección, recodificación y/o creación de nuevas variables (crear indicador) Analizar/Respuestas múltiples:

1) Definir conjunto y categorías2) Solicitar Frecuencias

FRECUENCIAS a partir de Múltiple Respuesta

Elaboración: S. Christian Orgaz Alonso, 2009

53

Creación de un Indicador (Múltiple respuesta):

A partir de la influencia de diversos medios de comunicación (TV pública, TV privada, online …) crear el indicador “influencia de los medios”:1º Definir qué categoría/s son las más relevantes.2º Crear una variable que agrupe las categorías más relevantes de las diversas variables.3º Creación de una tabla de continencia del indicador por la variable Sexo.

03_Archivo: Influencia de los medios

54

Fuentes : IMPORTACIÓN 1) Excel 2) MICRODATOS

a) ASCII (Archivo Texto) b) Sintaxis (Archivo de SPSS) [Dos formas] c) “otros programas”…

3) Fundir archivos.4) “¿¿¿Podemos cortar y pegar???”

Importar matrices de datosExiste un documento que desarrolla todo el apartado de

importación de datos, véase: “Apuntes para la

importación de datos en SPSS”

Elaboración: S. Christian Orgaz Alonso, 2009

55

1) Preparar los datos en formato de matriz2) Importar: Archivo/Abrir/*.xls3) Añadir etiquetas de variable y etiquetas de valores, casos

perdidos (si procede).

Importar matrices de datos (I)

EXCEL (.xls)

Elaboración: S. Christian Orgaz Alonso, 2009

56

Importar archivos Excel

Ejercicio 1: Descargar desde el INE una base de datos: Ine/Sociedad/Educación/Estadística de enseñanza universitaria

1) Antes de descargar asegurarse que tiene formato matriz (filas/casos y columnas/variables)

2) Desde excel modificar la matriz y dejarla limpia/neutra.3) Importar desde SPSS4) Introducir todos los datos que falten, etiquetas de valor si procede…

57

Importar archivos Excel

Ejercicio 2: “04_datos de asistentes”1) Limpieza de la matriz.2) Trasformaciones 3) Importar4) Etiquetas de variables, valores perdidos

58

1) Descargar los datos (*.txt) y Cuestionario/Libro de códigos2) ¿Cada caso cuántas filas?3) Leer datos/ ASCII/Procedemos dividir el ASCII en variables 4) Añadimos nombres de variables, etiquetas, valores …

Importar microdatos (II)

ASCII (*.txt) http://www.cis.es

Elaboración: S. Christian Orgaz Alonso, 2009

59

Microdatos desde ASCII

Ejercicio 3: “04_CIS_2008_codigo2781.pdf” y 04_CIS_2008_DA2781

1) Descargar los microdatos y Cuestionario/Libro de códigos2) ¿Cada caso cuántas filas?3) En SPSS: Archivo/Leer datos/ ASCII/Procedemos a dividir el

ASCII en variables 4) Añadimos nombres de variables, etiquetas, valores

60

1) Abrir el archivo que contiene los microdatos estructura ASCII2) Abrir la sintaxis que ejecuta la matriz. Empieza por

DATA LIST FILE= ‘Nombreficheroquecontienelosdatos'3) En la sintaxis “Ejecutar todo”

Importar microdatos (III)Sintaxis_A

“Automático” (CIS) “Data list file”

Elaboración: S. Christian Orgaz Alonso, 2009

61

Microdatos desde ASCII+Sintaxis

Ejercicio 4: 04_CIS_2008_DA2781 y 04_CIS_ES2781

1) Descargar los datos (*.txt) y Cuestionario/Libro de códigos2) ¿Cada caso cuántas filas?3) Leer datos/ ASCII/Procedemos a dividir el ASCII en variables 4) Añadimos nombres de variables, etiquetas, valores

62

1) Situar el archivo ASCII en una ruta accesible y copiamos la ruta (por ejemplo, GET DATA /TYPE = TXT

/FILE = 'C:\'datos_ENI07'2) Abrir la sintaxis y asegurarse que el tipo de archivo está bien y

pegar la ruta de acceso al archivo de microdatos. 3) En la sintaxis “Ejecutar todo”

Importar microdatos (III)Sintaxis_B

“Con ruta de acceso”: Get Data

Elaboración: S. Christian Orgaz Alonso, 2009

63

Microdatos desde ASCII+ Sintaxis

Ejercicio 5: 05_ENI_microdatos, 05_ENI Sintaxis y 05_Cuestionario

1) Descargar los datos (*.txt) y Cuestionario/Libro de códigos2) ¿Cada caso cuántas filas?3) Leer datos/ ASCII/Procedemos a dividir el ASCII en variables 4) Añadimos nombres de variables, etiquetas, valores

64

UNIDAD 4TABLAS DE CONTINGENCIA

Tablas de contingencia, porcentajes y lecturas. Creación de una tabla de contingencia a partir de valores absolutos dados. Pruebas de Chi2, fuerza y dirección . Interpretación de los resultados.

Elaboración: S. Christian Orgaz Alonso, 2009

65

1) Relación de las variables en la tabla2) Porcentajes y bases: TF/TC/TT. 3) Lecturas: Zeisel (% en sobre TC y lectura en el sentido de las

filas).4) Dependencia e independencia Estadística

TABLA DE CONTINGENCIA

Analizar/ Estadísticos Descriptivos/Tabla de Contingencia:

Elaboración: S. Christian Orgaz Alonso, 2009