22
BREVE MANUAL DE INDUCCION AL SAS USO DEL AMBIENTE INTERACTIVO El SAS (Statistical Analysis System) es un sistema de software integrado que proporciona un control total sobre acceso, manejo, análisis y presentación de bases de datos. La versión de SAS de la que nos ocuparemos es la 9.1, en español. Al ingresar al programa por medio de un ícono o a través de un ítem de programas aparece la siguiente ventana: y luego la ventana:

Induccion Al SAS

Embed Size (px)

Citation preview

Page 1: Induccion Al SAS

BREVE MANUAL DE INDUCCION AL SAS USO DEL AMBIENTE INTERACTIVO

El SAS (Statistical Analysis System) es un sistema de software integrado que proporciona un control total sobre acceso, manejo, análisis y presentación de bases de datos. La versión de SAS de la que nos ocuparemos es la 9.1, en español. Al ingresar al programa por medio de un ícono o a través de un ítem de programas aparece la siguiente ventana:

y luego la ventana:

Page 2: Induccion Al SAS

Como se puede observar, en la parte izquierda aparece una especie de explorador de SAS, donde se puede indagar acerca de librerías, conjuntos de datos previamente creados en SAS o recientemente creados por el usuario, resultados generados con algún procedimiento y mi PC. En la parte derecha aparecen dos ventanas claramente distinguibles con los nombres Editor y Log. En la parte inferior aparecen los nombres de dichas ventanas a las cuales se puede tener acceso (aparecen tres nombres: Output, Log y Editor) con solo hacer click en el respectivo nombre. Si es de su comodidad y quiere mayor espacio puede cerrar la ventana de explorador En la ventana del PROGRAM EDITOR se deben digitar todos los comandos correspondientes a un programa en SAS. Permite además la entrada de bases de datos (se recomienda que estas bases sean pequeñas; si son grandes es aconsejable introducirlas al sistema de otra forma). En la ventana del LOG aparece un reporte detallado de la ejecución del programa. Si se cometieron errores estos aparecen reportados en color rojo; además el programa indica el tipo de error que se cometió y la línea donde está.

Algunas veces puede aparecer un mensaje en color verde que dice WARNING; esto no debe ser motivo de alarma ya que no interrumpe la correcta ejecución del programa; no obstante, debe ser leído con detenimiento. Se recomienda revisar siempre esta ventana después de ejecutar el programa. En la ventana del OUTPUT aparecen todos los resultados solicitados en el programa. Si se solicitan gráficos, el sistema genera automáticamente una ventana con el nombre Graph1. En la parte superior aparece un menú de opciones, entre las cuales figuran: File, Edit, View, Tools, Run, Solutions, Windows y Help.

Debajo una barra de herramientas. Dicha barra de herramientas permite, entre otras cosas, abrir nuevo documento, guardar, imprimir, abrir archivos, impresión previa de alguna ventana, herramientas de copiar, pegar, cortar, deshacer, crear nueva librería, abrir ventana explorer en SAS, , ejecutar comandos SAS, borrar todo el contenido de una ventana, pausa y ayuda. Para saber que hace cada botón basta situar el mouse en dicho ícono y aparece su respectiva descripción.

Page 3: Induccion Al SAS

Por ejemplo:

El primer botón también sirve para borrar las ventanas LOG y Output. Un programa típico en SAS consta básicamente de dos pasos que son: El paso DATA y el paso PROC. El paso DATA se relaciona con aspectos tales como lectura de datos, creación de nuevas variables, operaciones lógicas y aritméticas y ejecución de ciclos. El paso PROC se relaciona con la ejecución de los distintos procedimientos de análisis los cuales están incorporados dentro de cada producto del SAS; por ejemplo, el SAS/GRAPH. Estos procedimientos se invocan al sistema con sus respectivos nombres y cada uno de ellos posee una amplia gama de opciones. NOTAS IMPORTANTES En la elaboración de un programa en SAS se debe ser muy cuidadoso con la sintaxis y se debe guardar periódicamente usando la siguiente convención: Si se quiere guardar el contenido del PROGRAM EDITOR se debe usar la extensión .sas; por ejemplo miprimer.sas. Si se quiere guardar el contenido del OUTPUT, basta seleccionarlo y pegarlo en un editor de su preferencia (Word, block de notas, etc.) Toda línea de comandos se debe finalizar con punto y coma. La omisión de esta importante regla de sintaxis genera errores muy difíciles de detectar y es uno de los errores más comunes. Los nombres asignados a las variables no deben exceder ocho caracteres. Se recomienda que tales nombres den idea de la variable; por ejemplo, PRESANG puede representar una variable llamada presión sanguínea. Para invocar los distintos procedimientos se pueden usar letras mayúsculas, minúsculas o la combinación de ambas; por ejemplo PROC MEANS=proc means=Proc Means. Se recomienda documentar todos los programas. Esto permite identificar cada programa y da una idea de lo que cada uno de ellos hace. Los comentarios en SAS tienen la siguiente sintaxis /* COMENTARIO */; por ejemplo, Ejemplo de un programa en SAS entrando los datos directamente al PROGRAM EDITOR. Suponga que se recopiló información a un grupo de personas. Específicamente se les registró el sexo, la edad, la estatura y el peso. Se quiere obtener un resumen detallado por medio de tablas de este grupo de personas. Este programa se debe digitar en la ventana del PROGRAM EDITOR. Un programa en SAS típico puede ser:

Page 4: Induccion Al SAS

/************************************************** **************************/ /* Este programa permite obtener tablas de resúmen es estadísticos básicos */ /* */ /* Proc’s Usados : FREQ, MEANS y UNIVARIATE */ /* */ /************************************************** **************************/ DATA uno; /* CREACION DATA */ INPUT sexo $ edad estatura peso; /* NOMBRAMIENTO V ARIABLES */ CARDS; H 25 1.72 70 M 20 1.64 54 M 19 1.65 52 M 27 1.63 50 M 22 1.65 47 H 16 1.65 62 H 25 1.69 64 H 26 1.73 72 M 25 1.72 71 H 23 1.80 74 H 22 1.70 69 H 25 1.72 71 ; RUN; PROC MEANS DATA=uno; / *ESTADISTICAS BASICAS */ Var estatura peso; Run; PROC FREQ DATA=uno; /* TABLA DE FRECUENCIAS */ TABLES sexo; Run; PROC UNIVARIATE DATA=uno; /* MAS ESTADISTICOS BAS ICOS */ Var edad; Run;

El signo $ es empleado para indicar una variable alfa-numérica. Para ejecutar el programa anterior basta hacer click en el ícono con forma de muñeco caminando. Los resultados de los procedimientos empleados aparecerán en la pantalla OUTPUT y los tiempos empleados y errores en la pantalla LOG.

Page 5: Induccion Al SAS

The MEANS Procedure | The FREQ Procedure

|

Variable N Mean Std Dev Minimum Maximum | Cumulative Cumulative

ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ | sexo Frequency Percent Frequency Percent

estatura 12 1.6916667 0.0498786 1.6300000 1.8000000 | ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ

peso 12 63.0000000 9.7421297 47.0000000 74.0000000 | H 7 58.33 7 58.33

ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ | M 5 41.67 12 100.00

The UNIVARIATE Procedure | Basic Statistical Measures

Variable: edad |

| Location Variability

Moments |

| Mean 22.91667 Std Deviation 3.26018

N 12 Sum Weights 12 | Median 24.00000 Variance 10.62879

Mean 22.9166667 Sum Observations 275 | Mode 25.00000 Range 11.00000

Std Deviation 3.26018218 Variance 10.6287879 | Interquartile Range 4.00000

Skewness -0.8933468 Kurtosis 0.2091041

Uncorrected SS 6419 Corrected SS 116.916667

Coeff Variation 14.2262495 Std Error Mean 0.94113353

Tests for Location: Mu0=0 | Quantiles (Definition 5) | The UNIVARIATE Procedure

| | Variable: edad

Test -Statistic- -----p Value------ | Quantile Estimate |

| | Extreme Observations

Student's t t 24.35007 Pr > |t| <.0001 | 100% Max 27 |

Sign M 6 Pr >= |M| 0.0005 | 99% 27 | ----Lowest---- ----Highest---

Signed Rank S 39 Pr >= |S| 0.0005 | 95% 27 |

| 90% 26 | Value Obs Value Obs

| 75% Q3 25 |

| 50% Median 24 | 16 6 25 7

| 25% Q1 21 | 19 3 25 9

| 10% 19 | 20 2 25 12

| 5% 16 | 22 11 26 8

| 1% 16 | 22 5 27 4

| 0% Min 16 |

Page 6: Induccion Al SAS

Lectura de Datos desde un archivo externo 1. Usando la opción INFILE.

Suponga que la información anterior fue previamente guardada en un archivo de texto, digamos una archivo de nombre datos.txt guardado en un disquete. Al abrir el archivo se observa lo siguiente: Aunque este es un archivo pequeño, la herramienta de lectura de datos desde archivos externos se hace útil cuando se tienen grandes base de datos. Para leer los datos desde SAS se usa el siguiente programa:

/************************************************** **************************/ /* Este programa permite leer datos de un archivo externo en formato ASCII */ /* separado por espacios. */ /* */ /* Proc’s Usados : DATA, */ /* */ /************************************************** **************************/ DATA ojo; /* CREACION DATA */ INFILE "D:\rana\ESTADISTICA I\Sem 01_2010\prueba.txt" ; /* LECTURA DE DATOS XTERNOS */ INPUT Estrato Horas Edad Traba$ Prom; /* NOMBRAMIENTO VARIABLES */ RUN;

Al correr el programa se obtiene:

La información del archivo prueba.txt, ha quedado guardada en la librería WORK, dentro de la carpeta ojo. El procedimiento PRINT permite imprimir el contenido de cualquier DATA creado previamente en SAS.

Page 7: Induccion Al SAS

2. Usando la opción Archivo – Importar datos

Retomemos de nuevo la información contenida en el archivo prueba.txt. Del menú principal, seleccionamos Archivo–Importar datos, y aparece la siguiente ventana:

Por defecto aparecen algunas fuentes de datos estándar, como Excel, Access, dBASE, delimitado por tabuladores, delimitado, entre otros. Como nuestro archivo es formato texto y separado por espacios, seleccionamos la opción Fichero delimitado (*,*), y

luego Siguiente, Aparece una ventana donde se pregunta por la localización del archivo. En la opción Browse se escoge el archivo y se selecciona Options, para mirar las propiedades del archivo. Después de elegir las correctas, le damos Aceptar y luego Siguiente.

La siguiente ventana da la opción de guardar los datos en una librería previamente creada o existente en SAS. Por defecto aparece seleccionada WORK, asignamos un nombre al archivo y luego Finalizar.

Después de este proceso, aparece un mensaje en la ventana del Log donde se indica si la operación realizada no tuvo complicaciones. Se ilustran los anteriores pasos:

Page 8: Induccion Al SAS

Suponga ahora que los datos antes leídos están disponibles en formato Excel, en el archivo prueba.xls. Nuevamente Archivo – Importar datos, se selecciona la opción Libro Microsoft Excel 97, 2000 o 2002, luego Siguiente. Se

pide luego la ubicación del archivo y en las opciones, seleccionamos Use data in the first row as SAS variable names y luego OK. Las opciones siguientes son iguales al caso anterior. Se ilustra los pasos antes descritos. El archivo se guardó en la librería WORK con el nombre OTRO.

Creación de Librerías en SAS Una herramienta muy útil cuando se manejan muchos conjuntos de datos es tener a disposición todos los conjuntos de datos y no tener que de nuevo escribir un programa para leerlos o inclusive volver a digitarlos en la ventana del PROGRAM EDITOR. Una manera de resolver este problema es usando el concepto de Librería. Una librería se asemeja a un archivador el cual contiene en su interior información sobre diferentes conjuntos de datos.

Page 9: Induccion Al SAS

En SAS el manejo de las librerías es muy similar a los archivadores que se manejan en algunas empresas (por ejemplo, un archivador donde las carpetas son información de diferentes clientes, o sobre proveedores de productos o información sobre estudiantes, etc). En SAS se tienen dos tipos de librerías: Temporales y Permanentes. Librerías Temporales. En las librerías temporales los conjuntos de datos allí guardados solo están activos mientras no se termine la sesión de SAS, es decir al salir de SAS los conjuntos de datos desaparecen; son como conjuntos de datos temporales. En SAS, la librería que guarda los conjuntos de datos temporales es la librería WORK. En cualquier caso, sea que los datos se escriban directamente en el programa o se lean de un archivo externo, Al ejecutarse el programa los datos quedan guardados en la librería WORK y el nombre asignado es: WORK.nombre. Librerías Permanentes. Para crear una librería permanente que permanezca dentro de SAS aún después de terminar la sesión de SAS e iniciar de nuevo, se puede hacer de dos maneras: Con comandos en SAS o usando el {icono relacionado al principio de este documento. Usando Comandos en SAS. Para crear una librería con comandos usamos la instrucción LIBNAME (nombre) ‘ruta’. En nombre asignamos un nombre que no pase de 8 caracteres y el cual determinara la librería. Todos los archivos que se generen en adelante quedarán dentro de la librería previamente creada. Por ejemplo: Libname curso “D:\”; DATA curso.dos; INFILE " D:\rana\ESTADISTICA I\Sem 01_2010\prueba.txt ; INPUT Estrato Horas Edad Traba$ Prom; Run;

Page 10: Induccion Al SAS

Usando el menú de íconos. AL hacer click, aparece una ventana donde se puede asignar el nombre de la librería, el lugar físico donde quedará y si lo quiere, el tipo de

datos que allí se guardarán. Se recomienda no modificar esta opción. Después de llenar la información requerida le damos aceptar. Para ver el resultado de este procedimiento, hacemos click en el icono. Por ejemplo:

Este explorador permite copiar, eliminar, mover archivos de datos de una librería a otra

Ambiente Interactivo Para acceder a la parte interactiva del programa SAS, es necesario tener previamente creado en SAS uno o varios archivos de datos a ser utilizados. En SAS tenemos dos modos interactivos de análisis básicos: Análisis interactivo de Datos (Interactive Data Análisis) y Análisis (Analyst). El resto de este documento se dedicará a mostrar algunas de las opciones del Análisis. Este módulo interactivo tiene la particularidad de trabajar en forma de proyectos: cada procedimiento realizado, cada gráfica, cada resultado y el código utilizado aparecen registrados y en cualquier momento están disponibles. Permite guardar más ágilmente gráficos y otros resultados. Para ingresar al modote Análisis, se usa el menú Soluciones (Solutions):

Después de hacer esto aparece la siguiente ventana:

Page 11: Induccion Al SAS

Algunas opciones del menú superior son:

Un menú inferior también contiene algunos procesos resumidos de gráficos, tablas, resúmenes estadísticos, etc.

Page 12: Induccion Al SAS

Para empezar a trabajar este modo interactivo, es necesario cargar una base de datos que previamente fue guardada en formato SAS. Esto se logra seleccionando la opción File – Open By SAS. Aparece una ventana de exploración, donde se selecciona la librería y el archivo de datos requerido. En nuestro caso la librería Curso y el archivo de datos Dos. Luego Aceptar. Después de este proceso aparece la ventana del Anali

MENÚ Graphs Al seleccionar la opción Graphs aparece el siguiente submenú:

Page 13: Induccion Al SAS

Exploremos brevemente cada una de estas opciones sin entrar en mucho detalle. Esta exploración adicional se deja para el usuario. Usaremos los datos correspondientes a una muestra de estudiantes de la Universidad Nacional Medellín. Por medio de una encuesta de cada estudiante se recopiló información acerca de: Estrato, Horas dedicadas a estudiar semanalmente, Edad, Si Trabaja o No y Promedio en el semestre anterior. Todos los gráficos que aparecen en este entorno pueden ser copiados en otro entorno (algún editor particular) de interés o guardados en alguna carpeta 1. Gráficos de Barras (Bar Chart) En el menú seleccionamos Bar Chart y luego barras horizontales o verticales. Si seleccionamos Horizontal, aparece una ventana donde las variables están al lado izquierdo. Se selecciona la o las variables que desee haciendo clic sobre el nombre y haciendo click en Chart. En Options, se selecciona la opción y Luego OK.

En la ventana del Análisis, aparece al lado izquierdo el nombre del procedimiento usado, el nombre del gráfico y el código en SAS usado por el programa. El gráfico resultante aparece en una ventana aparte. Este gráfico puede ser manipulado como cualquier objeto de Windows.

Page 14: Induccion Al SAS

Otras opciones adicionales que se pueden explorar son las siguientes:

Las mismas opciones se encuentran al seleccionar la opción de Vertical. Puede graficar barras para una variable discriminada por otra. Por ejemplo. La distribución de estratos para los que trabajan y los que no trabajan.

2. Diagramas de Pastel (Pie Chart).

Las opciones son similares a Bar Chart

3. Histogramas (Histogram) Los histogramas son elaborados para variables continuas o variables discretas con muchos valores. Al seleccionar esta opción aparece una ventana similar a las otras consideradas.

Page 15: Induccion Al SAS

Si se desea este histograma discriminado por si Trabaja o No:

El SAS por defecto maneja ciertos colores y elabora el histograma de porcentajes. Usted puede cambiar estas opciones si así lo desea usando la opción Display. Siempre que se desee elaborar histogramas discriminados por alguna categoría particular, esta debe ser especificada en al casilla Class. 4. Diagrama de Cajas y Bigotes (Box Plot) Las opciones que aparecen al seleccionar esta opción son muy similares a las anteriores. En la opción Display puede controlar el color y los símbolos para datos atípicos. La estructura básica de dicho gráfico permite identificar algunas medidas descriptivas básicas, como se muestra a continuación.

Page 16: Induccion Al SAS

Por ejemplo para la variable promedio se obtiene lo siguiente Este tipo de gráficos es útil para identificar características propias de la distribución de los datos. Particularmente cuando se desea comparar una variable con respecto a una clasificación particular. Por ejemplo, queremos comparar la variable promedio, para cada estrato. En el menú anterior seleccionamos la variable promedio y en Class la variable estrato. Al comparar los Box-Plot para cada estrato es fácil identificar si hay diferencias en los promedios

obtenidos para cada estrato o donde hay similitudes.

El gráfico resultante es:

Page 17: Induccion Al SAS

5. Diagrama de Dispersión (Scater Plot) En esta opción hay dos posibilidades Bidimensional y Tridimensional. Explicamos el bidimensional. Al seleccionar la opción de interés se debe especificar la variable en el eje X y la Variable en el eje Y. Si lo desea, puede elaborar este gráfico discriminado por cualquier otra variable discreta o cualitativa. Por ejemplo, grafiquemos Horas contra Prom. Recuerde que el Display permite modificar colores y los símbolos usados para el gráfico. Veamos el gráfico respectivo:

El mismo gráfico pero discriminado por la variable Trabaja:

Para un gráfico de dispersión Tridimensional aparece un menú similar y se seleccionan las variables en el respectivo eje. (Por ejemplo la variable Prom en el eje Z, Edad en el eje X y Horas en el eje Y) Las líneas de referencia así como el símbolo utilizado en el gráfico son seleccionadas al hacer clic en la opción Display, al igual que el color de los puntos en el gráfico. Si se desea un gráfico similar pero discriminado por la variable Trabaja, basta seleccionar dicha variable en la opción Variables.

Page 18: Induccion Al SAS

6. Gráfico de Contornos (Contour Plot) Imagínese una montaña que es cortada en rodajas pero paralelas al piso de la montaña, o recorrer la montaña por caminos paralelos a la base de la montaña. Los recorridos o cortes son, en esencia, Contornos. Los contornos identifican observaciones tridimensionales a una misma altura. La estructura es muy similar al diagrama de dispersión tridimensional. Puede elegir el número de contornos, el tipo de representación, si los contornos tienen o no etiqueta, etc. Un ejemplo de un gráfico de Contorno con 7 niveles es:

7. Gráfico de Superficies (Surface Plot) La estructura es muy similar al Gráfico de contornos, se seleccionan las variables en los respectivos ejes y en la opción Display se puede escoger los colores de dicho gráfico (color encima y debajo), numero de divisiones a utilizar en los ejes X, Y y el eje Z, escoger líneas de referencia, ángulo de rotación del gráfico, etc. Para las mismas tres variables se tiene:

_______________________________________________________________________________________________ MENÚ Statistics. Al hacer click en el menú Statistics, aparece lo siguiente:

Page 19: Induccion Al SAS

Veamos el submenú Descriptive. 1. Estadísticas Básicas (Summary Statisitics) Este tipo de análisis tiene sentido para variables continuas, o discretas con muchos valores. Produce estadísticos básicos, Histogramas, cajas y bigotes, discriminados o no por otra variable. En los diferentes menús que aparecen usted puede seleccionar las medidas de su interés así como los gráficos. Los siguientes gráficos ilustran lo que s e quiere explicar. Por ejemplo para la variable EDAD, que es continua, se tiene:

La opción Plots, permite realizar Histogramas o gráficos de cajas y bigotes. Se deja para el lector su exploración. Los resultados obtenidos aparecen en el siguiente formato. La opción Class puede ser usada para obtener estadísticas descriptivas básicas de una variable, discriminada por otra de clasificación. Procedimiento MEANS

Analysis Variable : Edad

Desviación Error Número de

Media estándar estándar observaciones Mínimo Máximo Mediana

ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ

24.7028302 5.0346093 0.3457784 212 17.0000000 49.0000000 24.0000000

ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ En la opción Class puede especificar una variable discreta si desea análisis discriminados por otra variable. Los resultados obtenidos son:

Page 20: Induccion Al SAS

Procedimiento MEANS

Analysis Variable : Edad

Número de Desviación

Estrato observaciones Media estándar Mínimo Máximo Mediana

ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ

1 4 25.7500000 4.0311289 21.0000000 30.0000000 26.0000000

2 28 26.0714286 4.9435972 19.0000000 40.0000000 25.5000000

3 83 24.7951807 5.4117285 17.0000000 49.0000000 23.0000000

4 71 23.9718310 4.5133827 17.0000000 42.0000000 23.0000000

5 21 25.0000000 5.9329588 19.0000000 42.0000000 24.0000000

6 5 23.8000000 1.3038405 22.0000000 25.0000000 24.0000000

ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ Este tipo de tablas permiten hacer comparaciones previas de una variable, considerando subgrupos de información. Se debe tener especial cuidado en lo que se refiere a la comparación. Por ejemplo, a pesar de que la edad promedio en el estrato 2, sea mayor a la del estrato 4, estadísticamente esta diferencia no es apreciable, debido a las desviaciones estándar. Se explica esto en el siguiente gráfico.

Los paréntesis representan las desviaciones estándar para ambos grupos (una desviación estándar a izquierda y derecha de la media muestral). El traslape que se muestra en el gráfico, indica que no hay diferencias estadísticas en ambos promedios de edades para los grupos en cuestión. 2. Distribuciones (Distrtibutions). Este submenú permite obtener estadísticas de Variables de tipo continuo, pero calculando medidas descriptivas básicas (Momentos), medidas de variabilidad, percentiles, gráficos de Caja y Bigotes, Histogramas, Gráficos de Probabilidad normal y un gráfico Cuantil-Cuantil, además de ajustar curvas de algunas distribuciones al histograma. La opción Plots, permite generar los gráficos antes mencionados, la opción Fit, permite indicar el tipo de distribución que se quiere ajustar al histograma. En el recuadro con la opción Class, se puede especificar alguna variable discriminatoria para realizar análisis comparativos. Para la Variable edad se obtienen los siguientes resultados:

Page 21: Induccion Al SAS

Procedimiento UNIVARIATE Variable: Edad Momentos N 212 Pe sos de la suma 212 Media 24.7028302 Observaciones de la suma 5237 Desviación típica 5.03460927 Varianza 25.3472905 Asimetría 1.48784897 Ku rtosis 3.18538315 Suma de cuadrados no corregidos 134717 Su ma de cuadrados corregidos 5348.2783 Coeficiente de variación 20.3806982 Me dia de error estándar 0.34577838 Medidas estadísticas básicas | | Tests para posición: Mu0=0 Localización Variabilidad | | Test --Estadístico-- -----P-valor- --- Media 24.70283 Desviación típica 5.03461 | Mediana 24.00000 Varianza 25.34729 | T de Student t 71.44122 Pr > |t| <.0001 Moda 21.00000 Rango 32.00000 | Signo M 106 Pr >= |M| < .0001 Rango intercuantil 6.00000 | Puntuación S 11289 Pr >= |S| < .0001 | con signo Cuantiles (Definición 5) Procedimiento UNIVARIATE Variable: Edad (Edad) Cuantil Estimador Observaciones extremas 100% Máx 49 99% 42 ------Inferior----- ------Supe rior----- 95% 35 90% 31 Valor Observación Valor O bservación 75% Q3 27 50% Mediana 24 17 150 38 38 25% Q1 21 17 95 40 31 10% 20 18 149 42 156 5% 19 18 94 42 187 1% 18 19 198 49 97 0% Mín 17

La información más relevante, está registrada en las dos primeras tablas de resumen, y en la última, en particular las que aparecen en negrilla. AL explorar las opciones de este submenú, peden generarse gráficos adicionales a los histogramas y Cajas y bigotes y los cuales son usados como evidencia para otras pruebas más complejas (Pruebas de bondad de ajuste). Al igual que con el submenú Summary Statisitics, podemos obtener esta misma información, discriminando por otra variable. Se deja como ejercicio para el lector. 3. Conteos y Frecuencias (Frequency Counts) Esta opción permite obtener tablas de frecuencias para cada una de las variables cualitativas o discretas.

Page 22: Induccion Al SAS

Estrato Frecuencia Porcentaje Horas Frecuencia Porcentaje _____________________________________ ________________________________ 1 4 1.89 4 2 0.94 2 28 13.21 5 2 0.94 3 83 39.15 8 4 1.89 4 71 33.49 9 1 0.47 5 21 9.91 10 21 9.91 6 5 2.36 12 11 5.19 14 10 4.72 15 19 8.96 Traba Frecuencia Porcentaje 16 9 4.25 ___________________________________ 18 10 4.72 NO 138 65.09 20 36 16.98 SI 74 34.91 21 3 1.42 22 5 2.36 24 13 6.13 25 18 8.49 26 3 1.42 28 10 4.72 30 16 7.55 32 2 0.94 35 3 1.42 36 2 0.94 38 2 0.94 40 6 2.83 42 1 0.47 48 2 0.94 72 1 0.47

El usuario puede explorar sin problemas las opciones del submenú. La opción Variables permite obtener tablas discriminadas por otra variable cualitativa o discreta. Por ejemplo para la Variable estrato discriminado por la variable Traba:

---------------- Traba=NO --------------- - ------------- Traba=SI ---------------

Estrato Estrato

Estrato Frecuencia Porcentaje Estrato Frecuencia Porcentaje ______________________________________ ________ ________________________________ 1 2 1.45 1 2 2.70 2 17 12.32 2 11 14.86 3 64 46.38 3 19 25.68 4 40 28.99 4 31 41.89 5 12 8.70 5 9 12.16 6 3 2.17 6 2 2.70