7
Presentación de datos estadísticos PRESENTACIÓN DE DATOS Hay tres formas básicas para el resumen y presentación de información acerca de mediciones efectuadas sobre objetos, personas, períodos de tiempo, etc. Y aplicables tanto a datos continuos como a datos discretos: presentación de datos mediante texto, mediante tablas y mediante gráficos, que se combinan generalmente para lograr mayor claridad, transparencia e interpretabilidad de la información. PRESENTACIÓN DE DATOS MEDIANTE TEXTO Se hace una descripción narrativa de la información. Las dos formas más comunes de la presentación textual de la información comprenden a: Presentación de todos y cada uno de los datos obtenidos, Para lo cual se presenta un pequeño párrafo que explica el origen de los datos y a continuación la “nube de datos”. Presentación de datos en forma resumida mediante porcentajes o promedios. Es una forma adecuada de presentación cuando la cantidad de valores o porcentajes que se pretenden ilustrar corresponden a situaciones interesantes que se pueden mostrar con pocos datos. Los datos se presentan en tablas, graficas y medidas resumen. PRESENTACIÓN DE DATOS MEDIANTE TABLA Si el volumen de la información es grande y no parece conveniente una presentación textual, la mejor alternativa

Presentación de datos estadísticos

Embed Size (px)

DESCRIPTION

Presentacion Datos estadisticos, mediante textos, tablas y graficas, Barras simples, agrupadas, pictogramas, Histogramas, piramides, Graficos de linea de dispersion, Caja de Bigotes !

Citation preview

Page 1: Presentación de datos estadísticos

Presentación de datos estadísticos

PRESENTACIÓN DE DATOSHay tres formas básicas para el resumen y presentación de información acerca de

mediciones efectuadas sobre objetos, personas, períodos de tiempo, etc. Y aplicables tanto a datos continuos como a datos discretos: presentación de datos mediante texto, mediante tablas y mediante gráficos, que se combinan generalmente para lograr mayor claridad, transparencia e interpretabilidad de la información.

PRESENTACIÓN DE DATOS MEDIANTE TEXTOSe hace una descripción narrativa de la información. Las dos formas más comunes de la

presentación textual de la información comprenden a:

Presentación de todos y cada uno de los datos obtenidos,

Para lo cual se presenta un pequeño párrafo que explica el origen de los datos y a continuación la “nube de datos”.

Presentación de datos en forma resumida mediante porcentajes o promedios.

Es una forma adecuada de presentación cuando la cantidad de valores o porcentajes que se pretenden ilustrar corresponden a situaciones interesantes que se pueden mostrar con pocos datos.

Los datos se presentan en tablas, graficas y medidas resumen.

PRESENTACIÓN DE DATOS MEDIANTE TABLA

Si el volumen de la información es grande y no parece conveniente una presentación textual, la mejor alternativa consiste en la presentación de datos por medio de tablas. Una tabla se define como un arreglo ordenado de filas y columnas, clasificadas según el propósito y el tipo de datos que se presenten.

La tabla debe tener titulo e información clara y concisa.

Parte de una tabla

TítuloEl titulo debe ser breve pero completo, además de corresponder exactamente a lo que se

está presentando en la tabla.

Page 2: Presentación de datos estadísticos

Cuerpo de la tablaLo componen las diferentes filas y columnas con sus correspondientes encabezamientos.

Para tablas de más de una variable, además de presentar la información univariada, se presentan la distribución de frecuencias relativas por filas y columnas.

Distribución de frecuencias absolutas

Es una columna en la tabla que muestra el número de observaciones en categorías o clase de una variable.

Distribución de frecuencias relativas

La frecuencia relativa de una clase o categoría de una variable es el número de observaciones que caen dentro de ella, expresada como una porción del número total de datos. Esta frecuencia se expresa mediante porcentajes o proporciones.

Distribución de frecuencias absolutas y relativas acumuladas

Son columnas en la tabla que muestran la distribución de frecuencias absolutas y relativas acumuladas según el orden implícito de la variable. Las frecuencias se van acumulando, la última categoría tendrá por valor acumulado la totalidad de las observaciones en el caso de frecuencias absolutas y el valor 100% en el caso de frecuencias relativas.

Distribución de frecuencias absolutas y relativas acumuladas

Es una distribución de frecuencias relativas construida según el valor de la fila o columna respectiva.

Notas explicativasPueden ser de encabezamiento, subtítulos o de pie de tabla.

Presentación de datos cuantitativos mediante tablasCuando se pretende presentar los datos de una variable continua mediante una tabla, la

primera tarea consiste en determinar el criterio usado para construir las clases o categorías de la variable.

Sturges: Esta metodología consiste en la construcción de intervalos de igual amplitud, donde la amplitud de cada clase se calcula como (Max-Min)/k, siendo k el número de intervalos, que se calcula reemplazando el tamaño de la muestra n en la siguiente expresión:

K= 1+3.322 log10 (n)

Scott: En esta aproximación sugiere la construcción de intervalos de igual amplitud, donde la amplitud está dada por la siguiente expresión, siendo s la desviación estándar:

H= (3.5)s(n)-1/3

Page 3: Presentación de datos estadísticos

Diaconis: Este criterio es análogo al propuesto por Scott en 1979. La amplitud está dada por la siguiente expresión, siendo RI el rango intercuartílico.

H= 2(RI)(n)-1/3

Presentación de datos mediante tabla de dos dimensionesCon frecuencia en la presentación de tablas de dos dimensiones se tiene como objetivo

principal la evaluación de la asociación entre una variable independiente (factor de exposición) y una variable respuesta (desenlace). Por convención, se acostumbra ubicar la variable respuesta en las columnas y la variable independiente en las filas.

Más de dos variables en una tabla la hacen pesada y difícil.

Recomendaciones acerca del uso de tablasCuando se tiene sólo una variable o criterio de clasificación, se acostumbra ubicar las

clases o categorías de la variable en la primera columna.

Debe evitarse en lo posible tablas con más de dos variables.

PRESENTACIÓN DE DATOS MEDIANTE GRÁFICOSUn gráfico es un dibujo descriptivo que sirve para dar una idea visual y rápida del

comportamiento de un fenómeno o situación. Básicamente un gráfico es la representación de una tabla mediante diagramas y se constituye, de forma general, de las mismas partes, adaptadas para este tipo de presentación.

El comportamiento y la relación entre las variables se evalúan con gráficos.

Tipos de gráficos

Barras y pictogramaEs utilizado especialmente para representar variables cualitativas nominales y ordinales, y

cuantitativas discretas.

El gráfico de barras es popular por ser fácilmente comprensible.

Barras simples

En el eje horizontal del plano cartesiano se representan las modalidades o categorías que toma la variable mediante barras de igual base y en el eje vertical se presenta la frecuencia absoluta o la frecuencia relativa.

Barras agrupadas

Page 4: Presentación de datos estadísticos

El grafico de barras agrupadas se emplea para comparar varias poblaciones entre sí. Para cada categoría que toma la variable se elevan tantas barras como poblaciones haya, cada una con un color representativo.

Pictograma

Las frecuencias de las categorías de la variable se representan por dibujos alusivos al tema de estudio.

Diagrama de torta o pieEste gráfico se emplea para variables cualitativas nominales y ordinales. Para su

construcción se divide un círculo en tantas porciones como niveles tome la variable, de modo que a cada nivel de la variable de corresponde un arco de círculo proporcional a su frecuencia absoluta o relativa. Este tipo de gráfico se utiliza para destacar la importancia relativa de los niveles o categorías dentro de un total.

Los diagramas de torta (pie) inclinados son inapropiados.

La tridimensionalidad en los gráficos distorsiona los datos.

Histograma y polígono de frecuenciasHistograma de frecuencias

Es un grafico utilizado para representar distribuciones de frecuencia de variables cuantitativas continuas. Las barras deben ir siempre verticales pegadas una a otra. Sobre el eje horizontal se representa la frecuencia absoluta o relativa.

Las variables continuas se ven bien con histogramas.

Polígono de frecuencia

El polígono de frecuencias es semejante al histograma, pero se usa cuando se quiere comparar las distribuciones de una misma variable continua en dos o más poblaciones.

Diagrama de “Tallo y Hoja” (Stem and Leaf plots)Este es un método gráfico para representar la distribución de datos cuantitativos. Se trata

de un método rápido, sencillo y efectivo de mostrar la distribución de un conjunto de datos usando para su representación la información original.

El diagrama de tallo y hoja describe bien y en detalle.

Pirámides poblacionalesSon una forma especial de histograma en la que se representa simultáneamente la

distribución por edad y sexo de una población. Estos histogramas (en realidad son 2, uno para cada sexo) se dibujan verticalmente, las barras quedan horizontales pero antepuestas unas a otras.

Page 5: Presentación de datos estadísticos

La pirámide de edad por sexos es una excelente opción.

Gráfico de caja y bigote (Box plot)También conocido como box plot o diagrama de caja, es una representación gráfica de un

conjunto de datos o valores de una variable discreta o continua, para facilitar la percepción visual de su localización, dispersión y del grado y la dirección del sesgo. También permite identificar datos atípicos o extremos.

El gráfico de caja y bigote es muy completo y claro.

Algunos gráficos usados en métodos multivariadosEn esta sección se hace una descripción de algunas de las graficas que ofrecen una alternativa para el manejo de la presentación de dos o más variables simultáneamente.

Gráfico de dispersión

El gráfico de dispersión se emplea con variables de tipo cuantitativo. Este tipo de gráfica ofrece una forma útil de ilustrar la relación entre dos variables.

Gráfico de línea

En general se usa para representar series en el tiempo o series de datos de tipo cuantitativo.

La relación de dos variables se grafica con dispersión y líneas.

Caras de Chernoff

Estos gráficos se usan principalmente para caracterizar o perfilar un conjunto de individuos, elementos u objetos a través de varias variables.

Gráfico de estrella

Cada observación se representa por una estrella en la que cada una de sus puntas representa una variable. Para una observación específica, la punta se sitúa a una longitud del centro que sea proporcional al valor de la variable que se está representando.

Para graficar más de dos variables hay múltiples opciones.

Matriz de dispersión

Las respuestas pueden ser exploradas inicialmente mediante la utilización de varios gráficos de dispersión. Consiste en un arreglo de filas y columnas en cuya intersección se encuentra el gráfico de dispersión correspondiente a dos variables.

La matriz de dispersión es útil en graficar regresión lineal múltiple.

Page 6: Presentación de datos estadísticos

Recomendaciones para el uso de gráficosLos gráficos son la forma de presentación de datos más expresiva y tiene como objetivo

lograr comunicación rápida de situación, evolución o tendencia, enfatizar ciertas relaciones o resaltar situaciones importantes, confusas o complejas.

La clasificación y nivel de medición determinan el gráfico.