17
Seminario VI: Variables, tablas de frecuencia y gráficas. CELIA GÁLVEZ LÓPEZ

Seminario vi

Embed Size (px)

Citation preview

Page 1: Seminario vi

Seminario VI: Variables, tablas de frecuencia y gráficas.CELIA GÁLVEZ LÓPEZ

Page 2: Seminario vi

Ejercicio 1:

Selecciona dos variables cualitativas-factor del fichero “activossalud.RData”, descríbelas en tablas de frecuencias e interpreta al menos 3 aspectos en relación a la distribución de las mismas.

Page 3: Seminario vi

En primer lugar carguemos los datos a R, en este caso están en formato R y por tanto le daremos a “Datos”, “Cargar conjunto de datos” y seleccionamos “activossalud2”.

Page 4: Seminario vi

Para buscar las distribuciones de varias frecuencias de los datos cualitativos nos dirigimos a “Estadísticas”, “Resúmenes” y “Distribución de frecuencias”. En nuestro caso vamos a elegir la variable “botellón” y “cerveza”.

Page 5: Seminario vi

Botellón.• Podemos observar como un 82,1% (234

individuos) han realizado botellón alguna vez en su vida, frente a un 17,9% (51 individuos) que no lo han hecho nunca.

• Lo más frecuente (moda) sería hacerlo durante los fines de semana con un 31,58% de los individuos.

Cerveza.• En este caso el porcentaje disminuye y es un

62,98$ (182 individuos) han bebido cerveza alguna vez, frente a un 37,02% (107 individuos) que no lo han hecho nunca.

• También en este caso lo más frecuente (moda) cambia y esel porcentaje de individuos que no ha bebido cerveza nunca lo que predomina 37,02%.

Page 6: Seminario vi

Ejercicio 2

Selecciona dos variables numéricas del fichero “activossalud.RData”, y mediante resúmenes numéricos describe e interpreta la distribución de las mismas.

Page 7: Seminario vi

Para este ejercicio nos dirigimos a “Estadísticos”, “Resúmenes”, “Resúmenes numéricos” y ahí elegimos las variables que deseemos, en nuestro caso “altura” y “horapracticadeportiva”

Page 8: Seminario vi

Altura• La media es 1.667 y la desviación típica es de

0.08. Esto quiere decir que los valores de altura están entre 1.58 y 1.75.

• La mediana coincide con el segundo cuartil que en este caso sería 1.665.

• Esta variable es simétrica puesto que la media y la mediana tiene valores semejantes.

Hora practica deportiva• Tiene una media de 2.482759 cuya desviación

típica es de  3.138616.• La mediana coincide con el segundo cuartil, en

este caso la mediana sería 2.• Esta variable es simétrica puesto que la media y

la mediana tienen valores semejantes.

Page 9: Seminario vi

Ejercicio 3

Debes realizar al menos un gráfico de cada tipo con variables adecuadamente seleccionadas del fichero, describe e interpreta la distribución los mismos.

Page 10: Seminario vi

Para las variables cualitativas-factor tenemos el gráfico de barras y el gráfico de sectores. Vamos a realizar un gráfico de barras. Para ello vamos a “Gráficas”, “Gráfica de barras” y seleccionamos la variable que queremos, en nuestro caso “hachis”.

Page 11: Seminario vi

Podemos interpretar que la mayoría nunca ha fumado hachis y que el valor menos significativo lo hace los fines de semana.

Page 12: Seminario vi

En siguiente lugar vamos a realizar un gráfico de sectores, para ello le damos a “Gráficos”, ·”Gráficos de sectores” y en la ventana emergente podemos ponerle título al gráfico en nuestro caso

Page 13: Seminario vi

En esta gráfica predominan el consumir dulces 1 o 2 veces en semana y el consumirlos menos de una vez en semana. Frente al dato menos representado que sería el de consumir dulces todos los días

Page 14: Seminario vi

Para variables numéricas utilizamos el histograma y el diagrama de cajas. Comenzaremos con el histograma. Para ello le damos a “Gráficas” e “Histograma” y una vez ahí elegimos la variable que queramos, en mi caso “edad”.

Page 15: Seminario vi

Tiene una distribución asimétrica centrada a la izquierda. El porcentaje más elevado de individuos se encuentran con un peso entre

50-60kg Muy pocos individuos tienen menos de 40kg o superan los 100kg

Page 16: Seminario vi

Para el diagrama de cajas vamos a “Gráficos”, “Diagrama de cajas” y seleccionamos la variable deseada que será “medicalización”.

Page 17: Seminario vi

Podemos decir que esta variable es simétrica puesto que la media y la mediana coinciden y los datos se distribuyen de igual forma a ambos lados.