27
ANÁLISIS EXPLORATORIO DE DATOS JESÚS SABORIDO RAMÍREZ Grupo 14 Virgen del Rocío Seminario 6

Actividad seminario 6

Embed Size (px)

Citation preview

ANÁLISIS EXPLORATORIO DE

DATOSJESÚS SABORIDO RAMÍREZGrupo 14 Virgen del Rocío

Seminario 6

Elegir dos variables cualitativas del fichero

activossalud.Rdata, describirlas en tabla de frecuencias y interpretar al menos 3 aspectos en relación a la distribución de la mismas.

Las dos variables elegidas son: botellón y cerveza

1ªactividad

a)botellón

El 83% (234 individuos) realizan botellón. 51 individuos (17%) no han realizado botellón

nunca. Sorprendente como existe dentro de los

encuestados 3 individuos que hacen botellón diariamente (el 1.05%).

La mayoría de los que hacen botellón, realizan esta actividad solo los fines de semana (31.58%).

Conclusiones (botellón):

b)cerveza

Esta vez el porcentaje de los consumidores de

cerveza con relación al botellón es menor: 63%

Por tanto, un 37% no bebe cerveza (107 individuos de los encuestados)

Como anteriormente, la frecuencia más alta dentro de los consumidores de cerveza se produce en los que solo beben los fines de semana, con un 20.76% (60 individuos de los encuestados).

Conclusiones(cerveza):

Elegir dos variables cuantitativas del fichero

activossalud y mediante resúmenes numéricos describir e interpretar la distribución de las mismas.

Las variables elegidas: altura y peso

2ªactividad

a)altura

Una media de 1.667 (metros) y con una

desviación típica de 0.08078101. Hay 1 caso no disponible por razones no

dadas. La mediana es 1.655 y se encuentra en el Q2

(50%) Mediana y media presentan valores parecidos

(distribución simétrica)

b)peso

La media es de 62.75571 (kg) y presenta una

desviación típica de 12.65981. 16 casos no disponibles por razones

desconocidas. La mediana se encuentra en el segundo cuartil

(50%). Mediana y media presentan valores parecidos

(distribución simétrica)

Realizar al menos un gráfico de cada tipo con

variables adecuadamente seleccionadas del fichero, describe e interpreta la distribución de los mismos.

Tipos de gráficos:- Gráfico de barras Gráfico de sectores Histogramas Diagrama de cajas

3ª actividad

Grafico de barras: variable tabaco

(cualitativa)

Esta grafica no

sigue un distribución normal. Como podemos apreciar, la mayoría no fuma tabaco o ha fumado solo alguna vez. Destacar la gran frecuencia que presenta la barra de «diario».

Gráfico de sectores: variable embutido

(cualitativa)

En el consumo de embutidos podemos comprobar como predomina el comer embutidos 1 o 2 veces la semana.

Son pocos los que comen a diario; sin embargo es preocupante el gran porcentaje de individuos que lo hace 3 o más veces a la semana.

Histograma: variable horadepracticadeportiva

(cuantitativa)

Sorprendente el alto nivel se sedentarismo (barra que presenta mayor frecuencia).

Pocos individuos dedican más de 10 horas a la práctica deportiva.

Diagrama de cajas: variable altura (cuantitativa)

El rango

intercuartílicos es gran, con la mediana justo en el centro; los extremos se dispersan bastante de los centrales.