Upload
others
View
4
Download
0
Embed Size (px)
Citation preview
Asignatura: Electivo de Probabilidades Timbre Cursos: Tercero y Cuarto Medio UTP Docente: Monserrat Guerrero
Guía de contenido N° 1 “Conceptos básicos estadística”
Unidad 0: Tablas de Frecuencia y Gráficos
Objetivos Indicadores
OA O: Describen conceptos básicos asociados a la estadística, tales como: población, muestra, variables, tabla de frecuencia, diagramas y polígonos de frecuencia.
- Describen el proceso de la estadística. - Identifican y clasifican variables. - Construyen tablas de Frecuencia - Reconocen distintos gráficos.
Estadística: Ciencia encargada de recolectar, organizar, analizar e interpretar datos extraídos desde una muestra con el
fin de obtener conclusiones y tomar decisiones en la población.
La estadística es una ciencia utilizada con frecuencia a lo largo de la vida y se aplica en variadas situaciones, desde cosas
pequeñas como decidir que comestible comprar hasta cosas más complejas como en las elecciones parlamentarias para
decidir el candidato que será presidente.
Proceso de la Estadística:
1. Recolección de datos:
Para obtener datos en primera instancia es necesario saber qué es lo que se quiere investigar (variable), quienes son
los individuos o elementos involucrados (población) y finalmente seleccionar una parte de ese grupo para investigar
(muestra).
Por ejemplo, para poder conocer con qué frecuencia van las personas a Fantasilandia (variable), es necesario consultar
a todas las personas que han asistido a ese parque (población), sin embargo, es complicado encuestar a una cantidad
de personas tan grande, por lo que se seleccionará una pequeña parte que representará a toda la población (muestra).
Los datos se pueden recopilar mediante variadas acciones, por ejemplo realizar una entrevista individual o grupal,
aplicar un cuestionario o una encuesta, aplicar una prueba, observar o experimentar una determinada situación,
examinar registros o documentos relacionados con los individuos de estudio, por ejemplo reseñas, informes, actas de
asistencia, etc.
Conceptualización
Población: Conjuntos de elementos o individuos con características determinadas.
Por ejemplo: Estudiantes de un colegio, población chilena, liceos de Temuco, etc.
Muestra: Subconjuntos de elementos o individuos de la población con iguales características.
Esta debe ser representativa 1de la población y es seleccionada aleatoriamente.
Por ejemplo: Estudiantes de un curso, población de la IX región, liceos particulares
de Temuco, etc.
Variable: Característica que puede variar y tomar diferentes valores o categorías.
Por ejemplo: N° de mascotas, cantidad de tiempo en leer un texto, edad, asistencia,
nacionalidad, color de ojos, apellido, etc.
Las variables se clasifican según el tipo de respuesta considerada, por ejemplo, la variable N° de hermanos se expresa
numéricamente: 1, 2, 3, etc. En cambio, la variable estado civil se relaciona con atributos: casado, soltero, separado, etc.
Variable Cualitativa
Variables relacionadas con cualidades, atributos o características. Las variables cualitativas a su vez se subclasifican en
variables ordinales y variables nominales dependiendo si las categorías presentan o no un orden jerárquico.
Variable Cualitativa Ordinal:
Variables cuyas respuestas presentan un orden jerárquico.
Por ejemplo: Apellidos, nivel de escolaridad, grupo etario, etc.
Variable Cualitativa Nominal:
Variables cuyas respuestas no presentan un orden jerárquico.
Por ejemplo: Colores, géneros de música, nacionalidad, país, etc.
Variable Cuantitativa:
Variables relacionadas con cantidades. Los datos se expresan numéricamente. Las variables cuantitativas a su vez se
subclasifican en variables continuas y variables discretas dependiendo de los valores que comprenden
Variable Cuantitativa Continua:
Variable que tiene una unidad de medida y se puede medir con un instrumento de
medición. Puede tomar valores decimales y números negativos.
Por ejemplo: Distancias longitudinales, temperatura, edad, tiempo, etc.
1 Una muestra es representativa cuando reproduce en pequeña escala las características de la población.
Variable Cuantitativa Discreta:
Variable cuyos valores se obtienen por medio de un conteo, por lo tanto utiliza solo
valores naturales positivos. El 0 es absoluto.
Por ejemplo: N° de estudiantes, cantidad de mascotas, n° de computadores, etc.
2. Organización de los datos
Una vez obtenidos los datos, estos pueden organizarse por medio de tablas de frecuencia y gráficos. La organización
de los datos ayuda a visualizarlos de forma más clara y ordenada; y permite analizarlos de forma más cómoda.
Tablas de Frecuencias
La tabla de frecuencia organiza los datos considerando la cantidad de veces que cada dato se repite en la muestra.
Trabaja con 4 tipos de frecuencias distintas:
Frecuencia absoluta: ( 𝒇 ): Agrupa cada dato según la cantidad de veces que se repite en la muestra
Frecuencia absoluta acumulada ( 𝑭 ): Se obtiene sumando la frecuencia absoluta de cada dato con la frecuencia
absoluta acumulada del dato anterior.
Frecuencia relativa ( 𝒇 𝒓𝒆𝒍 ): Cociente entre la frecuencia absoluta de cada dato y el tamaño de la muestra. Se puede
presentar de 3 maneras: como decimal, fracción o porcentaje. Cuando se representa como porcentaje recibe el nombre
frecuencia relativa porcentual.
Frecuencia relativa porcentual ( 𝑭 𝒓𝒆𝒍 ): Se obtiene sumando la frecuencia relativa de cada dato con la frecuencia
relativa acumulada del dato anterior.
Existen 2 tipos de tablas de frecuencia que dependen del orden que presentan los datos:
1. Tabla de Frecuencias para datos no agrupados
Se le llaman datos no agrupados a aquellos que no presentan una organización previa. Esta tabla de frecuencia trabaja
con cualquier tipo de variable.
Ejemplo 1:
Se registró el tiempo en minutos que tardan 50 estudiantes de 7° básico en llegar a sus casas y se obtuvieron los
siguientes resultados:
4 6 8 10 8
12 8 4 14 10
6 12 14 6 4
10 6 14 12 8
12 14 8 16 10
6 12 12 8 6
14 8 12 8 10
14 16 6 10 8
16 8 10 4 6
10 6 6 8 12
Con los datos anteriores se elaboró la siguiente tabla de frecuencias:
Tiempo que tardan en regresar (minutos)
𝒇 𝑭 𝒇 𝒓𝒆𝒍 𝑭 𝒓𝒆𝒍
4 4 4 4
50 = 0,08 = 8% 8%
6 10 4 + 10 = 14 10
50= 0,20 = 20% 8% + 20% = 28%
8 11 14 + 11 = 25 11
50= 0,22 = 22% 28% + 22% = 50%
10 8 25 + 8 = 33 8
50= 0,16 = 16% 50% + 16% = 66%
12 8 33 + 8 = 41 8
50= 0,16 = 16% 66% + 16% = 82%
14 6 41 + 6 = 47 6
50= 0,12 = 12% 82% + 12% = 94%
16 3 47 + 3 = 50 3
50 = 0,06 = 6% 94% + 6% = 100%
𝐓𝐨𝐭𝐚𝒍 50 100%
2. Tablas de frecuencia para datos agrupados
Cuando la cantidad de datos es grande, se agrupan en intervalos para facilitar el análisis, por lo tanto trabaja solo
variables cuantitativas, sin embargo, la disposición de los corchetes es distinta dependiendo del tipo de variable.
Esta tabla de frecuencia presenta una nueva columna llamada “Marca de clase” que corresponde al punto medio
entre los valores extremos de cada intervalo y es representativo de cada uno. Se calcula promediando los extremos.
Ejemplo variables continuas:
Se registró la estatura de 70 estudiantes de la escuela San Francisco de Asís, obteniéndose los siguientes resultados:
𝑬𝒔𝒕𝒂𝒕𝒖𝒓𝒂 𝑴𝒂𝒓𝒄𝒂 𝒅𝒆
𝒄𝒍𝒂𝒔𝒆 𝒇 𝑭 𝒇 𝒓𝒆𝒍 𝑭 𝒓𝒆𝒍
[1,30 – 1,35) 1,30 + 1,35
2= 1,325 12 12
12
50= 0,24 = 24% 24%
[1,35 – 1,40) 1,34 + 1,40
2= 1,37 16 12 + 16 = 28
16
50= 0,32 = 32% 24% + 32% = 56%
[1,40 – 1,45) 1,40 + 1,45
2= 1,425 12 28 + 12 = 40
12
50= 0,24 = 24% 56% + 24% = 80%
[1,45 – 1,50) 1,45 + 1,50
2= 1,475 10 40 + 10 = 50
10
50= 0,20 = 20% 80% + 20% = 100%
𝑇𝑜𝑡𝑎𝑙 50 100%
Ejemplo variables discretas:
Se contabilizó la cantidad de libros de lectura que tienen 50 estudiantes de la escuela San Francisco de Asís,
obteniéndose los siguientes resultados:
𝑵° 𝒅𝒆 𝒍𝒊𝒃𝒓𝒐𝒔
𝑴𝒂𝒓𝒄𝒂 𝒅𝒆 𝒄𝒍𝒂𝒔𝒆
𝒇 𝑭 𝒇 𝒓𝒆𝒍 𝑭 𝒓𝒆𝒍
[ 1 − 4 ] 1 + 4
2= 2,5 8 8
8
60= 0,133 = 13,3% 13,3%
[ 5 − 8 ] 5 + 8
2= 6,5 4 8 + 4 = 12
4
60 = 0,067 = 6,7% 13,3% + 6.7% = 20%
[ 9 − 12] 9 + 12
2= 10,5 12 12 + 12 = 24
12
60 = 0,2 = 20% 20% + 20% = 40%
[13 − 16] 13 + 16
2= 14,5 16 24 + 16 = 40
16
60= 0,267 = 26,7% 40% + 26,7% = 66,7%
[17 − 20] 17 + 20
2= 13,5 20 40 + 20 = 60
20
60= 0,333 = 33,3% 66,7% + 33,3% = 100%
𝑇𝑜𝑡𝑎𝑙 60 100%
Gráficos:
Otra forma de representar los datos es a través de gráficos. Existen variados gráficos que se pueden utilizar
dependiendo de la naturaleza de los datos y la información que se quiere presentar.
1. Gráfico de Barras:
Son gráficos que utilizan barras para
representar la frecuencia absoluta ( 𝑓 ) de los
datos, es decir, la cantidad total de cada
categoría de la variable. Se utiliza con
variables cualitativas y variables discretas
cuantitativas. Permite comparar las
frecuencias absolutas de categorías distintas.
2. Gráfico de Líneas:
Al igual que los gráficos de barra, presentan la
frecuencia absoluta ( 𝑓 ) de los datos. Trabaja
con variables cuantitativas y variables cualitativas
ordinales. Permite visualizar el cambio o
tendencia entre las categorías de la variable.
Porcentaje de estudiantes en función del
tiempo que tardan en regresar
Porcentaje de estudiantes en función
de la cantidad de libros que poseen
3. Polígono de Frecuencia Acumulada:
Grafica las frecuencias acumuladas absolutas (𝐹) y
relativas (𝐹 𝑟𝑒𝑙) de una tabla de frecuencias.
Permite visualizar la frecuencia acumulada hasta un
dato determinado.
El siguiente polígono de frecuencias representa la
frecuencia relativa acumulada del ejemplo 1:
Tiempo que tardan los estudiantes en volver a sus
casas.
4. Gráfico de Pastel
Este gráfico presenta las frecuencias relativas (𝑓 𝑟𝑒𝑙) de las
categorías de una variable. Es útil cuando la cantidad de
categorías es pequeña. Trabaja con cualquier tipo de variable.
El siguiente gráfico de torta grafica los porcentajes de
estudiantes en función de la cantidad de libros que poseen.
Tiempo en minutos