3
PROPÓSITO Nº 24: NOCIONES DE ESTADÍSTICA CONCEPTOS FUNDAMENTALES Estadística: es la parte de las Matemáticas que se encarga del estudio de una determinada característica en una población, recogiendo los datos, organizándolos en tablas, representándolos gráficamente y analizándolos para sacar conclusiones de dicha población Estadística descriptiva: Realiza el estudio sobre la población completa, observando una característica de la misma y calculando unos parámetros que den información global de toda la población. Estadística inferencial: Realiza el estudio descriptivo sobre un subconjunto de la población llamado muestra y, posteriormente, extiende los resultados obtenidos a toda la población. Variable: Es una característica o propiedad que tiene un conjunto de individuos o una población. Tipos de variables: 1. Cuantitativas: son aquellas propiedades cuyos valores se expresan a través de números a. Continuas: si sus valores están dados mediante números reales o a través de intervalos de números reales. b. Discretas: cuando los valores sólo corresponden a números enteros. 2. Cualitativas: son las variables cuyos valores se representan con palabras. a. Nominales: son las características cuyos valores no admiten un criterio de orden. b. Ordinales: se refiere a los valores cualitativos que pueden ser ordenados según algún criterio. Población: es el conjunto de todos los elementos a los que se somete a un estudio estadístico. Muestra: es un conjunto representativo de la población de referencia. El número de individuos de una muestra es menor que el de la población. Muestreo: es la reunión de datos que se desea estudiar, obtenidos de una proporción reducida y representativa de la población. Técnicas de muestreo: son los mecanismos y procedimientos mediante los cuales se realiza el muestreo. Valor: es cada uno de los distintos resultados que se pueden obtener en un estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y sello. Dato: es cada uno de los valores que se ha obtenido al realizar un estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, sello, cara, sello. ESTUDIO ESTADÍSTICO 1. Recogida de datos. Obtención Registro 2. Organización y representación de datos. Datos ordenados Tabla de distribución de frecuencias Gráficos 3. Análisis de datos. Medidas de Tendencia Central 4. Obtención de conclusiones. Redacción a partir de las partes 2 y 3. RECOGIDA DE DATOS Los datos se recolectan mediante algún mecanismo o instrumento previamente seleccionado, y estructurado según el tipo de estudio, variable, población, entre otros. Quedan registrados de forma escrita (casi siempre) o en grabaciones de audio, video o ambas. ORGANIZACIÓN Y REPRESENTACIÓN DE DATOS Luego de obtenidos los datos, se organizan en secuencia ordenada (cuando sea posible) colocando juntos (uno a continuación del otro) todos los resultados similares. Tabla de Distribución de Frecuencias (TDF) La organización formal de los datos se realiza a través de tablas en las que se incluye generalmente la frecuencia con la que se repite cada valor de la variable (o frecuencias) y el porcentaje correspondiente. a. Frecuencia o frecuencia absoluta (f): es la cantidad total de veces que se repite un valor. La suma de las f da como resultado N (cantidad total de datos) b. Frecuencia relativa (fr): es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos. fr=f/N (Se recomienda usar tres o cuatro decimales). La suma de las fr es igual a 1. c. Porcentaje: se obtiene al multiplicar la fr por 100%. Su suma es 100%. * Medidas Acumuladas: la frecuencia absoluta acumulada, frecuencia relativa acumulada y porcentaje acumulado, se obtienen sumando consecutivamente los valores simples de cada medida. Tabla de Distribución de Frecuencias Variable f fa fr fra % %a f1 fr1 %1 f1 + f2 fr1 + fr2 %1+%2 r N 1 100 N 1 100 Nota: Este tipo de tablas de frecuencias se utiliza con variables cuya cantidad de valores es pequeña o no son agrupables. Tabla de Distribución de Frecuencias, para valores agrupados (TDF) Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. Es conveniente que el número de intervalos oscile entre 6 y 15. Este proceso se usa con variables de valores muy numerosos que permitan agrupamiento, casi siempre corresponde a datos cuantitativos continuos. En los valores de la variable, se registran las clases o intervalos definidos. Proceso para la agrupación de datos Se elige el número de intervalos que se desea obtener. Se resta el valor mayor menos el valor menor de la distribución ordenada de datos y al resultado (si el resultado no es divisible entre el nº de intervalos, se selecciona el número mayor siguiente que sea divisible) se le divide entre la cantidad total de intervalos que se quiere. a. Límites de la clase: Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase. b. Amplitud de la clase: es la diferencia entre el límite superior e inferior de la clase. Valores de la variable fr=f/N %=fr.100

Mat estadística (teoría y ejemplo) carta

Embed Size (px)

Citation preview

Page 1: Mat   estadística  (teoría y ejemplo) carta

PROPÓSITO Nº 24: NOCIONES DE ESTADÍSTICA

CONCEPTOS FUNDAMENTALES

Estadística: es la parte de las Matemáticas que se encarga del estudio de una determinada característica en una población, recogiendo los datos, organizándolos en tablas, representándolos gráficamente y analizándolos para sacar conclusiones de dicha población

Estadística descriptiva: Realiza el estudio sobre la población completa, observando una característica de la misma y calculando unos parámetros que den información global de toda la población.

Estadística inferencial: Realiza el estudio descriptivo sobre un subconjunto de la población llamado muestra y, posteriormente, extiende los resultados obtenidos a toda la población.

Variable: Es una característica o propiedad que tiene un conjunto de individuos o una población.

Tipos de variables:

1. Cuantitativas: son aquellas propiedades cuyos valores se expresan a través de números

a. Continuas: si sus valores están dados mediante números reales o a través de intervalos de números reales.

b. Discretas: cuando los valores sólo corresponden a números enteros.

2. Cualitativas: son las variables cuyos valores se representan con palabras.

a. Nominales: son las características cuyos valores no admiten un criterio de orden.

b. Ordinales: se refiere a los valores cualitativos que pueden ser ordenados según algún criterio.

Población: es el conjunto de todos los elementos a los que se somete a un estudio estadístico.

Muestra: es un conjunto representativo de la población de referencia. El número de individuos de una muestra es menor que el de la población.

Muestreo: es la reunión de datos que se desea estudiar, obtenidos de una proporción reducida y representativa de la población.

Técnicas de muestreo: son los mecanismos y procedimientos mediante los cuales se realiza el muestreo.

Valor: es cada uno de los distintos resultados que se pueden obtener en un estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y sello.

Dato: es cada uno de los valores que se ha obtenido al realizar un estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, sello, cara, sello.

ESTUDIO ESTADÍSTICO

1. Recogida de datos. � Obtención � Registro

2. Organización y representación de datos. � Datos ordenados � Tabla de distribución de frecuencias � Gráficos

3. Análisis de datos. � Medidas de Tendencia Central

4. Obtención de conclusiones. � Redacción a partir de las partes 2 y 3.

RECOGIDA DE DATOS

Los datos se recolectan mediante algún mecanismo o instrumento previamente seleccionado, y estructurado según el tipo de estudio, variable, población, entre otros.

Quedan registrados de forma escrita (casi siempre) o en grabaciones de audio, video o ambas.

ORGANIZACIÓN Y REPRESENTACIÓN DE DATOS

Luego de obtenidos los datos, se organizan en secuencia ordenada (cuando sea posible) colocando juntos (uno a continuación del otro) todos los resultados similares.

Tabla de Distribución de Frecuencias (TDF) La organización formal de los datos se realiza a través de tablas en las que se incluye generalmente la frecuencia con la que se repite cada valor de la variable (o frecuencias) y el porcentaje correspondiente.

a. Frecuencia o frecuencia absoluta (f): es la cantidad total de veces que se repite un valor. La suma de las f da como resultado N (cantidad total de datos)

b. Frecuencia relativa (fr): es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos. fr=f/N (Se recomienda usar tres o cuatro decimales). La suma de las fr es igual a 1.

c. Porcentaje: se obtiene al multiplicar la fr por 100%. Su suma es 100%.

* Medidas Acumuladas: la frecuencia absoluta acumulada, frecuencia relativa acumulada y porcentaje acumulado, se obtienen sumando consecutivamente los valores simples de cada medida.

Tabla de Distribución de Frecuencias Variable f fa fr fra % %a

f1 fr1 %1 f1 + f2 fr1 + fr2 %1+%2 r N 1 100 N 1 100

Nota: Este tipo de tablas de frecuencias se utiliza con variables cuya cantidad de valores es pequeña o no son agrupables. Tabla de Distribución de Frecuencias, para valores agrupados (TDF) Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. Es conveniente que el número de intervalos oscile entre 6 y 15. Este proceso se usa con variables de valores muy numerosos que permitan agrupamiento, casi siempre corresponde a datos cuantitativos continuos. En los valores de la variable, se registran las clases o intervalos definidos.

Proceso para la agrupación de datos

Se elige el número de intervalos que se desea obtener. Se resta el valor mayor menos el valor menor de la distribución ordenada de datos y al resultado (si el resultado no es divisible entre el nº de intervalos, se selecciona el número mayor siguiente que sea divisible) se le divide entre la cantidad total de intervalos que se quiere.

a. Límites de la clase: Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.

b. Amplitud de la clase: es la diferencia entre el límite superior e inferior de la clase.

Valores de la variable fr=

f/N

%=f

r.100

Page 2: Mat   estadística  (teoría y ejemplo) carta

c. Marca de clase: es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros.

Representación gráfica de datos

a. Diagrama de barras: se utiliza para representar datos cualitativos o datos cuantitativos de tipo discreto. Se colocan en el eje de abscisas los valores de la variable, y sobre el eje de ordenadas las frecuencias absolutas, relativas o acumuladas, y en algunos casos porcentajes. Los datos se representan mediante barras de una altura proporcional a la frecuencia, alrededor del valor y separadas entre sí equitativamente

b. Histograma: Se utilizan para variables agrupadas por intervalos de clase, cuantitativas (continuas o discretas). En el eje abscisas se construyen unos rectángulos que tienen por base la amplitud del intervalo, y por altura, la frecuencia absoluta de cada intervalo. La superficie de cada barra es proporcional a la frecuencia de los valores representados, o al porcentaje que representa.

c. Polígono de frecuencias: se utiliza para representar datos cualitativos o datos cuantitativos de tipo discreto. Se colocan en el eje de abscisas los valores de la variable, y sobre el eje de ordenadas las frecuencias absolutas o relativas o acumuladas. Se marcan puntos a la altura de la frecuencia de cada valor, y se unen posteriormente con segmentos, formando una línea poligonal.

d. Diagrama por sectores o circular: Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa frecuentemente para las variables cualitativas. Los datos se representan en un círculo, de modo que el ángulo de cada sector es proporcional a la frecuencia absoluta correspondiente o al porcentaje respectivo.

� �360

��

ANÁLISIS DE DATOS

Medidas de Tendencia Central (MTC)

Media: es el valor promedio de una distribución de datos. Se calcula haciendo la división de la sumatoria de todos los datos entre el N (número total de datos). Se utiliza para datos cuantitativos. La media es susceptible a los valores extremos muy grandes o pequeños.

� �∑ �� ���

Mediana: es el valor central de una distribución de datos cuantitativos ordenados. Se localiza dividiendo N (número total de datos) entre 2, se toma la parte entera del resultado y se realiza un conteo desde los extremos hacia el centro de la distribución.

Esta medida nos indica que la mitad de los datos se encuentran por debajo de la mediana y la otra mitad por encima, lo cual permite describir el comportamiento de los datos respecto a la mitad de la distribución.

* Nota: Si N es par, la mediana corresponderá al promedio de los dos valores centrales (los valores centrales se suman y se dividen por 2).

Moda: es el valor o valores con mayor frecuencia (que más se repiten) en una distribución. Una distribución de datos puede ser unimodal, bimodal o multimodal, según la cantidad de modas que contenga.

EJEMPLO

“Indagar sobre el color de ojos de los trabajadores de la Urbanización La Única, que cuenta con 33 habitantes”

Formulación del problema: A través de este trabajo de investigación se pretende responder las siguientes interrogantes ¿Cuáles son los colores de los ojos que hay en las personas de la Urbanización La Única? ¿Qué color de ojos predomina en la población de la Urbanización La Única?

Título de la investigación: Color de ojos de ojos de los habitantes de la Urbanización La Única

Objetivo general: Determinar el color de ojos de ojos de los habitantes de la Urbanización La Única

Población: El estudio está dirigido a los 36 habitantes de la Urbanización La Única, ubicada en la ciudad de Mérida, Estado Mérida.

Muestra: Por limitaciones de tiempo y accesibilidad, no se trabajará con toda la población, por lo cual se seleccionó una muestra representativa de 15 personas que representan el 42% del total de pobladores.

Variable de estudio: La variable que se evaluará a través de esta investigación es: “color de ojos”. Esta variable es de tipo cualitativa ya que sus valores se expresan mediante palabras (y no números). Además, es cualitativa de tipo nominal debido a que no puede establecerse un criterio que permita organizar los valores de la variable con una relación de orden entre ellos. Los valores que se tomaron en cuenta en la investigación son: verde, azul., gris. negro, marrón.

Instrumento de recolección de datos: La obtención de los datos se hará mediante encuesta oral a cada una de las personas que conforman la muestra. Para ello se les hará la siguiente pregunta: ¿Cuál es su color de ojos?

Datos recolectados: Azul, verde, marrón, azul, verde, negro, negro, marrón, azul, negro, marrón, negro, gris, negro, negro.

Datos ordenados: Azul, azul, azul, verde, verde, marrón, marrón, marrón, negro, negro, negro, negro, negro, negro, gris.

Medidas de tendencia central: 1. Media

No se calcula el promedio debido a la naturaleza de los datos, pues son de tipo cualitativo.

2. Mediana Debido a que los datos son de tipo cualitativo nominal y esto implica que entre ellos no hay una relación de orden o jerarquía, el cálculo de la mediana no permite ninguna interpretación válida acerca de la distribución de los datos. Por esa razón no se calculó.

3. Moda El dato que más se repite en la distribución es el color negro con una frecuencia de 6. Además, ningún otro dato se repite esa misma cantidad de veces, por ello hay una única moda “Negro”, lo que caracteriza a esta distribución de datos como unimodal.

Mo=Negro La distribución es Unimodal

Page 3: Mat   estadística  (teoría y ejemplo) carta

Tabla de Distribución de Frecuencias

Color de ojos f fa fr fra % %a Verde 2 2 0,1333 0,1333 13,33 13,33 Negro 6 8 0,4 0,5333 40 53,33 Marrón 3 11 0,2 0,7333 20 73,33

Azul 3 14 0,2 0,9333 20 93,33 Gris 1 15 0,0667 1 6,67 100

15 1 100

Ejemplo de TDF para datos agrupados

Tabla de Distribución de Frecuencias Estatura f fa fr fra % %a

[1,40;1,50) 1 1 0,05 0,05 5 5 [1,50,1,60) 5 6 0,25 0,3 25 30 [1,60;1,70) 9 15 0,45 0,75 45 75 [1,70;1,80) 3 18 0,15 0,9 15 90 [1,80;1,90) 2 20 0,1 1 10 100

20 1 100

0

2

4

6

8

Verde Negro Marrón Azul Gris

Fre

cue

nci

a

Gráfico 1: Color de ojos de los habitantes de la Urbanización La Única

0

2

4

6

8

Verde Negro Marrón Azul Gris

Fre

cue

nci

a

Gráfico 2: Color de ojos de los habitantes de la Urbanización La Única

0%

5%

10%

15%

20%

25%

30%

35%

40%

45%

Verde Negro Marrón Azul Gris

Gráfico 3: Color de ojos de los habitantes de la Urbanización La Única

17%

53%

27%

3%

Gráfico 4: Color de ojos de los habitantes de la Urbanización La Única

Verde

Negro

Marrón

Azul

0%

5%

10%

15%

20%

25%

30%

35%

40%

45%

50%

Muy

deficiente

Deficiente Regular Bueno Muy bueno

Gráfico 1: Rendimiento Académico de los Estudiantes de Matemática 1, en el

segundo semestre de Bioanálisis