Tema 1 de estadística (Grupo1)

Embed Size (px)

DESCRIPTION

Tema 1 de estadística.

Citation preview

Tema 1: Inicio de la estadstica.

Qu es la estadstica?

La Estadstica se ocupa de los mtodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrnseca de los mismos; as como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones.

Un estudio estadstico consta de las siguientes fases:

1. Recogida de datos.2. Organizacin y representacin de datos.3. Anlisis de datos.4. Obtencin de conclusiones.

Tipos:-Estadstica descriptiva: Describe, analiza y representa un grupo de datos utilizando mtodos numricos y grficos que resumen y presentan la informacin contenida en ellos.

-Estadstica inferencial: Apoyndose en el clculo de probabilidades y a partir de datos muestrales, efecta estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos.

Lenguaje estadstico.

PoblacinUna poblacin es el conjunto de todos los elementos a los que se somete a un estudio estadstico.IndividuoUn individuo o unidad estadstica es cada uno de los elementos que componen la poblacin.MuestraUna muestra es un conjunto representativo de la poblacin de referencia, el nmero de individuos de una muestra es menor que el de la poblacin.MuestreoEl muestreo es la reunin de datos que se desea estudiar, obtenidos de una proporcin reducida y representativa de la poblacin.ValorUn valor es cada uno de los distintos resultados que se pueden obtener en un estudio estadstico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y cruz.

DatoUn dato es cada uno de los valores que se ha obtenido al realizar un estudio estadstico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz.

Definicin de variableUna variable estadstica es cada una de las caractersticas o cualidades que poseen los individuos de una poblacin.Tipos de variable estadsticas:Variable cualitativaLas variables cualitativas se refieren a caractersticas o cualidades que no pueden ser medidas con nmeros. Podemos distinguir dos tipos:Variable cualitativa nominalUna variable cualitativa nominal presenta modalidades no numricas que no admiten un criterio de orden. Por ejemplo: El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo. Variable cualitativa ordinal o variable cuasicuantitativaUna variable cualitativa ordinal presenta modalidades no nmericas, en las que existe un orden. Por ejemplo:La nota en un examen: suspenso, aprobado, notable, sobresaliente.Puesto conseguido en una prueba deportiva: 1, 2, 3, ...Medallas de una prueba deportiva: oro, plata, bronce.

Variable cuantitativaUna variable cuantitativa es la que se expresa mediante un nmero, por tanto se pueden realizar operaciones aritmticas con ella. Podemos distinguir dos tipos:Variable discretaUna variable discreta es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores especficos. Por ejemplo:El nmero de hermanos de 5 amigos: 2, 1, 0, 1, 3.Variable continuaUna variable continua es aquella que puede tomar valores comprendidos entre dos nmeros. Por ejemplo: La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75. En la prctica medimos la altura con dos decimales, pero tambin se podra dar con tres decimales.

Distribucin de frecuenciasLa distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente. Tipos de frecuencias:Frecuencia absolutaLa frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio estadstico. Se representa por fi. La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por N. igualdadPara indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula) que se lee suma o sumatoria.igualdad

Frecuencia relativaLa frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento y se representa por ni. frecuencia relativaLa suma de las frecuencias relativas es igual a 1.Frecuencia acumuladaLa frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Se representa por Fi.Frecuencia relativa acumuladaLa frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento.Ejemplo:Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas mximas:32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta.xi RecuentofiFiniNi

27I110.0320.032

28II230.0650.097

29recuento690.1940.290

30recuento7160.2260.516

31elrecuento8240.2580.774

32III3270.0970.871

33III3300.0970.968

34I1310.0321

311

Este tipo de tablas de frecuencias se utiliza con variables discretas.

Distribucin de frecuencias agrupadasLa distribucin de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un nmero grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.Lmites de la claseCada clase est delimitada por el lmite inferior de la clase y el lmite superior de la clase.Amplitud de la claseLa amplitud de la clase es la diferencia entre el lmite superior e inferior de la clase.Marca de claseLa marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el clculo de algunos parmetros.Construccin de una tabla de datos agrupados3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.1 Se localizan los valores menor y mayor de la distribucin. En este caso son 3 y 48.2 Se restan y se busca un nmero entero un poco mayor que la diferencia y que sea divisible por el nmero de intervalos queramos establecer. Es conveniente que el nmero de intervalos oscile entre 6 y 15.En este caso, 48 - 3 = 45, incrementamos el nmero hasta 50 : 5 = 10 intervalos.Se forman los intervalos teniendo presente que el lmite inferior de una clase pertenece al intervalo, pero el lmite superior no pertenece intervalo, se cuenta en el siguiente intervalo.

3. Presentacin de los datos estadsticos (diferencia entre discretas y continuas)

-Presentacin tabular: Cuando los datos estadsticos se presentan a travs de un conjunto de filas y de columnas que responden a un ordenamiento lgico; es de gran eso e importancia para el uso e importancia para el usuario ya que constituye la forma ms exacta de presentar las informaciones. Una tabla consta de varias partes, las principales son las siguientes:Titulo: Es la parte ms importante del cuadro y sirve para describir todo l contenido de este.Encabezados: Son los diferentes subttulos que se colocan en la parte superior de cada columna.Columna matriz: Es la columna principal del cuadro.Cuerpo: El cuerpo contiene todas las informaciones numricas que aparecen en la tabla.Fuente: La fuente de los datos contenidos en la tabla indica la procedencia de estos.Notas al pie: Son usadas para hacer algunas aclaraciones sobre aspectos que aparecen en la tabla o cuadro y que no han sido explicados en otras partes.

Presentacin grfica: Proporciona al lector o usuario mayor rapidez en la comprensin de los datos, una grfica es una expresin artstica usada para representar un conjunto de datos.De acuerdo al tipo de variable que vamos a representar, las principales graficas son las siguientes:Histograma: Es un conjunto de barras o rectngulos unidos uno de otro, en razn de que lo utilizamos para representar variables continuas. Polgono de frecuencias: Esta grfica se usa para representar los puntos medios de clase en una distribucin de frecuenciasGrfica de barras: Es un conjunto de rectngulos o barras separadas una de la otra, en razn de que se usa para representar variables discretas; las barras deben ser de igual base o ancho y separadas a igual distancia. Pueden disponerse en forma vertical y horizontal.Grfica lineal: Son usadas principalmente para representar datos clasificados por cantidad o tiempo; o sea, se usan para representar series de tiempo o cronolgicas.Grfica de barra 100% y grfica circular: se usan especialmente para representar las partes en que se divide una cantidad total.La ojiva: Esta grfica consiste en la representacin de las frecuencias acumuladas de una distribucin de frecuencias. Puede construirse de dos maneras diferentes; sobre la base "menor que" o sobre la base "o ms". Puede determinar el valor de la mediana de la distribucin.En estadstica denominamos grficos a aquellas imgenes que, combinando la utilizacin De sombreado, colores, puntos, lneas, smbolos, nmeros, texto y un sistema De referencia (coordenadas), permiten presentar informacin cuantitativa. La utilidad De los grficos es doble, ya que pueden servir no slo como sustituto a las tablas, sino que tambin constituyen por s mismos una poderosa herramienta para el anlisis De los datos, siendo en ocasiones el medio ms efectivo no slo para describir y resumir la informacin, sino tambin para analizarla.En este trabajo solo nos vamos a centrar nicamente en los grficos como vehculo de presentacin de datos, sin abordar su otra faceta como herramienta de anlisis.

Diferencia entre discretas y continuas:

Una variable continua es una variable en los reales.
Ejemplo: el tiempo (la hora).
Una discreta es una variable que varia en un conjunto discreto, como por ejemplo, los enteros.
Ejemplo: el numero de vestidos que tienes.

3.1. Grficos.

HISTOGRAMA

GRFICA DE BARRAS

GRFICA LINEAL

3.2. Tablas

TABLA