View
37.559
Download
2
Category
Preview:
DESCRIPTION
ES UNA RECOPILACIÓN DE CONCEPTO BÁSICOS PARA EL ESTUDIO DE LA ESTADÍSTICA DESCRIPTIVAS
Citation preview
BIENVENIDOS AL
MARAVILLOSO MUNDO DE LA
ESTADISTICA
Estadística Descriptiva (Deductiva): es la encargada de la organización, condensación, presentaciónde los datos en tablas y gráficos y del cálculo de medidas numéricas que permitan estudiar los aspectos más importantes de los datos.
Estadística Inferencial o Inferencia Estadística: está definida por un conjunto de técnicas, mediante las cuales se hacen generalizaciones o se toman decisiones en base a información parcial obtenida mediante técnicas descriptivas.
El uso de la Estadística es muy amplio. Resulta difícil nombrar un área en la cual no se emplee.
Los métodos estadísticos han encontrado aplicación en:› Gobierno› Negocios› Ciencias Sociales› Ingeniería› Ciencias Física y Naturales› Control de Calidad› Procesos de Manufactura› Muchos otros campos de la actividad
intelectual.
Población: es la colección de todas las
posibles mediciones u observaciones que
pueden hacerse de una variable bajo
estudio
Se clasifica en dos categorías:
› Finita: es aquella que incluye una
cantidad limitada contable de
observaciones, individuos o medidas.
Siempre que sea posible alcanzar
(contar) el número total de todas las
posibles mediciones, se considera como
finita la población
› Infinita: es aquella que incluye un granconjunto de observaciones o medicionesque no pueden alcanzarse por conteo. Almenos, hipotéticamente, no existe límite encuanto al número de observaciones que elexperimento puede generar.
Muestra:
› es un conjunto de mediciones uobservaciones tomadas a partir de unapoblación.
› es un subconjunto de la población.
Variables: › son las características o lo que se estudia de
cada individuo de la muestra. Ej: sexo, edad, peso, estatura, color de ojos, estado civil, temperatura, cantidad de nacimientos, presión, grosor, diámetro, ...
Datos:› son los valores que toma la variable en cada
caso.
Cualitativos: son datos que solo toman valores asociados a las cualidades o atributos, clasificándolos en una de varias categorías, es decir, no son valores numéricos.
Cuantitativos: provienen de variables que
pueden medirse, cuantificarse o expresarse
numéricamente. Ejemplos: Peso, edad, estatura
presión, humedad etc.
Tipos de variables cuantitativas:
› Discretas: es aquella que solopuede tomar un número finito oinfinito numerable de valores.Ejemplo: cantidad de hermanos.
› Continuas: es la variable que puedetomar cualquier valor en una escalacontinua. Ejemplo: cantidad delíquido contenido en un recipiente
Escala Nominal.
Escala Ordinal.
Escala de Intervalos.
Escala de Razón o Proporción.
Escala Absoluta.
Muestra:
› es un conjunto de mediciones u
observaciones tomadas a partir de
una población.
› es un subconjunto de la población.
Muestra aleatoria: se considera aleatoria
siempre y cuando cada
observación, medición o individuo de la
población tenga la misma probabilidad
de ser seleccionado.
Variables: › son las características o lo que se estudia de
cada individuo de la muestra. Ej: sexo, edad, peso, estatura, color de ojos, estado civil, temperatura, cantidad de nacimientos, presión, grosor, diámetro, ...
Datos:› son los valores que toma la variable en
cada caso.
Cualitativos: son datos que solo toman valores
asociados a las cualidades o
atributos, clasificándolos en una de varias
categorías, es decir, no son valores numéricos. Ej:
› Sexo: f/m.
› Hábito de fumar: Fumador/No fumador
› Color de ojos: negro, azul, marrón, …
› Religión: católica, evangélica, …
› Estado civil: soltero, casado, divorciado,…
Una vez que se ha realizado la recolección de los datos, se obtienen datos en bruto, los cuales rara vez son significativos sin una organización y tabulación.
Formas de organizar los datos:
› Un arreglo: es la forma más sencilla de organizar
los datos en bruto, consiste en colocar las
observaciones en orden según su magnitud:
ascendente o descendente.
› Poco práctica cuando se tiene una gran
cantidad de datos.
› Una distribución de frecuencias: es un arreglo de los datos que permite expresar la frecuencia de ocurrencias de las observaciones en cada una de las clases, mostrando el patrón de la distribución de manera más significativa.
Clase Pto.
Medio
fi Fi fri FRi
La Distribución de Frecuencias:› Se recomienda su uso cuando se tienen
grandes cantidades de datos (n).
› Su construcción requiere, en primer lugar, la selección de los límites de los intervalos de clase.
› Para definir la cantidad de intervalos de clase (k), se puede usar:
La regla de Sturges: k = 1 + 3.3log(n)
k = n
La cantidad de clases no puede ser tan pequeño (menos de 5) o tan grande (más de 20), que la verdadera naturaleza de la distribución sea imposible de visualizar.
La amplitud de todas las clases deberá ser la misma. Se recomienda que sea impar y que los puntos medios tengan la misma cantidad de cifras significativas que los datos en bruto.
Los límites de las clases deben tener una cifra significativa más que los datos en bruto.
Los gráficos permiten visualizar en forma global y
rápida el comportamiento de los datos.
Para datos cuantitativos agrupados en
clases, comúnmente se utilizan tres gráficos:
› Histogramas.
› Polígono de frecuencias.
› Ojiva o Polígono de frecuencias acumuladas.
Histograma
Histograma y Polígono de Frecuencias
Ojiva
Para datos cualitativos se usan:
› Curvas
› Barras
› Sectores
Barras
Barras
Sectores, torta o circular
Las medidas de tendencia central más
importantes son:
› Media: Aritmética y Aritmética ponderada.
› Mediana.
› Moda.
Es la suma de todas las observaciones dividida entre elnúmero total de observaciones.
Expresada de forma más intuitiva, podemos decir quela media aritmética es la cantidad total de la variabledistribuida a partes iguales entre cada observación.(wikipedia)
Por ejemplo, si en una habitación hay tres personas, lamedia de dinero que tienen en sus bolsillos sería elresultado de tomar todo el dinero de los tres y dividirloa partes iguales entre cada uno de ellos. Es decir, lamedia es una forma de resumir la información de unadistribución (dinero en el bolsillo) suponiendo que cadaobservación (persona) tendría la misma cantidad de lavariable. (wikipedia)
Para datos no agrupados:
n
x
X
n
i
i
1
Para datos agrupados:
n
fm
X
k
i
ii
1
Donde: mi: punto medio de la clase i
fi: frecuencia absoluta de la clase i
k: cantidad de clases
Es el valor que ocupa la posición central
de un conjunto de observaciones, una
vez que han sido ordenados en forma
ascendente o descendente.
Divide al conjunto de datos en dos
partes iguales.
Para datos no agrupados:
› Si n es impar: posición donde se ubica la
mediana es igual a (n+1)/2.
› Si n es par: (n+1)/2 no es entero, por lo tanto la mediana será igual al promedio de las
dos posiciones centrales.
Datos agrupados: clase mediana es la
que contiene a la observación que
ocupa la posición n/2.
Cmxf
xFn
LmMdm
m
)(
)(2
11
Donde: Lm: límite inferior de la clase mediana.
F(xm-1): frecuencia acumulada de la clase
anterior a la clase mediana.
f(xm): frecuencia absoluta de la clase mediana.
Cm: amplitud de la clase mediana.
Observación o clase que tiene la mayor
frecuencia en un conjunto de
observaciones.
Un conjunto de datos puede ser
unimodal, bimodal o multimodal.
Es la única medida de tendencia central
que se puede determinar para datos de
tipo cualitativo.
Para datos no agrupados: es simplemente
la observación que más se repite.
Para datos agrupados:
CmLimMo21
1
Donde: Lim: límite inferior de la clase modal.
1: diferencia entre fi de la clase modal y la
anterior.
2: diferencia entre fi de la clase modal y la
posterior.
Cm: amplitud de la clase modal (clase de mayor
frecuencia).
Cuando los datos son sesgados es mejor emplear la Md
Recommended