Upload
grahbio14
View
148
Download
0
Embed Size (px)
Citation preview
CUESTIONES PRÁCTICAS SOBRE LA UTILIDAD DE LA ESTADÍSTICA
Elisa A. Mendoza G.Universidad de Panamá
LO BÁSICO• Si Ud, ha decidido emplear técnicas de análisis estadístico de
datos, es porque ha determinado que esta ciencia “La Estadística”, le permitirá generar conclusiones científicas y válidas para las tomas de decisiones.
• Reconoce la IMPORTANCIA DE LA ESTADÍSTICA en el análisis de datos.
Elisa Mendoza G.Universidad de Panamá
LO BÁSICO• La Estadística: recolecta, procesa u organiza,
presenta y analiza.• La Estadística, se divide en dos grandes ramas:• Estadística descriptiva• Estadística inferencial
• La Estadística descriptiva, entre otros aspectos:• Ayuda a definir variables de estudio en cuanto al tipo y
la escala de medición.• Provee formas o métodos de organización y
presentación de datos, como lo son los cuadros, tablas y gráficas.
• Genera resultados numéricos importantes, como los promedios, porcentajes, varianzas y desviaciones estándar.
Elisa Mendoza G.Universidad de Panamá
LO BÁSICO• La comprensión de los métodos básicos estadísticos, como la obtención
del promedio y la varianza, así como su interpretación es un paso importante para realizar análisis más complejos.
• La probabilidad es el inicio en la aplicación de la Estadística Inferencial. Por ejemplo, ayuda a verificar la probabilidad de que la media de una muestra (estimación) es igual o aproximadamente igual, a la supuesta media de la población (parámetro).
• Las probabilidades, cuantifican las posibilidades de la ocurrencia de un evento, “hecho”, o “resultado”.
• La importancia de una correcta decisión de muestrear o censar: Por ejemplo, Analiza esto: Si realizas un estudio por muestras, y la media resultante en la edad es 5 años; pero luego, tienes la oportunidad de completar el estudio y estudiar a toda la población, y encuentras que la media es 5. ¿a qué conclusión llegarías? ¿era necesario censar?.
Elisa Mendoza G.Universidad de Panamá
LO BÁSICO• Las Estimaciones por Intervalos, Proporcionan un rango de
valores, a partir de una muestra, entre los cuales probablemente está el verdadero poblacional.• Recuerda que en la selección de una sola muestra, se pueden
seleccionar muchas muestras más del mismo tamaño.• Ejemplo: Sea una población compuesta por Ana, Blas, Carlos, Diana y
Ema, cuyos nombres representamos con A, B, C, D y E.• Se toma una muestra de tres de ellos: ¿A quiénes elegirías? Y ¿por qué?• ¿Qué otras muestras de tres de ellos se pudieron conformar?.• Al realizar el estudio por muestras, ¿qué ocurre con el resto de las muestra?
¿las tomas en cuenta o sólo te basas en la primera que elegiste?.• Bien, supongamos que se estudian los pesos de estas 5 personas,
respectivamente son: 120, 135, 158, 133, 109. Ahora, para la muestra que tomaste, cuánto fue el promedio y la desviación estándar?. Para las cinco personas o población, cuánto fue el promedio y la desviación estándar?.
• A qué conclusión llegas?• Las estimaciones, son estadísticas de las muestras, que
esperamos sean aproximaciones de los parámetros poblacionales.
Elisa Mendoza G.Universidad de Panamá
ESTIMACIONES• Para hablar de estimaciones por intervalos, se debe tener en cuenta dos
términos:• Nivel de confianza: Probabilidad de que en 100 muestras, 95 de ellas den como
resultado la estadística parámetro. ¿cuántas escogemos nosotros?. La probabilidad (muestreo probabilístico) nos asegura que podemos elegir una buena muestra.
• Error típico: Cantidad en que se desvía la estimación en promedio con relación al parámetro. S/
• Los intervalos de confianza, son expresiones numéricas en rangos de dos números (valor inferior y valor superior), obtenido a partir de las estadísticas de la muestra.• Intervalo de confianza: Límite inferior, Límite superior
• La amplitud de este intervalo, o sus límites dependen de varios aspectos, entre ellos la estadística a estimar: media, proporción o varianza; del error típico correspondiente y el nivel de confianza que se utiliza (generalmente 95%).
• Intervalo de confianza (IC): ( Lim. Inf., Lim. Sup. )• Límite inferior: Estadística – coef. De confianza * error típico• Límite superior: Estadística + coef. De confianza * error típico
: error1- : nivel de confianza
n
Elisa Mendoza G.Universidad de Panamá
ESTIMACIONES• Los coeficientes de confianza, son los valores de la abscisa
(X) correspondientes a determinadas probabilidades.• Por ejemplo, en la distribución normal estándar, Z representa el
coeficiente de confianza. Para una probabilidad de 90%, Z = 1.645 (una cola) y Z=1.96 (dos colas).
• ¿Qué significado tiene las dos colas o una cola?• Pues las distribuciones de probabilidad, éstas pueden ser acumulativas
“menor que”.• Ejemplo:
• Por ejemplo, la probabilidad acumulada hasta 200 libras es 0.95; pero la probabilidad de 101 a 200 libras es de 0.85. ¿Cómo obtuvimos 0.85?
Peso Probabilidad Acumulada
Menor de 100 0.10
De 101 a 200 0.95
De 201 a más 1.00
Elisa Mendoza G.Universidad de Panamá
ESTIMACIONES• Los intervalos de confianza, expresan dos valores o límites, así que gráficamente
en una distribución simétrica como la distribución normal, se representa con dos colas, así:
-c cCola 1. Cola 2.
Probabilidad “entre -c y c”Si las estimaciones, se obtienen para la media, es necesario obtener su respectiva desviación estándar.
Si las estimaciones, se obtienen para las proporciones, es necesario calcular su respectiva desviación estándar.
Los intervalos de confianza, requieren la estadística (media o proporción) y su desviación estándar correspondiente.
Además, se requiere la probabilidad de confianza y por lo tanto el coeficiente de confianza. Elisa Mendoza G.
Universidad de Panamá
REGLA EMPÍRICA
-3 -2 - 2 3 z
1-
Entre - y , hay 68 % [(1- )%] probabilidad de acertar y = 32% de error.
Entre -2 y 2 hay 95% de acertar y 5% de error
Entre -3 y 3 hay 99.7% de acertar y 0.3% de error.
/ 2 / 2
En las colas de ambos extremos se reparte el complemento de 1-
68%
95%99%
-3 -2 - 2 3 z
1-
Entre - y , hay 68 % [(1- )%] probabilidad de acertar y = 32% de error.
Entre -2 y 2 hay 95% de acertar y 5% de error
Entre -3 y 3 hay 99.7% de acertar y 0.3% de error.
Entre - y , hay 68 % [(1- )%] probabilidad de acertar y = 32% de error.
Entre -2 y 2 hay 95% de acertar y 5% de error
Entre -3 y 3 hay 99.7% de acertar y 0.3% de error.
/ 2 / 2
En las colas de ambos extremos se reparte el complemento de 1-
68%
95%99%
PRUEBAS DE HIPÓTESIS
Igualmente, se emplean los conceptos de nivel de confianza y error.
Las pruebas de hipótesis, comprueban la veracidad de un supuesto. Generalmente, su aproximación al valor que se considera como el parámetro poblacional.
Las pruebas de hipótesis se pueden realizar sobre los datos muestrales de una población, de dos poblaciones o más poblaciones.
Cuando se refieren a dos poblaciones, se realiza la comparación de las estadísticas. Pueden se mediciones antes – después, o pueden ser mediciones de dos poblaciones distintas.
Cuando se refieren a más de dos poblaciones las técnicas de análisis a emplear son más complejas.
Elisa Mendoza G.Universidad de Panamá
PRUEBAS DE HIPÓTESIS EN DISTRIBUCIONES DE PROBABILIDAD SIMÉTRICAS.
-c cCola 1. Cola 2.
-c Cola 1.
c
Cola 2.
Probabilidad “menor que -c”
Probabilidad “mayor que c”
Probabilidad “entre -c y c”Caso donde las Hipótesis son:
Ho: = o.
Ha: < o.
Caso donde las Hipótesis son: Ho: = o.
Ha: o.
Caso donde las Hipótesis son: Ho: = o.
Ha: > o.
Elisa Mendoza G.Universidad de Panamá
POBLACIONES ESTADÍSTICAS Y PRUEBAS DE HIPÓTESIS
Fuente
Muestra 1 Muestra 2
Fuente A Fuente B
Muestra 1 Muestra 2
Muestra Dependiente Muestras IndependientesEn las pruebas de hipótesis de dos poblaciones o más, es importante reconocer si las poblaciones son independientes o no lo son, esta característica influye en las pruebas estadísticas a realizar. Elisa Mendoza G.
Universidad de Panamá
FÓRMULAS GENERALESEstimaciones puntuales: media, proporciones, varianzas, etc.
Estimaciones por intervalos: Intervalo de confianza (IC)
Para la media de una población
media coeficiente de confianza * error
El coeficiente de confianza, para 95% de confianza es 1.96
El error se calcula, como: (en poblaciones infinitas)ns / Nivel de confianzaNivel de confianza ZZ(1(1--))
99%99% 2.582.58 98%98% 2.332.33 95%95% 1.961.96 90%90% 1.651.65
Elisa Mendoza G.Universidad de Panamá
CORRELACIONES DE VARIABLES• En las correlaciones de variables, es importante
conocer qué tipos de variables se están analizando. ¿Son cualitativas o son cuantitativas?.• Las correlaciones, miden el grado de asociación
de las variables de estudio. Hablar de asociación, es decir, que una variable (o varias) afecta en alguna medida el cambio o la variabilidad de la otra variable.• Si son cuantitativas, entonces, se aplica la técnica
de Análisis de Regresión.• Si son cualitativas, entonces, se aplica la Prueba
de Independencia o Tablas de contingencias.
Elisa Mendoza G.Universidad de Panamá
LA NORMALIDAD: DISTRIBUCIÓN NORMAL• La mayoría de las técnicas inferenciales, se basan en el
supuesto de la normalidad. Cuando los datos no tienen o no suponen normalidad. Se emplean técnicas no paramétricas.
• La normalidad se debe verificar o puede verificar a través de estadísticas de sesgo, curtosis, de tendencia central y gráficas como el histograma y el polígono de frecuencias entre otras.
Formas sencillas de verificar la normalidad de los datos.
Formas sencillas de verificar la normalidad de los datos.
Elisa Mendoza G.Universidad de Panamá
LO IMPORTANTE, ES ...• Comprender que la media y la varianza son
insumos básicos en la estadística inferencial. Saber calcular la media y la varianza ayudará a realizar mejores análisis.• La probabilidad es un concepto fundamental
para comprender la posibilidad de la ocurrencia de algo de un resultado. • Las probabilidades se conocen también como
percentiles.• En la estadística inferencia, la probabilidad ayuda
a determinar intervalos de confianza y a comprobar hipótesis.
Elisa Mendoza G.Universidad de Panamá
GRACIAS