View
5
Download
0
Category
Preview:
Citation preview
Universidad Técnica Federico Santa María
Departamento de Informática
ILI-280
Capítulo 1:Capítulo 1:DEFINICIONES Y DEFINICIONES Y
conceptosconceptosEstadística ComputacionalEstadística Computacional
1º Semestre 20031º Semestre 2003
Profesor :Héctor AllendePágina : www.inf.utfsm.cl/~hallendee-mail : hallende@inf.utfsm.cl
2Profesor:H. Allende
CONCEPTOSCONCEPTOS
¿ Qué es la Estadística ?POBLACIONMUESTRAVARIABLESDATOSESTADISTICAPARAMETROEXPERIMENTO FORMA ( PATRON)
¿ Qué es la Estadística ?POBLACIONMUESTRAVARIABLESDATOSESTADISTICAPARAMETROEXPERIMENTO FORMA ( PATRON)
3Profesor:H. Allende
¿ Qué es la estadística ?¿ Qué es la estadística ?Ciencia dedicada al estudio sistemático de los datos
Transforma datos en informaciónContribuye a la generación de conocimiento
Historia de la estadística :Historia de la estadística :Como ciencia de Estado (2600 A.C.)Como cálculo de probabilidades (siglo XVIII)
Papel de la estadística :Papel de la estadística :Proporcionar métodos para evaluar y juzgar la
teoría y la realidadExtraer la información contenida en los datos
4Profesor:H. Allende
USOSUSOSCiencias naturalesCiencias económicas políticas y socialesCiencias médicasCiencias morales etc.
ABUSOSABUSOSEncuestas de opiniónÍndices económicosPronósticos
5Profesor:H. Allende
La Estadística en la era de la InformaciónDestrezas lectoras para la sociedad del
Conocimiento
EL PENSAMIENTO ESTADÍSTICOEL PENSAMIENTO ESTADÍSTICOEl pensamiento estadístico algún día será
parte del ciudadano eficiente, y tan necesario como la habilidad para leer y escribir
W. H. WELLSW. H. WELLS
6Profesor:H. Allende
MODELO VariablesVariables::-- Número de fallas (Número de fallas (xx11))-- Tiempo reparación (Tiempo reparación (xx22))HipótesisHipótesis:: las fallaslas fallas••Se producen Se producen independientementeindependientemente••La probabilidad de no La probabilidad de no disminuye exponencialmente disminuye exponencialmente con el tiempocon el tiempoHipótesis: Hipótesis: tiempo reparacióntiempo reparación••Depende de muchos Depende de muchos pequeños factorespequeños factores
PREGUNTA
VariablesVariables::-- Rendimiento en % (Rendimiento en % (yy))-- Temperatura Temperatura xx11-- Concentración Concentración xx22HipótesisHipótesis::••El rendimiento aumenta en El rendimiento aumenta en promedio linealmente con la promedio linealmente con la temperatura y la temperatura y la concentraciónconcentración••Para valores fijos de Para valores fijos de xx11 y y xx22el rendimiento varía el rendimiento varía aleatoriamente alrededor de aleatoriamente alrededor de su valor mediosu valor medio
2 Ejemplos de aplicaciones de Estadísticas2 Ejemplos de aplicaciones de Estadísticas
Cómo diseñar un sistema de Cómo diseñar un sistema de mantenimiento
Cómo aumentar el Cómo aumentar el rendimiento de un procesomantenimiento rendimiento de un proceso
7Profesor:H. Allende
RECOLECCIÓN DE INFORMACIÓN
Muestreo de máquinas para estudiar sus fallas muy tiempo de reparación
Diseño de un experimento que se varíen x1 y x2 y se mida y
ESTIMACIÓN PARÁMETROS
Estimar:• λ , tasa media de fallas• µ , tiempo medio de reparación• σ , variabilidad en el tiempo de reparación
Estimar:• El efecto de la temperatura (b) y el de la concentración (c) sobre el rendimiento•Variabilidad experimental
CONTRASTES DE SIMPLIFI-CACIÓN
¿Tienen todos los tipos de máquinas el mismo λ ?¿Los tipos de fallas, el mismo µ y σ ?
¿Es el efecto de la temperatura y concentración idéntico (b=c ) ?
CRÍTICA DEL MODELO
¿Es la relación entre y(x1 , x2) lineal?¿Es la variabilidad de y para x1, x2 fijos, independ. de los valores concretos de x1, x2 ?
¿Es cierta la independencia entre las fallas?¿Es la variancia de x1 ^ x2 en la muestra consistentes con las hipótesis ?
Problema realProblema real
Formulación del problemaFormulación del problemaObjetos y medios
Modelos EstadísticosModelos Estadísticos(Cálculo de probabilidades)(Cálculo de probabilidades)
Depuración de los datosDepuración de los datos(Análisis de datos)(Análisis de datos)
Estimación de los parámetrosEstimación de los parámetros(Teoría de la estimación)(Teoría de la estimación)
Objetos y medios
Recolección de información (Recolección de información (muestralmuestral))(Técnicas de muestreo ; diseño de experimentos)(Técnicas de muestreo ; diseño de experimentos)
Contrastes de SimplificaciónContrastes de Simplificación(Contrastes de hipótesis)(Contrastes de hipótesis)
Crítica y Diagnosis del ModeloCrítica y Diagnosis del Modelo(Análisis de datos)(Análisis de datos)
Nuevo Conocimiento Nuevo Conocimiento
PrevisionesPrevisiones DecisionesDecisiones
10Profesor:H. Allende
Técnicas de MuestreoTécnicas de Muestreo
VentajasCosto reducidoMayor rapidezMayor posibilidad (Sistemas complejos)
APLICACIONES:MercadotecniaAnálisis de ImágenesModelos de Simulación
VentajasCosto reducidoMayor rapidezMayor posibilidad (Sistemas complejos)
APLICACIONES:MercadotecniaAnálisis de ImágenesModelos de Simulación
11Profesor:H. Allende
Teoría de muestreoTeoría de muestreo
Población finitaPoblación infinitaPoblación finitaPoblación infinita
Muestreo
ProbabilísticoProbabilísticoProbabilístico No ProbabilísticoNo ProbabilísticoNo Probabilístico
♦♦Definición del conjunto de muestrasDefinición del conjunto de muestras♦♦Asignación de Probabilidad ( Asignación de Probabilidad ( ππii ))♦♦SelecciSeleccióón n ( ( ππii ))♦♦ EstimaciEstimacióónn
12Profesor:H. Allende
Medidas de ProbabilidadMedidas de Probabilidad
Probabilidad una medida de la certidumbre La confiabilidad de una Inferencia
Aproximación frecuentista - “A Priori”Pr (Ai) = n/N
• n = número de todas las posibles formas en que “Ai” puede ser observado
• N = número total de posibles resultados
Aproximación SubjectivaUna “Opinión de Experto”
Probabilidad una medida de la certidumbre La confiabilidad de una Inferencia
Aproximación frecuentista - “A Priori”Pr (Ai) = n/N
• n = número de todas las posibles formas en que “Ai” puede ser observado
• N = número total de posibles resultados
Aproximación SubjectivaUna “Opinión de Experto”
13Profesor:H. Allende
PoblaciónPoblación
Definición:Conjunto de elementos u objetos - que obedecen a reglas de pertenencia definidas por el observador - de los cuales se desea conocer ciertos parámetros de comportamiento y características ( formas) de la Población.
Observación:Cada sujeto o elemento de la Población. Cada
uno es una “incognita” en el sentido que puede tener uno de los tantos valores posibles de observar de cierta característica.
Definición:Conjunto de elementos u objetos - que obedecen a reglas de pertenencia definidas por el observador - de los cuales se desea conocer ciertos parámetros de comportamiento y características ( formas) de la Población.
Observación:Cada sujeto o elemento de la Población. Cada
uno es una “incognita” en el sentido que puede tener uno de los tantos valores posibles de observar de cierta característica.
14Profesor:H. Allende
PoblaciónPoblación
La Población puede ser: Finita : Si los elementos son finitos
Infinita : Si los elementos son denumerables ono denumarables
La Teoría de Muestreo pretende desarrollar métodos para obtener un conocimiento adecuado de ciertas características de una Población, mediante el estudio de un número reducido de elementos u objetos representativos de dicha Población
La Población puede ser: Finita : Si los elementos son finitos
Infinita : Si los elementos son denumerables ono denumarables
La Teoría de Muestreo pretende desarrollar métodos para obtener un conocimiento adecuado de ciertas características de una Población, mediante el estudio de un número reducido de elementos u objetos representativos de dicha Población
15Profesor:H. Allende
Planes de MuestreoPlanes de Muestreo
Muestreo Aleatorio SimpleMuestreo Estratificado AleatorioMuestreo SistemáticoMuestreo por ConglomeradoMuestreo Múltiple
Muestreo Aleatorio SimpleMuestreo Estratificado AleatorioMuestreo SistemáticoMuestreo por ConglomeradoMuestreo Múltiple
16Profesor:H. Allende
MuestreoMuestreo
Experimento: Un proceso de Observación
Evento Simple:Un Resultado de un experimento que no puede ser descompuesto.
• “Mutuamente Excluyente” , “Idéntica Posibilidad”
Espacio Muestral:El conjunto de todos los resultados posibles
Evento “A”:El conjunto de todos los eventos simples que pertenecen al resultado “A”
Experimento: Un proceso de Observación
Evento Simple:Un Resultado de un experimento que no puede ser descompuesto.
• “Mutuamente Excluyente” , “Idéntica Posibilidad”
Espacio Muestral:El conjunto de todos los resultados posibles
Evento “A”:El conjunto de todos los eventos simples que pertenecen al resultado “A”
17Profesor:H. Allende
Espacio Espacio MuestralMuestral
Conjunto de todos los resultados u observaciones que se pueden observar al realizar un experimentoPuede ser : Discreto o Continuo
Sea n : Tamaño de la Muestra N :Tamaño de la Población
{Si: i = 1, 2, .... } todas las muestras posibles Si se denomina el Espacio Muestral o Universo.
Sea n : Tamaño de la Muestra N :Tamaño de la Población
{Si: i = 1, 2, .... } todas las muestras posibles Si se denomina el Espacio Muestral o Universo.
nN
Conjunto de todos los resultados u observaciones que se pueden observar al realizar un experimentoPuede ser : Discreto o Continuo
18Profesor:H. Allende
Clasificación de Métodos de MuestreoClasificación de Métodos de Muestreo
1.- Por la Forma de Considerar un EventoSin Reposición o Con Reposición
2.- Por la Forma de Tomar la MuestraJuicioAleatoria
• Simple• Sistemática• Estratificada• Conglomerados
3.- Por el número de MuestrasSimple o Múltiple
1.- Por la Forma de Considerar un EventoSin Reposición o Con Reposición
2.- Por la Forma de Tomar la MuestraJuicioAleatoria
• Simple• Sistemática• Estratificada• Conglomerados
3.- Por el número de MuestrasSimple o Múltiple
19Profesor:H. Allende
Muestreo AleatorioMuestreo Aleatorio
Conjunto de observaciones tomadas de una Población.Se dice que la muestra es aleatoria cuando la manera de selección de cada muestra de la población tiene igual oportunidad de ser seleccionada.El método de selección es decisivo en las conclusiones que se pueden obtener de la muestra.
Conjunto de observaciones tomadas de una Población.Se dice que la muestra es aleatoria cuando la manera de selección de cada muestra de la población tiene igual oportunidad de ser seleccionada.El método de selección es decisivo en las conclusiones que se pueden obtener de la muestra.
20Profesor:H. Allende
Tipos de VariablesTipos de Variables
Tanto en la escala intervalar como en la de razón es posible distinguir dos tipos de variables aleatorias:
Variables Discretas: una que puede tomar sus valores de un conjunto de puntos aislados (subconjunto de valores en R)Variables Continuas: una que puede tomar sus valores en un conjunto donde todos sus elementos son puntos de acumulación (un intervalo en R). Siempre es posible tratar una variable continua como discreta mediante la construcción de “intervalos de clase” representando cada uno de los intervalos por su valor medio denominado “marca de clase”Variables Categóricas o CualitativasVariables Cuantitativas
Tanto en la escala intervalar como en la de razón es posible distinguir dos tipos de variables aleatorias:
Variables Discretas: una que puede tomar sus valores de un conjunto de puntos aislados (subconjunto de valores en R)Variables Continuas: una que puede tomar sus valores en un conjunto donde todos sus elementos son puntos de acumulación (un intervalo en R). Siempre es posible tratar una variable continua como discreta mediante la construcción de “intervalos de clase” representando cada uno de los intervalos por su valor medio denominado “marca de clase”Variables Categóricas o CualitativasVariables Cuantitativas
21Profesor:H. Allende
EstimaciónEstimación
Parámetro:Medida para describir alguna característica de los elementos de una Población, tal como Valor Esperado, Moda o Varianza poblacional.Estos guarismos son valores “verdaderos”, pero deconocidos.
Estadística ( Estadígrafo):Medida para describir una característica de la Muestra, tal como Promedio, Varianza o Moda muestral. Estos valores son calculados a partir de la Muestra, pero son valores aproximados de los parámetros que representan
Parámetro:Medida para describir alguna característica de los elementos de una Población, tal como Valor Esperado, Moda o Varianza poblacional.Estos guarismos son valores “verdaderos”, pero deconocidos.
Estadística ( Estadígrafo):Medida para describir una característica de la Muestra, tal como Promedio, Varianza o Moda muestral. Estos valores son calculados a partir de la Muestra, pero son valores aproximados de los parámetros que representan
22Profesor:H. Allende
Muestreo Aleatorio Simple: M.A.S.Muestreo Aleatorio Simple: M.A.S.
Es un método de selección de n unidades sacadas de N, de tal manera que cada una de las muestras C(N,n) tiene la misma probabilidad de ser escogida. En la prática un m.a.s. es sacado unidad por unidad:
Las unidades de la población son numerados del 1 al N. A continuación son seleccionados n números aleatorios entre 1 y N, ya sea de tablas o de una urna como en la lotería
Es un método de selección de n unidades sacadas de N, de tal manera que cada una de las muestras C(N,n) tiene la misma probabilidad de ser escogida. En la prática un m.a.s. es sacado unidad por unidad:
Las unidades de la población son numerados del 1 al N. A continuación son seleccionados n números aleatorios entre 1 y N, ya sea de tablas o de una urna como en la lotería
23Profesor:H. Allende
Muestreo Estratificado AleatorioMuestreo Estratificado Aleatorio
Se emplea cuando la población está agrupada en pocos estratos, cada uno de ellos con muchos individuos. Consiste en sacar un m.a.s. de cada uno de los estratos.Los Estratos, por lo general, son de diferente tamaño; la muestra, por consiguiente, para ser representativa debe contener elementos de cada estrato en forma proporcional a la población. (Esto se llama afijación proporcional, la que no siempre resulta ser la más conveniente por cuanto los costos de muestreo en cada uno de los estratos pueden ser distintos).
Se emplea cuando la población está agrupada en pocos estratos, cada uno de ellos con muchos individuos. Consiste en sacar un m.a.s. de cada uno de los estratos.Los Estratos, por lo general, son de diferente tamaño; la muestra, por consiguiente, para ser representativa debe contener elementos de cada estrato en forma proporcional a la población. (Esto se llama afijación proporcional, la que no siempre resulta ser la más conveniente por cuanto los costos de muestreo en cada uno de los estratos pueden ser distintos).
24Profesor:H. Allende
Muestreo SistemáticoMuestreo Sistemático
Se utiliza cuando las unidades de la población están, de algún modo, totalmente ordenadas. Para seleccionar una muestra se aprovecha la ordenación de las unidades.Para seleccionar una muestra de tamaño n
Dividir la población en “n” subpoblaciones de tamaño K =(N/n) Toma una unidad al azar de la primera subpoblación y
de ahí en adelante cada k-ésima unidad.Si n1 es la unidad seleccionada de la primera población, entonces las siguientes observaciones seránn2 = n1+K, n3 = n2+K, n4 =n2 +2K,.........................
Se utiliza cuando las unidades de la población están, de algún modo, totalmente ordenadas. Para seleccionar una muestra se aprovecha la ordenación de las unidades.Para seleccionar una muestra de tamaño n
Dividir la población en “n” subpoblaciones de tamaño K =(N/n) Toma una unidad al azar de la primera subpoblación y
de ahí en adelante cada k-ésima unidad.Si n1 es la unidad seleccionada de la primera población, entonces las siguientes observaciones seránn2 = n1+K, n3 = n2+K, n4 =n2 +2K,.........................
25Profesor:H. Allende
Muestreo por ConglomeradoMuestreo por Conglomerado
Se emplea cuando la población está dividida en grupos pequeños. Consiste en obtener una m.a.s. de algunos grupos y luego censar cada uno de estos. Hay dos razones para principales para la extensa aplicación de estos planes de muestreo: falta de una lista confiable de elementos en la población y consideraciones del tipo económica.
Se emplea cuando la población está dividida en grupos pequeños. Consiste en obtener una m.a.s. de algunos grupos y luego censar cada uno de estos. Hay dos razones para principales para la extensa aplicación de estos planes de muestreo: falta de una lista confiable de elementos en la población y consideraciones del tipo económica.
26Profesor:H. Allende
Muestreo en dos Etapas (doble)Muestreo en dos Etapas (doble)
La muestra se toma en dos pasos: En el primero se selecciona la muestra de
unidades primarias y En la segunda se selecciona una muestra de
elementos a partir de cada unidad primaria escogida
La muestra se toma en dos pasos: En el primero se selecciona la muestra de
unidades primarias y En la segunda se selecciona una muestra de
elementos a partir de cada unidad primaria escogida
27Profesor:H. Allende
EjemploEjemplo
En cada una de las situaciones planteadas diseñe un plan de muestreo apropiado:
A) Un importador de bombillas eléctricas, por razones de contrato de seguro se interesa en determinar la población de bombillas quebradas en una partida de 50.000 cajas con 144unidades cada una.B) El INE para efectos del cálculo del IPC, se interesa en conocer el gasto mensual en alimentación de las familias de la región metropolitana.
En cada una de las situaciones planteadas diseñe un plan de muestreo apropiado:
A) Un importador de bombillas eléctricas, por razones de contrato de seguro se interesa en determinar la población de bombillas quebradas en una partida de 50.000 cajas con 144unidades cada una.B) El INE para efectos del cálculo del IPC, se interesa en conocer el gasto mensual en alimentación de las familias de la región metropolitana.
28Profesor:H. Allende
EjemploEjemplo
C) Para crear un nueva fundación se recabaron firmas en 45.000 hojas. Cada hoja tenía un espacío suficiente para 30 firmas, pero muchas de las hojas se recabó un número menor de firmas, los promotores de la nueva fundación se interesan por conocer el número total de firmas.D) El SERVIU Metropolitano se interesa en conocer el número total de pobladores, de una gran población de Santiago de 3600 viviendas. Para tal efecto sólo dispone de un archivo ordenado por numeración correlativa de las viviendas del 1 al 3600, de donde es posible obtener el número de personas que habitan en cada vivienda.
C) Para crear un nueva fundación se recabaron firmas en 45.000 hojas. Cada hoja tenía un espacío suficiente para 30 firmas, pero muchas de las hojas se recabó un número menor de firmas, los promotores de la nueva fundación se interesan por conocer el número total de firmas.D) El SERVIU Metropolitano se interesa en conocer el número total de pobladores, de una gran población de Santiago de 3600 viviendas. Para tal efecto sólo dispone de un archivo ordenado por numeración correlativa de las viviendas del 1 al 3600, de donde es posible obtener el número de personas que habitan en cada vivienda.
29Profesor:H. Allende
SoluciónesSoluciónes
A) Muestreo por conglomerado.B) Muestreo estratificado.C) Muestreo aleatorio simple.D) Muestreo sistemático
A) Muestreo por conglomerado.B) Muestreo estratificado.C) Muestreo aleatorio simple.D) Muestreo sistemático
30Profesor:H. Allende
Estáticos Dinámicos
y = µ + u(Primera parte)
y = µ + φ yt-1 + ut(Quinta parte)
Extrapolativos
y = µ + β x + u(Tercera y cuarta
parte)
y = µ + β x +φ yt-1 + ut
(Quinta parte)Explicativos
Recommended