Upload
laura-ochoa
View
22.114
Download
0
Embed Size (px)
Citation preview
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 1
UNIVERSIDAD VERACRUZANA
FACULTAD DE ADMINISTRACIÓN
Estadística Inferencial
TEMA
Planteamiento de Hipótesis en más de dos Poblaciones
EQUIPO: Restaurantes 2
Aguilar Hernández Leticia Avila Ortega Gabriela
Barcelata Beltrán Ana María Domínguez Rivera Laura María
Durán Fabián Luis Selin García Velázquez Anahí
González Cabañas Lizeth Pacheco Betancourt Adriana Nohemi
PROGRAMA EDUCATIVO: Lic. Admón. Turística
Veracruz, Ver., a 10 de mayo del 2010
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 2
PLANTEAMIENTO DE HIPÓTESIS EN MÁS DE DOS POBLACIONES
Algunas veces se consideran problemas en que debemos decidir si las diferencias
observadas entre más de dos medias se pueden atribuir al azar o si existen
diferencias reales entre las medias de las poblaciones de las que se obtuvieron las
muestras.
Y esto se estudia cuando por ejemplo lo que queremos conocer sobre la base de
datos muestrales, si en realidad existe alguna diferencia:
en la efectividad de 3 métodos de enseñanza de una lengua extranjera, o quizás
queremos comparar la producción promedio por caballería de distintas variedades de arroz.
Un investigador agrícola pudiera estar interesado en saber que tipo de fertilizante da mejores rendimientos,
ó sí en determinado laboratorio médico se desea evaluar el efecto de diferentes medicamentos en la presión sanguínea.
El método que utilizamos para este propósito es un instrumento estadístico
poderoso conocido como ANALISIS DE VARIANZA.
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 3
GLOSARIO
CONCEPTO DEFINICION TRADUCCION
ANOVA
análisis de varianza (instrumento estadístico) ANALYSIS OF VARIANCE (statistical tool
HIPOTESIS
ESTADISTICA
es una asunción relativa a una o varias
poblaciones, que puede ser cierta o no
Is an assumption on one or
more populations that may be
true or not.
IDENTIDAD
FUNDAMENTAL
descomposición de la varianza total total variance decomposition
GAUSSIANA
En estadística y probabilidad se llama distribución
normal, distribución de Gauss o distribución
gaussiana, a una de las distribuciones de
probabilidad de variable continua que con más
frecuencia aparece en fenómenos reales
In statistics and probability is
called the normal distribution,
Gaussian distribution or
Gaussian distribution, one of
the probability distributions of
continuous variable that most
often appears in real
phenomena
INSESGADO.
Se denomina sesgo de un estimador a la diferencia entre la esperanza (o valor esperado)
del estimador y el verdadero valor del parámetro a estimar. Es deseable que un estimador sea
insesgado o centrado, es decir, que su sesgo sea nulo por ser su esperanza igual al parámetro que
se desea estimar.
It's called bias of an estimator to the difference between the
expectation (or expected value) of the estimator and
the true value of the parameter to be estimated. It is desirable that an estimator
is unbiased and focused, ie, its bias is zero hope for being
equal to the parameter to be estimated.
GRADOS DE LIBERTAD
es un estimador del número de categorías
independientes en una prueba particular o
experimento estadístico.
Is an estimate of the number of independent categories in a particular test or experiment
statistics.
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 4
1:2
2
0
D
E
SE
SEH
1:2
2
1
D
E
SE
SEH
FORMULARIO
PRUEBA DE HIPÓTESIS PARA MAS DE DOS POBLACIONES F DE FISHER
C a s o
E s t a d í s t it c o
análisis de
varianza
2
122
n
Ni
k
i
i
T
22
T 22
T
Calculo de
hipótesis
estimador
insesgado de 2(varianza dentro
del grupo)
insesgadoestimadorunesSEdondeyykn
SD
ni
j
iijD
22
2
1
2 1
Varianza entre
grupos.
22
2
2
1221
2
2
0
11
E
i
k
i
ii
E
k
i
ii
E
SElaentonces
yquecasoesteenesqueyaciertanulahipótesislabajoinsesgadoserásóloy
desesgadoestimadorunesquelopork
n
SEsudondek
yyn
S
estimadores de
SCT =k
i
k
i
iji
k
i
i
k
i
ni
j
ijnindondeyyTTTdonde
n
Ty
111
2
1 1
2
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 5
las varianzas
poblacionales
conceptuales
SCE = n
T
n
Tk
i i
i
2
1
2
SCD = SCT - SCE
Variabilidad
entre las
varianzas
muestrales
2
1
2ln1ln
i
k
i
iDSnSknM
kn
Sn
S
k
i
ii
D
1
2
2
1
2
12
1i
k
i
iji
in
YY
S
Medias de cada
grupo
615
908
5
404
5
206
5
30
3
3
3
2
2
2
1
1
1n
TY
n
TY
n
TY
n
TY
Calculo de las
varianzas 2
iS
1
2
12
i
k
i
in
YijYi
S
Calculo del
estadístico de
prueba M/C
M = 1 + k
i iknnk 1
1
1
1
13
1
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 6
FUENTE DE
VARIACIÓN
SUMA DE
CUADRADOS
GRADOS DE
LIBERTAD
CUADRADO
MEDIO
ESTADÍSTICO
ENTRE
GRUPO
2
1
K
I
iiyyn k – 1
1n
SCE F0 = 2
2
D
E
S
S
k
i
ni
j
iijyy
1
2
1
n – k kn
SCD
DENTRO DE
GRUPO
TOTAL K
i
ni
j
ijyy
1 1
2
N - 1
INTRODUCCION
Una hipótesis estadística es una asunción relativa a una o varias poblaciones, que
puede ser cierta o no. Las hipótesis estadísticas se pueden contrastar con la
información extraída de las muestras y tanto si se aceptan como si se rechazan se
puede cometer un error.
La hipótesis formulada con intención de rechazarla se llama hipótesis nula y se
representa por H0. Rechazar H0 implica aceptar una hipótesis alternativa (H1).
Fisher realizó muchos avances en la estadística, siendo una de sus más
importantes contribuciones, la inferencia estadística creada por él en 1920.
Student y Ronald Fisher iniciaron una nueva era en el estudio de las distribuciones
muestrales. Ronald Aylmer Fisher encontró en muestras procedentes de una
población normal, la distribución del coeficiente de correlación, los coeficientes de
regresión, los coeficientes de correlación múltiple y de proporción de variables
conocida por el nombre de F.
Esta distribución de probabilidad se usa como estadística prueba en varias situaciones. Se emplea para probar si dos muestras provienen de poblaciones que poseen varianzas iguales. Esta prueba es útil para determinar si una población normal tiene una mayor variación que la otra y también se aplica cuando se trata de comparar simultáneamente varias medias poblacionales. La comparación
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 7
simultánea de varias medias poblacionales se conoce como análisis de varianza (ANOVA). En ambas situaciones, las poblaciones deben ser normales y los datos tener al menos la escala de intervalos. Características de la distribución F
Existe una "familia" de distribuciones F. Un miembro específico de la familia se determina por dos parámetros: los grados de libertad en el numerador y en el denominador . Existe una distribución F para la combinación de 29 grados de libertad en el numerador y 28 grados en el denominador. Existe otra distribución F para 19 grados en el numerador y 6 en el denominador.
La distribución F es una distribución continua.
F no puede ser negativa
La distribución F tiene un sesgo positivo
A medida que aumentan los valores, la curva se aproxima al eje x, pero nunca lo toca
En este trabajo se abordara el tema de F Fisher esperando así cumplir con las
expectativas requeridas.asi también se presentaran de manera simultánea las
formulas utilizadas, las tablas a utilizar, con el fin de hacer más fácil el
entendimiento del tema planteado.
ANÁLISIS DE VARIANZA
El análisis de varianza, como técnica de lo que trata es: si se está estudiando la
característica cuyos valores dependen de varias clases de efectos que operan
simultáneamente, poder decidir si tales efectos son debido al azar o si realmente
son diferentes.
Esta técnica de lo que trata es de expresar una medida de la variación total de un
conjunto de datos como una suma de términos, que se pueden atribuir a fuentes o
causas específicas de variación; pues bien esta descomposición de la varianza
total se denomina: Identidad fundamental. Ella junto a la formación del estadístico
de prueba, se refleja en una tabla llamada “Tabla de Análisis de Varianza”, que
resume los principales aspectos teóricos prácticos de la técnica.
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 8
Hay un corolario que plantea que:
Si “k” poblaciones se unen y las varianzas de las “k” poblaciones son
iguales a 2 se tiene que:
2
122
n
Ni
k
i
i
TPor lo tanto si todas las medias son iguales entonces:
22
T, mientras que si alguna es diferente, se puede concluir que 22
T
De modo que una comparación de varianza puede conducir a una conclusión
sobre la igualdad de medias poblacionales.
El método que se utiliza es a través de los estimadores de 2.
Hay un Teorema que plantea que:
Si dos o más muestras proceden de una misma población o de diferentes
poblaciones, pero con igual varianza, entonces un estimador insesgado de 2
podrá obtenerse a través de la siguiente expresión:
insesgadoestimadorunesSEdondeyykn
SD
ni
j
iijD
22
2
1
2 1
A esta varianza se le da el nombre de Varianza dentro del grupo.
Sería bueno comentar que esta varianza como es insesgada proporciona una
estimación válida de la varianza desconocida de la población sin importarle si se
acepta o rechaza H0.
Hay otro Teorema, bajo las mismas condiciones que el anterior que plantea que
otro estimador de 2 es:
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 9
22
2
2
1221
2
2
0
11
E
i
k
i
ii
E
k
i
ii
E
SElaentonces
yquecasoesteenesqueyaciertanulahipótesislabajoinsesgadoserásóloy
desesgadoestimadorunesquelopork
n
SEsudondek
yyn
S
Este estimador es conocido como varianza entre grupos.
Esta situación que expresan estos estimadores se pudiera representar
gráficamente de la siguiente forma:
Para H0 cierta: Para H0 falsa:
x 1 ________ x 1
x x
x3 x 2 x3
x 2
1 2 3 1 2 3
En este caso las xi no son iguales pero los elementos de las 3 poblaciones si casi
iguales sus valores están cercanos son muy diferentes y originan medias
muestrales muy diferentes.
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 10
Si estamos en caso de H0 falsa, y se nos presenta esta situación se diferencia en
la suma de cuadrado entre grupo esta diferencia, mientras que si estamos en el
caso de H0 cierta la diferencia entre los grupos es mínima.
En el caso de la SC, dentro de los grupos lo que hace es comparar cada elemento
de la muestra con la media de su propio grupo, para una u otra conclusión de la
hipótesis nula, su cálculo no se refleja, el valor es el mismo.
Como ya dijimos, el análisis de varianza consiste en dividir la suma de cuadrado
total en dos fuentes de variación y proceder al análisis de las mismas, estas son la
variación dentro del grupo y la variación entre grupos. Como son variaciones la
vamos a expresar como sumas de cuadrados, es decir:
SCT = SCD + SCE
__ __ __ __
(Yij - Y) = (Yij - Yi) + (Yi – Y)
Representando estas la variación total que es igual a la variación dentro del grupo
más la variación entre grupos, gráficamente se representa de la siguiente forma:
_ .
yij - yi .
. _
_ . yij -y
y1 .
_ _ .
yi - y . _
Y
.
_ .
y2 .
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 11
Si elevamos al cuadrado ambos miembros, y sumamos por “j” e “i”, llegamos a la
Identidad Fundamental, planteada anteriormente.
2
11 1
2
1 1
2k
i
ii
k
i
ni
j
iij
k
i
ni
j
ijyynyyyy donde se considera:
Suma de Suma de Suma de
Cuadrado Cuadrado Cuadrado
Total Dentro del Grupo Entre Grupo
De la misma forma resulta de gran importancia en el Análisis de varianza, la
relación entre los grados de libertad (que ya se habló de ellos en el Tema
anterior).
Si se aplica el valor esperado en ambos miembros se obtienen, bajo el supuesto
de H0 cierto de que, los grados de libertad asociados a estas sumas de cuadrados
serán:
(n – 1) = (n – k) + (k – 1) Esto es,
Para la SCT, = para la SCD y para la SCE
Si dividimos las Sumas de Cuadrados entre los grados de libertad, se obtendrán
los estimadores de 2 planteados, es decir la varianza total 2
TS la varianza dentro
del grupo 2
DS , y la varianza entre grupo 2
ES . También estos cocientes se
denominan Cuadrados Medios.
1
22
k
SCCMS
kn
SCCMS
E
EE
D
DD
Debido a que el cálculo de varianzas entre y dentro de grupos hay varios pasos,
se acostumbra a dar al grupo completo de resultados en una tabla conocida como
tabla de análisis de varianza (ANOVA). Esta tabla incluye las fuentes de variación,
las sumas de los cuadrados(es decir las variaciones), los grados de libertad, las
varianzas(es decir los cuadrados medios) y el valor del estadístico de prueba que
veremos más adelante.
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 12
FUENTE DE
VARIACIÓN
SUMA DE
CUADRADOS
GRADOS DE
LIBERTAD
CUADRADO
MEDIO
ESTADÍSTICO
ENTRE
GRUPO
2
1
K
I
iiyyn k – 1
1n
SCE F0 = 2
2
D
E
S
S
k
i
ni
j
iijyy
1
2
1
n – k kn
SCD
DENTRO DE
GRUPO
TOTAL K
i
ni
j
ijyy
1 1
2
N - 1
Aquí en este caso se utiliza como estadístico de prueba F0, ¿Por qué la
Distribución F? . La distribución a utilizar es la F de Fisher, que se basa en la
razón de 2 varianzas.
Con el fin de determinar si las medias de los diversos grupos son todas iguales, se
pueden examinar dos estimadores diferentes de la varianza de la población. Uno
de los estimadores se basa en la suma de los cuadrados dentro de los grupos
(SCD); el otro se basa en la suma de los cuadrados entre los grupos (SCE). Si la
hipótesis nula es cierta, estos estimadores deben ser aproximadamente iguales; si
es falsa el estimador basado en la suma de los cuadrados entre grupos debe ser
mayor.
El estimado de la varianza entre los grupos no solo toma en cuenta las
fluctuaciones aleatorias de una observación a otra, sino también mide las
diferencias de un grupo con otro. Si no hay diferencia de un grupo a otro, cualquier
diferencia en la media muestral se explicará por la variación aleatoria, y la
varianza entre grupos, debe estar cerca de la varianza dentro de los grupos. Sin
embargo si en realidad hay una diferencia entre los grupos, la varianza entre
grupos será significativamente mayor que la varianza dentro de los grupos.
Por todo lo anterior, la prueba estadística se basa en la razón de estas dos
varianzas: CME/CMD. Si la hipótesis nula es cierta, esta razón debe estar cercana
a uno; si la hipótesis nula es falsa entonces el numerador debe ser mayor que el
denominador y la razón debe ser mayor que uno
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 13
Como se aprecia el problema se reduce a buscar un valor a partir del cuál el
estadístico de prueba resulte significativamente mayor que 1, y así se rechazará la
hipótesis de que no hay diferencias entre las medias de los grupos cuando la
razón entre las varianzas CME/CMD F k – 1;n – k)
De aquí se infiere que las hipótesis nula y alternativa que se plantearán serán las
siguientes:
H0: 1 = 2 = . . . = k
H1: alguna i diferente
Es bueno señalar que estas hipótesis son equivalentes a decir:
1:2
2
0
D
E
SE
SEH 1:
2
2
1
D
E
SE
SEH
Ya que como se vio anteriormente 2
ES es un estimador sesgado de la VARIANZA y
sólo será insesgado si se cumple que H0 es cierta, mientras que 2
DS es un
estimador insesgado.
Además es la razón por la cuál la distribución a utilizar es la F de Fisher, que no es
más que la relación entre 2 varianzas y siempre considerando, la región crítica
hacia la derecha, ya que nuestro problema se reduce a buscar un valor a partir del
cuál es estadístico de prueba resulte significativamente mayor que 1 y así
Rechazaremos H0 a un nivel de significación , si knk
D
EF
S
S ;1
12
2
Antes de continuar queremos plantear que las fórmulas de cálculo de los
estimadores de las varianzas poblacionales conceptuales o por definición son muy
tediosas, sin embargo hay para estos estimadores unas fórmulas de cálculos
abreviadas que son más fáciles.
SCT =k
i
k
i
iji
k
i
i
k
i
ni
j
ijnindondeyyTTTdonde
n
Ty
111
2
1 1
2
SCE = n
T
n
Tk
i i
i
2
1
2
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 14
SCD = k
i i
i
k
i
ni
j
ijn
Ty
1
2
1 1
2
Aunque se debe señalar que dado el carácter aditivo de estas varianzas, se
acostumbra a obtener la SCD por diferencia, es decir como:
SCT = SCE + SCD se obtendría despejando: SCD = SCT - SCE
Para aplicar esta técnica es necesario que se cumplan ciertas suposiciones sobre
los datos investigados.
1.- Las características medibles se distribuyen normalmente en cada población.
Esto es kidondeNYiii
,2,1;2
2.- Las varianzas de las k poblaciones son iguales: 22
2
2
1 k
3.- Las características medibles son estadísticamente independientes, de una
población a otra: Y1, Y2, ... , Yk.
4.- Las muestras n1, n2, ... ,nk de los k grupos poblacionales deben seleccionarse a
través del M.A.S.
Vamos a ver un Ejemplo:
Los datos siguientes corresponden al Costo de Producción de un producto
fabricado bajo tecnologías diferentes. Realice una prueba estadística a un = 0.05
para decidir si existen diferencias entre las tecnologías, que puedan afectar los
Costos.
Tecnología Yi j ni Ti Ti2 Ti
2/ni Y2i j
A 7 4 6 4 9 5 30 900 180 49 16 36 16 81 198
B 2 4 5 6 3 5 20 400 80 4 16 25 36 9 90
C 7 8 7 11 7 5 40 1600 320 49 64 49 121 49 332
15 90 580 620
Hay que tener en cuenta que el subíndice i, representa las filas, y el j las
columnas.
Se prepara la tabla atendiendo a lo que se necesita a partir de las formulas
abreviadas planteadas, únicamente hay que tener en cuenta que los niveles se
deben planteara en el sentido de fila.
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 15
Resumiendo: n = 15; T = 90; k = 3; n1 = n2 = n3 = 5
Luego:
n
TYSC
k
i
ni
j
ijT
2
1 1
2 = 620 – 902/15 = 620 – 8100/15 = 620 – 540 = 80
SCE = n
T
n
Tk
i i
i
2
1
2
= 580 – 540 = 40
SCD = k
i i
i
k
i
ni
j
ijn
Ty
1
2
1 1
2 = 620 – 580 = 40 o también utilizando la identidad
fundamental y en ella se despeja SCD, esto es:
SCT = SCD + SCE SCD = SCT – SCE = 80 – 40 = 40
Y ya estamos en condiciones de plantear la tabla de análisis de varianza, para el
cálculo del estadístico de Prueba.
ANOVA
Fuente de
Variación
Suma de
Cuadrado
Grados de
Libertad
Cuadrado
medio
Estadístico de
Prueba
Entre grupo
Dentro grupo
40
40
2
12
20
3.33
06.63.3
200
F
Total 80 14
H0: 321
H1: alguna i diferente
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 16
= 0.05
2
2
D
E
S
S = 6.06
W: 2
2
D
E
S
S F1-
(k – 1; n – k) = 2
2
D
E
S
S Fo.95
(2, 12) = 2
2
D
E
S
S 3.89
RR
3.89
R:D:/ Rechazo H0 F0 3.89
No Rechazo H0 F0 3.89
D/ F0 = 6.06 3.89 Rechazo H0 que aceptamos H1 lo que nos indica que
existen diferencias significativas entre los costos de producción para por lo menos
una tecnología a un = 0.05
Si quisiéramos saber cual o cuales tecnologías son diferentes se pudiera
completar el análisis con una prueba T’Student de diferencia de media, probando
dos a dos dichas tecnologías.
Esta prueba de la homogeneidad de las varianzas fue desarrollada por Barttlet, y
se basa en el cálculo de un cociente, el cuál se denota por M/C.
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 17
se utiliza para comprobar uno de los supuestos del análisis de varianza, si se
quiere, el más importante, que es el de varianza constante(conocido por
Homocedasticidad)
Así las hipótesis a plantear serían:
H0: 22
2
2
1 k
H1: alguna 2
i diferente
Y el estadístico de prueba será el cociente M/C que es un estadístico que mide la
variabilidad entre las varianzas muestrales ya que:
2
1
2ln1ln
i
k
i
iDSnSknM Donde
kn
Sn
S
k
i
ii
D
1
2
2
1
y
2
12
1i
k
i
iji
in
YY
S
Se puede observar que si las 2
iS difieren poco entre sí el valor de M, será pequeño
y si suponemos que la 2
iS son iguales, entonces M tomará el valor cero.
Demostración:
2
1
2ln1ln
i
k
i
iDSnSknM si 2
iS son iguales, entonces se trata como una
constante y se saca fuera de la sumatoria.
k
i
ii
k
i
ii
nSkn
nS
knM
1
21
2
1ln
1
ln
Como knn
k
i
i
01
1
M=(n – k) knSkn
knSi
i 2
2
lnln
M= (n- k) ln 2
iS - (ln 2
iS ) n- k
M = 0
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 18
Veamos el cálculo del estadístico de Prueba: M/C
M = 1 + k
i iknnk 1
1
1
1
13
1
Barttlet demostró que el estadístico M sigue aproximadamente una distribución 2,
con k-1 grados de libertad para (ni – 1) 4, y se divide entre una cantidad C, como
la planteada anteriormente; el cociente mejora la aproximación, y es más preciso
que si utilizáramos solamente M.
La expresión de M, puede transformarse para trabajar con logaritmos comunes.
M = 2.3026 2
10
1
2
10log1log
i
k
i
iDSnSkn se debe aclarar que se puede
aplicar tanto logaritmo comunes como naturales.
La región crítica estará dada por: 12
1/:
kCMW que gráficamente quedará representada de la siguiente
forma:
R no R. RR
)1(2
1
k
A continuación vamos a comprobar este supuesto de varianza constantes o
iguales en el ejemplo que se desarrollo en la conferencia anterior.
Comencemos calculando las varianzas: 2
iS , para ello es necesario primeramente
hallar las medias de cada grupo:
615
908
5
404
5
206
5
30
3
3
3
2
2
2
1
1
1n
TY
n
TY
n
TY
n
TY
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 19
Ya que 1
2
12
i
k
i
in
YijYi
S
5.44
18
4
94041
4
)69()64()66()64()67(22222
2
1S
5.24
10
4
14104
4
)43()46()45()44()42(22222
2
2S
34
12
4
19101
4
)87()811()87()88()87(22222
2
3S
33.312
)10(4
12
)35.25.4(4)1(
1
2
2
kn
Sni
S
k
i
i
D
Ya estamos en condiciones de plantear los elementos que hacen falta para
determinar M
Población ni 2
iS ln 2
iS (ni – 1) ln 2
iS
1 5 4.5 1.50408 6.01632
2 5 2.5 0.91629 3.66516
3 5 3 1.09861 4.39444
14.07592
ln 2
DS = ln 3.33 = 1.20297
M = (n – k) ln 2
DS -
k
i
iSni
1
2ln)1(
M = 12(1.20297) – 14.07592
= 14.43564 – 14.07592
= 0.35972
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 20
C=
11.172
81
2
1
4
3
6
11
2
1
4
1
4
1
4
1
6
11
1
1
1
13
11
1 1
k
i knnk
M/C = 0.35972/1.11 = 0.323
Ya estamos en condiciones de plantear la prueba, ya que calculamos el
estadístico de prueba.
H0: 2
3
2
2
2
1
H1: alguna 2
i diferente
= 0.05
M/C 2(1- )
k-1
W: M/C 2(1- )
k-1 = M/C 5.99
R:D:/ Rechazo H0 M/C 5.99
No Rechazo H0 M/C 5.99
D/ . M/C = 0.323 5.99 No Rechazo H0 : 2
3
2
2
2
1 a un = 0.05
UTILIDAD
Esta distribución de probabilidad se usa en estadística como prueba en varias
situaciones. Se emplea para probar si dos muestras provienen de poblaciones que
poseen varianzas iguales. Esta prueba es útil para determinar si una población
normal tiene una mayor variación que la otra y también se aplica cuando se trata
de comparar simultáneamente varias medias poblacionales. La comparación
simultánea de varias medias poblacionales se conoce como análisis de varianza
(ANOVA). En ambas situaciones, las poblaciones deben ser normales y los datos
tener al menos la escala de intervalos.
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 21
TABLA DE DISTRIBUCIÓN F DE FISHER CON PROBABILIDAD DE 0.05
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 50
1 161.45 199.50 215.71 224.58 230.16 233.99 236.77 238.88 240.54 241.88 243.90 245.95 248.02 249.05 250.10 251.14 251.77
2 18.513 19.000 19.164 19.247 19.296 19.329 19.353 19.371 19.385 19.396 19.412 19.429 19.446 19.454 19.463 19.471 19.476
3 10.128 9.552 9.277 9.117 9.013 8.941 8.887 8.845 8.812 8.785 8.745 8.703 8.660 8.638 8.617 8.594 8.581
4 7.709 6.944 6.591 6.388 6.256 6.163 6.094 6.041 5.999 5.964 5.912 5.858 5.803 5.774 5.746 5.717 5.699
5 6.608 5.786 5.409 5.192 5.050 4.950 4.876 4.818 4.772 4.735 4.678 4.619 4.558 4.527 4.496 4.464 4.444
6 5.987 5.143 4.757 4.534 4.387 4.284 4.207 4.147 4.099 4.060 4.000 3.938 3.874 3.841 3.808 3.774 3.754
7 5.591 4.737 4.347 4.120 3.972 3.866 3.787 3.726 3.677 3.637 3.575 3.511 3.445 3.410 3.376 3.340 3.319
8 5.318 4.459 4.066 3.838 3.688 3.581 3.500 3.438 3.388 3.347 3.284 3.218 3.150 3.115 3.079 3.043 3.020
9 5.117 4.256 3.863 3.633 3.482 3.374 3.293 3.230 3.179 3.137 3.073 3.006 2.936 2.900 2.864 2.826 2.803
10 4.965 4.103 3.708 3.478 3.326 3.217 3.135 3.072 3.020 2.978 2.913 2.845 2.774 2.737 2.700 2.661 2.637
11 4.844 3.982 3.587 3.357 3.204 3.095 3.012 2.948 2.896 2.854 2.788 2.719 2.646 2.609 2.570 2.531 2.507
12 4.747 3.885 3.490 3.259 3.106 2.996 2.913 2.849 2.796 2.753 2.687 2.617 2.544 2.505 2.466 2.426 2.401
13 4.667 3.806 3.411 3.179 3.025 2.915 2.832 2.767 2.714 2.671 2.604 2.533 2.459 2.420 2.380 2.339 2.314
14 4.600 3.739 3.344 3.112 2.958 2.848 2.764 2.699 2.646 2.602 2.534 2.463 2.388 2.349 2.308 2.266 2.241
15 4.543 3.682 3.287 3.056 2.901 2.790 2.707 2.641 2.588 2.544 2.475 2.403 2.328 2.288 2.247 2.204 2.178
16 4.494 3.634 3.239 3.007 2.852 2.741 2.657 2.591 2.538 2.494 2.425 2.352 2.276 2.235 2.194 2.151 2.124
17 4.451 3.592 3.197 2.965 2.810 2.699 2.614 2.548 2.494 2.450 2.381 2.308 2.230 2.190 2.148 2.104 2.077
18 4.414 3.555 3.160 2.928 2.773 2.661 2.577 2.510 2.456 2.412 2.342 2.269 2.191 2.150 2.107 2.063 2.035
19 4.381 3.522 3.127 2.895 2.740 2.628 2.544 2.477 2.423 2.378 2.308 2.234 2.155 2.114 2.071 2.026 1.999
20 4.351 3.493 3.098 2.866 2.711 2.599 2.514 2.447 2.393 2.348 2.278 2.203 2.124 2.082 2.039 1.994 1.966
21 4.325 3.467 3.072 2.840 2.685 2.573 2.488 2.420 2.366 2.321 2.250 2.176 2.096 2.054 2.010 1.965 1.936
22 4.301 3.443 3.049 2.817 2.661 2.549 2.464 2.397 2.342 2.297 2.226 2.151 2.071 2.028 1.984 1.938 1.909
23 4.279 3.422 3.028 2.796 2.640 2.528 2.442 2.375 2.320 2.275 2.204 2.128 2.048 2.005 1.961 1.914 1.885
24 4.260 3.403 3.009 2.776 2.621 2.508 2.423 2.355 2.300 2.255 2.183 2.108 2.027 1.984 1.939 1.892 1.863
25 4.242 3.385 2.991 2.759 2.603 2.490 2.405 2.337 2.282 2.236 2.165 2.089 2.007 1.964 1.919 1.872 1.842
26 4.225 3.369 2.975 2.743 2.587 2.474 2.388 2.321 2.265 2.220 2.148 2.072 1.990 1.946 1.901 1.853 1.823
27 4.210 3.354 2.960 2.728 2.572 2.459 2.373 2.305 2.250 2.204 2.132 2.056 1.974 1.930 1.884 1.836 1.806
28 4.196 3.340 2.947 2.714 2.558 2.445 2.359 2.291 2.236 2.190 2.118 2.041 1.959 1.915 1.869 1.820 1.790
29 4.183 3.328 2.934 2.701 2.545 2.432 2.346 2.278 2.223 2.177 2.104 2.027 1.945 1.901 1.854 1.806 1.775
30 4.171 3.316 2.922 2.690 2.534 2.421 2.334 2.266 2.211 2.165 2.092 2.015 1.932 1.887 1.841 1.792 1.761
35 4.121 3.267 2.874 2.641 2.485 2.372 2.285 2.217 2.161 2.114 2.041 1.963 1.878 1.833 1.786 1.735 1.703
40 4.085 3.232 2.839 2.606 2.449 2.336 2.249 2.180 2.124 2.077 2.003 1.924 1.839 1.793 1.744 1.693 1.660
45 4.057 3.204 2.812 2.579 2.422 2.308 2.221 2.152 2.096 2.049 1.974 1.895 1.808 1.762 1.713 1.660 1.626
50 4.034 3.183 2.790 2.557 2.400 2.286 2.199 2.130 2.073 2.026 1.952 1.871 1.784 1.737 1.687 1.634 1.599
60 4.001 3.150 2.758 2.525 2.368 2.254 2.167 2.097 2.040 1.993 1.917 1.836 1.748 1.700 1.649 1.594 1.559
70 3.978 3.128 2.736 2.503 2.346 2.231 2.143 2.074 2.017 1.969 1.893 1.812 1.722 1.674 1.622 1.566 1.530
80 3.960 3.111 2.719 2.486 2.329 2.214 2.126 2.056 1.999 1.951 1.875 1.793 1.703 1.654 1.602 1.545 1.508
90 3.947 3.098 2.706 2.473 2.316 2.201 2.113 2.043 1.986 1.938 1.861 1.779 1.688 1.639 1.586 1.528 1.491
100 3.936 3.087 2.696 2.463 2.305 2.191 2.103 2.032 1.975 1.927 1.850 1.768 1.676 1.627 1.573 1.515 1.477
120 3.920 3.072 2.680 2.447 2.290 2.175 2.087 2.016 1.959 1.910 1.834 1.750 1.659 1.608 1.554 1.495 1.457
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 22
Ejemplos :
1. Encontrar el valor de F, en cada uno de los siguientes casos:
a. El área a la derecha de F, es de 0.25 con =4 y =9.
b. El área a la izquierda de F, es de 0.95 con =15 y =10.
c. El área a la derecha de F es de 0.95 con con =6 y =8.
El área a la izquierda de F, es de 0.10 con con =24 y
=24
Solución:
a. Como el área que da la tabla es de cero a Fisher, se tiene que localizar primero los grados de libertad dos que son 9, luego un área de 0.75 con 4 grados de libertad uno.
b. En este caso se puede buscar el área de 0.95 directamente en la tabla con sus respectivos grados de libertad.
c. Se tiene que buscar en la tabla un área de 0.05, puesto que nos piden un área a la derecha de F de 0.95.
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 23
d. Se busca directamente el área de 0.10, con sus respectivos grados de libertad.
2. Si s12 y s2
2 son las varianzas muestrales de muestras aleatorias independientes de tamaños n1=10 y n2 =20, tomadas de poblaciones
normales que tienen las mismas varianzas, encuentre P(s12/s2
2 2.42).
Solución:
Primero se establecen los grados de libertad. Como en el numerador está la población uno y en el denominador la población dos, entonces los grados de libertad uno equivalen a 10-1=9 y los grados de libertad dos a 20-1=19.
Se procede a ir a la tabla a buscar los grados de libertad dos que son 19 y se observa que no están, por lo tanto se tiene que interpolar entre 15 y 20 grados de libertad, buscando el valor de fisher que quedaría:
Este valor de 2.42 se busca en la columna de 9 grados de libertad uno, con 15 grados de libertad dos, y se encuentra los siguiente:
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 24
Area
0.90 2.09
0.95 2.59
Al interpolar entre estos dos valores nos queda un área de 0.933.
Se procede a hacer lo mismo pero con 20 grados de libertad dos:
Area
0.95 2.39
0.975 2.84
Al interpolar entre estos dos valores nos queda un área de 0.9516.
Ahora ya se tienen las dos áreas referentes a los grados de libertad dos, por lo que se interpolará para ver cuánto le corresponde a los grados libertad dos con un valor de 19.
Area
15 0.933
20 0.9516
Al interpolar nos queda que para 9 grados de libertad uno y 19 grados de libertad dos con un valor de Fisher de 2.42 el área a la izquierda es de 0.9478.
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 25
3. Si s12 y s2
2 representan las varianzas de las muestras aleatorias independientes de tamaño n1= 25 y n2 = 31, tomadas de poblaciones
normales con varianzas 12 =10 y
22 = 15, respectivamente, encuentre P(s1
2/s22 > 1.26).
Solución:
Calcular el valor de Fisher:
Luego se va a la tabla de Fisher a buscar 30 grados de libertad 2 con 24 grados de libertad uno. Cuando se este en esta posición se busca adentro de la tabla el valor de Fisher de 1.89. Al localizarlo y ver a la izquierda de este valor se obtiene un área de 0.95, pero esta área correspondería a la probabilidad de que las relaciones de varianzas muestrales fueran menor a 1.26, por lo que se calcula su complemento que sería 0.05, siendo esta la probabilidad de que s1
2/s22 > 1.26.
Intervalo de Confianza para el Cociente de Varianzas de Dos Distribuciones Normales
Supóngase que se tienen dos poblaciones normales e independientes con
varianzas desconocidas 2 y 22, respectivamente. De este par de
poblaciones, se tienen disponibles dos muestras aleatorias de tamaños n1 y n2, respectivamente, sean s1
2 y s22 las dos varianzas muestrales. Se desea conocer
un intervalo de confianza del 100( ) por ciento para el cociente de las dos
varianzas, 12/ 2
2.
Para construir el intervalo de confianza para el cociente de dos varianzas poblacionales, se coloca la varianza muestral mayor en el numerador del estadístico F.
Ejemplos:
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 26
4. Un fabricante de automóviles pone a prueba dos nuevos métodos de ensamblaje de motores respecto al tiempo en minutos. Los resultados se muestran en la tabla:
Método 1 Método 2
n1 = 31 n2 = 25
s12 = 50 s2
2 = 24
Construya un intervalo de confianza del 90% para 12/ 2
2.
Solución:
Por la recomendación de que la varianza muestral mayor va en el numerador se tiene la siguiente fórmula:
al despejar: .
F toma dos valores dependiendo del nivel de confianza y de los grados de libertad. En este caso los grados de libertad uno valen 30 y los grados de libertad dos 24.
y
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 27
Estos resultados los podemos interpretar de la siguiente manera:
Con un nivel de confianza del 90% se sabe que la relación de varianzas
12/ 2
2 esta entre 1.07 y 3.93. Esto supondría que la varianza de la población 1 es mayor a la varianza de la población 2 entre 1.07 y 3.93.
5. Una compañía fabrica propulsores para uso en motores de turbina. Al ingeniero de manufactura le gustaría seleccionar el proceso que tenga la menor variabilidad en la rugosidad de la superficie. Para ello toma una muestra de n1=16 partes del primer proceso, la cual tiene una desviación estándar s1 = 4.7 micropulgadas, y una muestra aleatoria de n2=12 partes del segundo proceso, la cual tiene una desviación estándar s2 = 5.1 micropulgadas. Se desea encontrar un intervalo de confianza del 90% para
el cociente de las dos varianzas 12/ 2
2. Suponga que los dos procesos
son independientes y que la rugosidad de la superficie está distribuida de manera normal.
Solución:
Por la recomendación de que la varianza muestral mayor va en el numerador se tiene la siguiente fórmula:
al despejar: .
En este caso los grados de libertad uno valen 11 y los grados de libertad dos 15.
y
Estos resultados los podemos interpretar de la siguiente manera:
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 28
Puesto que este intervalo de confianza incluye a la unidad, no es posible afirmar que las
desviaciones estándar de la rugosidad de la superficie de los dos procesos sean diferentes con un nivel de confianza del 90%.
PROBLEMAS PROPUESTOS DE LA DISTRIBUCIÓN F
1. Si tomamos dos muestras independientes de tamaño n1=6 y n2= 10 de dos poblaciones
normales con la misma varianza poblacional, encuentre un número b tal que:
P (
2. Si S²1 y S²2 son las varianzas de muestras aleatorias independientes de tamaño n1= 61
y n2=31 de poblaciones normales con 21 = 12 y
22 = 18, determine la
probabilidad
P ( )
3. Obtenga o calcule las siguientes cantidades.
a) F.05, 5,8 b) F.05, 8, 5 c) F.95, 8, 5
4. P (F 6.16) para 1 = 6, 2 = 4
5. P ( 1.77 F 4.74 ) para 1 = 10, 2 = 5
6. Si S²1 y S²2 son las varianzas de muestras aleatorias independientes de tamaño n1= 25
y n2=25 de poblaciones normales con 2
1 = 2
2 , determine la probabilidad
P ( )
7. Si S²1 y S²2 son las varianzas de muestras aleatorias independientes de tamaño n1= 8
y n2=12 de poblaciones normales con 2
1 = 2
2 , determine la probabilidad
P ( )
8. Si S²1 y S²2 son las varianzas de muestras aleatorias independientes de tamaño n1= 25
y n2=31 de poblaciones normales con 2
1 = 10 y 2
2 = 31 , determine la probabilidad
95.0)2
2
2
1b
S
S
16.12
2
2
1
S
S
0.12
2
2
1
S
S
89.42
2
2
1
S
S
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 29
P ( )
9. Si S²1 y S²2 son las varianzas de muestras aleatorias independientes de tamaño n1= 8 y
n2=5 de poblaciones normales con 2
1 = 2
2 , determine la probabilidad
P ( )
10. En una prueba sobre efectividad de dos tipos distintos de píldoras para dormir, A y B,
se utilizarán dos grupos independientes de personas con insomnio. A un grupo de
tamaño 40 se le administrará la píldora A y al otro grupo, de tamaño 60, se le
administrará la B, registrándose el número de horas de sueño de cada individuo
participante en el estudio. Si se supone que el número de horas de sueño de quienes
usan cada tipo de píldora se distribuye normalmente con 2
1 = 2
2. Determine la probabilidad
P ( )
11. Lisa Monnin es directora de presupuesto en la empresa New Process Company, desea
comparar los gastos diarios de transporte del equipo de ventas y del personal de
cobranza. Recopiló la siguiente información muestral ( importe en dólares).
Ventas ($) 131 135 146 165 136 142
Cobranza ($) 130 102 129 143 149 120 139
Al nivel de significancia de 0,10, puede concluirse que los gastos medios diarios del equipo
de ventas son mayores? cuál es el valor p?
26.12
2
2
1
S
S
82.42
2
2
1
S
S
93.12
2
2
1
S
S
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 30
12. De una población se toma una muestra de 40 observaciones. La media muestral es de
102 y la desviación estándar 5. De otra población se toma una muestra de 50
observaciones. La media mustral es ahora 99 y la desviación estándar es 6. Realice la
siguiente prueba de hipótesis usando como nivel de significancia 0,04.
Ho: u1 = u2
Ho: u1 ≠ u2
a) Es esta una prueba de una o de dos colas?
b ) Establezca la regla de decisión
c) Calcule el valor del estadístico de prueba
d) Cuál es su decisión respecto a la hipótesis nula?
e) Cuál es el valor p?
13. Una empresa que se dedica a hacer en cuestas se queja de que un agente realiza en
promedio 53 encuestas por semana. Se ha introducido una forma más moderna de
realizar las encuetas y la empresa quiere evaluar su efectividad. Los números de
encuestas realizadas en una semana por una muestra aleatoria de agentes son:
53 57 50 55 58 54 60 52 59 62 60 60 51 59
56
En el nivel de significancia 0,05, puede concluirse que la cantidad media de entrevistas
realizadas por los agentes es superior a 53 por semana? Evalúe el valor p.
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher
Mtra. A Elsa Retureta Álvarez Página 31
FUENTE
http://www.itch.edu.mx/academic/industrial/estadistica1/cap03c.html
http://es.wikipedia.org/wiki/Prueba_F_de_Fisher
http://www.itchihuahuaii.edu.mx/academico/CB/MEG/documentos/1.9.htm
http://dcb.fi-c.unam.mx/profesores/irene/Notas/tablas/Fisher.pdf
http://www.fec.uh.cu/estadisticam2/guia/Tema%20II%20PlanCEMII.doc