Upload
deicycumbal
View
1.025
Download
2
Embed Size (px)
DESCRIPTION
prueba de hipotesis
Citation preview
UNIVERSIDAD POLITÉCNICA ESTATAL DEL CARCHI
ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN
COMERCIAL INTERNACIONAL
ESTADÍSTICA INFERENCIAL
TEMA:
PRUEBA DE HIPÓTESIS
ESTUDIANTE:
DEICY CUMBAL
NIVEL: SEXTO “A”
PROBLEMA
¿Cómo incide el desconocimiento de la prueba de hipótesis al momento de
realizar ejercicios relacionados al comercio exterior?
OBJETIVO GENERAL:
Desarrollar los ejercicios aplicando correctamente la prueba de hipótesis
aplicada al comercio exterior.
OBJETIVOS ESPECÍFICOS:
Comprender correctamente la prueba de hipótesis
Aplicar correctamente la prueba de hipótesis a los ejercicios de
reforzamiento.
Resolver correctamente los ejercicios de prueba de hipótesis
Justificación.
El presente trabajo es de gran importancia ya que a través de esta
investigación se puede identificar los diferentes problemas que están tanto
relacionados con el contexto y la vida diaria , en lo que se refiere a proyectos
empresariales y ver la factibilidad de dichos procedimientos.
En lo cual se presentara una información la cual permitirá verificar la muestra y
como los parámetros influyen en la toma de decisiones en los problemas del
contexto del comercio exterior
La prueba de hipótesis es muy importante para los estudiantes del comercio
exterior ya que esto es un pasó para la formulación de la tesis en la cual se
verificara si es factible o no el proyecto planteado
Pero como toda hipótesis también es importante para la vida en la aplicación
de diferentes casos de la vida en la cual se tenga que tomar decisiones
MARCO TEÓRICO.
PRUEBA DE HIPÓTESIS
La estadística Inferencial, es el proceso por el cual se deducen (infieren)
propiedades o características de una población a partir de una muestra
significativa. Uno de los aspectos principales de la inferencia es la estimación
de parámetros estadísticos. Por ejemplo, para averiguar la media, µ, de las
estaturas de todos los soldados de un remplazo, se extrae una muestra y se
obtiene su media, 0. La media de la muestra (media maestral), 0, es un
estimador de la media poblacional, µ. Si el proceso de muestreo está bien
realizado (es decir, la muestra tiene el tamaño adecuado y ha sido
seleccionada aleatoriamente), entonces el valor de µ, desconocido, puede ser
inferido a partir de 0.(Katherine, 2008)
La estadística inferencial es el proceso de usar la información de una muestra
para describir el estado de una población. Sin embargo es frecuente que
usemos la información de una muestra para probar un reclamo o conjetura
sobre la población. El reclamo o conjetura se refiere a una hipótesis. El
proceso que corrobora si la información de una muestra sostiene o refuta el
reclamo se llama prueba de hipótesis (Tenorio Bahena, Jorge, 2006).
Los términos prueba de hipótesis y probar una hipótesis s utilizan
indistintamente. La prueba de hipótesis comienza como una afirmación, o
suposición sobre un parámetro de la población, como la media poblacional
(Tamayo y Tamayo, Mario, 2010).
Una prueba de hipótesis consiste en contratar dos hipótesis estadísticas. Tal
contraste involucra la toma de decisión acerca de las hipótesis. La decisión
consiste en rechazar o no una hipótesis a favor de otra. (Lincoln L., 2008)
Hipótesis Nula (Ho).- Se refiere siempre a un valor específico del parámetro
de la población, no a una estadística de muestra. La letra H significa hipótesis y
el subíndice cero no hay diferencia por lo general hay un “no” en la hipótesis
nula que indica que “no hay cambio” podemos rechazar o aceptar “Ho”. (Pick,
Susan y López, Ana Luisa., 2009).
Hipótesis Alternativa (Ha).- Es cualquier hipótesis que sea diferente de la
nula es una afirmación que se acepta si los datos muéstrales proporcionan
evidencia suficiente de que la hipótesis nula es falsa, se le conoce también
como hipótesis de investigación el planteamiento de hipótesis alternativa nunca
contiene un signo de igualdad con respecto al valor especificado del parámetro
(Pick, Susan y López, Ana Luisa., 2009).
Nivel de Significancia: Probabilidad de rechazar la hipótesis nula cuando es
verdadera. Se le denota mediante la letra griega α, también es denominada
como nivel de riesgo, este término es más adecuado ya que se corre el riesgo
de rechazar la hipótesis nula, cuando en realidad es verdadera. Este nivel esta
bajo el control de la persona que realiza la prueba (Lincoln L., 2008).
Si suponemos que la hipótesis planteada es verdadera, entonces, el nivel de
significación indicará la probabilidad de no aceptarla, es decir, estén fuera de
área de aceptación. El nivel de confianza (1-α), indica la probabilidad de
aceptar la hipótesis planteada, cuando es verdadera en la población.
La distribución de muestreo de la estadística de prueba se divide en dos
regiones, una región de rechazo (conocida como región crítica) y una región de
no rechazo (aceptación). Si la estadística de prueba cae dentro de la región de
aceptación, no se puede rechazar la hipótesis nula.
La región de rechazo puede considerarse como el conjunto de valores de la
estadística de prueba que no tienen posibilidad de presentarse si la hipótesis
nula es verdadera. Por otro lado, estos valores no son tan improbables de
presentarse si la hipótesis nula es falsa. El valor crítico separa la región de no
rechazo de la de rechazo.
Tipos de errores.- Cualquiera sea la decisión tomada a partir de una prueba
de hipótesis, ya sea de aceptación de la Ho o de la Ha, puede incurrirse en
error:
Un error tipo I se presenta si la hipótesis nula Ho es rechazada cuando es
verdadera y debía ser aceptada. La probabilidad de cometer un error tipo I se
denomina con la letra alfa α
Un error tipo II, se denota con la letra griega β se presenta si la hipótesis nula
es aceptada cuando de hecho es falsa y debía ser rechazada.
En cualquiera de los dos casos se comete un error al tomar una decisión
equivocada.
En la siguiente tabla se muestran las decisiones que pueden tomar el
investigador y las consecuencias posibles.
Para que cualquier ensayo de hipótesis sea bueno, debe diseñarse de forma
que minimice los errores de decisión. En la práctica un tipo de error puede
tener más importancia que el otro, y así se tiene a conseguir poner una
limitación al error de mayor importancia. La única forma de reducir ambos tipos
de errores es incrementar el tamaño de la muestra, lo cual puede ser o no ser
posible.
La probabilidad de cometer un error de tipo II denotada con la letra griega beta
β, depende de la diferencia entre los valores supuesto y real del parámetro de
la población. Como es más fácil encontrar diferencias grandes, si la diferencia
entre la estadística de muestra y el correspondiente parámetro de población es
grande, la probabilidad de cometer un error de tipo II, probablemente sea
pequeña.
El estudio y las conclusiones que obtengamos para una población cualquiera,
se habrán apoyado exclusivamente en el análisis de una parte de ésta. De la
probabilidad con la que estemos dispuestos a asumir estos errores, dependerá,
por ejemplo, el tamaño de la muestra requerida. Las contrastaciones se apoyan
en que los datos de partida siguen una distribución normal
Existe una relación inversa entre la magnitud de los errores α y β: conforme a
aumenta, β disminuye. Esto obliga a establecer con cuidado el valor de a para
las pruebas estadísticas. Lo ideal sería establecer α y β.En la práctica se
establece el nivel α y para disminuir el Error β se incrementa el número de
observaciones en la muestra, pues así se acortan los limites de confianza
respecto a la hipótesis planteada. La de las pruebas estadísticas es rechazar la
hipótesis planteada. En otras palabras, es deseable aumentar cuando ésta es
verdadera, o sea, incrementar lo que se llama poder de la prueba (1- β) La
aceptación de la hipótesis planteada debe interpretarse como que la
información aleatoria de la muestra disponible no permite detectar la falsedad
de esta hipótesis.
ABSTRAC
HYPOTHESIS TESTING
Inferential statistics is the process by which it is deduced (inferred) properties or
characteristics of a population from a representative sample. One of the main
aspects of the inference is the estimation of statistical parameters. For example,
to find the mean, μ, of the heights of all the soldiers of a replacement, to take a
sample and obtain its mean, 0. The sample mean (mean mistral), 0, is an
estimator of the population mean, μ. If the sampling process is well done (ie, the
sample is sized and has been selected randomly), then the value of μ,
unknown, may be inferred from 0. (Katherine, 2008)
Inferential statistics is the process of using information from a sample to
describe the status of a population. However, it is often use information from a
sample to prove a claim or conjecture on the population. The claim or
conjecture refers to a hypothesis. The process that confirms whether the
information from a sample stands or refute the claim is called hypothesis testing
(Tenorio Bahena, Jorge, 2006).
The terms of hypothesis testing and test a hypothesis s used interchangeably.
Hypothesis testing begins as a statement or assumption about a population
parameter, as the population mean (Tamayo and Tamayo, Mario, 2010).
A hypothesis test is to hire two statistical hypotheses. This contrast involves
making decisions about the hypothesis. The decision is to reject or not a
hypothesis in favor of another. (Lincoln L., 2008)
CONTENIDO
Ejercicios.
El banco de préstamos estudia la relación entre ingreso (X) y de ahorros (Y) mensuales Una muestra aleatoria de sus clientes reveló los siguientes datos en dólares:
X 350 400 450 500 950 850 700 900 600Y 100 110 130 160 350 350 250 320 130
Determinar la ecuación lineal de las dos variables, Trace el diagrama de
dispersión en el plano cartesiano, Estime el ingreso que corresponde a un
ahorro semanal de 90 dólares, Si el ahorro es de 200 dólares que gasto puede
realizar el obrero en dicha semana, Si el ingreso es de 350 dólares cual es el
salario.
Desarrollo
Como primer paso empezamos realizando la tabla de las dos variables
Ingresos AhorrosN X Y X Y X2 Y2 (xi-x)2 (yi-y)2
1 350 100 35000 122500 10000 80275,89 12345,432 400 110 44000 160000 12100 54442,89 10223,233 450 130 58500 202500 16900 33609,89 6578,834 500 160 80000 250000 25600 17776,89 2612,235 950 350 332500 902500 122500 100279,89 19290,436 850 350 297500 722500 122500 46945,89 19290,437 700 250 175000 490000 62500 4444,89 1512,43
8 900 320 288000 810000 102400 71112,89 11857,039 600 130 78000 360000 16900 1110,89 6578,83∑ 5700 1900 1388500 4020000 491400 410000 90288,89
X=∑ x1n
=57009
=633.33
Y=∑ y1n
=19009
=211.11
r=n∑ xy−∑ x∑ y
√¿¿¿
r=9 (1388500 )−(5700)(1900)
√¿¿¿
r= 1666500
√3690000∗812600=16665001731616
=0.96
sx=√∑ ¿¿¿¿
sx=√ 4100009=213.44→desviacion standar
s x2=¿
sy=√∑ ¿¿¿¿
sy=√ 90288,899=100,16→desviacionstandar
s y2=¿
Yr= y+r ( sysx ) x−r ( sysx ) x
Yr=211.11+0.96 ( 100,16213,44 ) x−0.96 ( 100,16213,44 )633,33Yr=211,11+0,45 x−285,31
Yr=−74,2+0,45x
b=n∑ xy−∑ x∑ y
n∑ x2−¿¿¿
b=9 (1388500 )−(5700)(1900)9 (4020000 )−(5700 )
b=12496500−1083000036180000−32490000
b=16665003690000
b=0.45
a= y−bx
a=211.11−0.45 (633.33)
a=¿-73.89
Ecuación lineal de las dos variables.
y=a+bx y=−73,89+0.45 x
Diagrama de dispersión en el plano cartesiano
300 400 500 600 700 800 900 10000
50100150200250300350400
YLinear (Y)
Axis Title
Axis Title
Ingreso que corresponde a un ahorro semanal de 90 dólares.
y=−73,89+0.45 x y=−73.89+0.45 (90 )=−33.39
Si el ahorro es de 200 dólares que gasto puede realizar el obrero en dicha
Semana.
y=−73.89+0.45 x
y=−73.89+0.45 (200 )=16.11
Si el ingreso es de 350 dólares cual es el salario.
y=−73.89+0.45 x
350=−73.89+0.45 x
350+73.890.45
=x
x=941.98
PASOS DE UNA PRUEBA DE HIPOTESIS
Primer paso formular la hipótesis nula y la hipótesis alternativa
Hipótesis nula
Ho = β=0
La hipótesis alternativa
Ha= β<0; β>0
Segundo paso determinar si la prueba es unilateral o bilateral
Bilateral
Tercer paso Asumir el nivel se significación de la prueba
95% ± 1,96
Cuarto paso determinar la distribución maestral que se usara en la
prueba
n<30
Como n es menor que 30 utilizaremos la T de estudent
Quinto paso elaborar el esquema de la prueba
-1.96 +1.96
Sexto paso calcular el estadístico de la prueba
z= Pm−poQp
z=0.05−09
z=5.55
Q=√ SX 2+SY 2
n
Q=√ 45556,63+10032,109
Q=216.03
QP=√ PQn
QP=√ 0(216.03)9
QP=0
Pm= pn
Pm=0.459
Pm=0.05
Un comerciante mayorista encargo un estudio para determinar la
relación entre los gastos de publicidad semanal por radio y las
ventas de sus productos. En el estudio se obtuvieron los siguientes
resultados.
Semana 2 3 4 5 6 7 8 9 10 11Gasto de Publicidad ($) 30 20 40 30 50 70 60 80 70 80Venta ($) 300 250 400 - 550 750 630 930 700 840
En la quinta semana por diversos motivos no se pudo hacer el estudio
Determine la ecuación de regresión de ventas sobre gastos de publicidad
N x Y X2 Y2 X Y (xi-x)2 (yi-y)2
1 30 300 900 90000 9000 136,11 21267,362 20 250 400 62500 5000 469,44 38350,693 40 400 1600 160000 16000 2,78 2100,694 50 550 2500 302500 27500 69,44 10850,695 70 750 4900 562500 52500 802,78 92517,366 60 630 3600 396900 37800 336,11 33917,367 80 930 6400 864900 74400 1469,44 234417,368 70 700 4900 490000 49000 802,78 64600,699 80 840 6400 705600 67200 1469,44 155367,36
500 5350 31600 3634900 338400 5558,33 653389,58
DESARROLLO
X=∑ x1n
=5009
=55,55
Y=∑ y1n
=53509
=594,44
r=n∑ xy−∑ x∑ y
√¿¿¿
r=9¿¿
r= 370600
√(34400)(4091600)
r= 370600375168,02
=1.00
SX=√∑ ¿¿¿¿
sx=√ 3822,229=20,61→desviacion standar
s x2=¿
sy=√∑ ¿¿¿¿
sy=√ 454622,229=224,75→desviacionstandar
s y2=(224,75)=50512,56→varianza
Yr=594,44+0.99( 224,7520,61 )x−0.99 ( 224,7520,61 )55,55Yr=594,44+10,79 x−599,71
Yr=−5,27+10,79 x
b=n∑ xy−∑ x∑ y
n∑ x2−¿¿¿
b=9 (338400 )−(500)(5350)9 (31600 )−(250000 )
b=3045600−2675000284400−250000
b=370600334400
b=1.10
a= y−bx
a=594.44−1.10(55.56)
a=¿ 533.32
Ecuación lineal de las dos variables.
y=a+bx
y=−8,77+10.86 x
Diagrama de dispersión en el plano cartesiano
200 400 600 800 1000 1200 14000
10
20
30
40
50
60
70
80
Series2
PASOS DE UNA PRUEBA DE HIPOTESIS
Primer paso formular la hipótesis nula y la hipótesis alternativa
Hipótesis nula
Ho = β=0
La hipótesis alternativa
Ha= β<0; β>0
Segundo paso determinar si la prueba es unilateral o bilateral
Bilateral
Tercer paso Asumir el nivel se significación de la prueba
95% ± 1,96
Cuarto paso determinar la distribución muestral que se usara en la
prueba
n<30
Como n es menor que 30 utilizaremos la T de estudent
Quinto paso elaborar el esquema de la prueba
-1.96 +1.96
Sexto paso calcular el estadístico de la prueba
z= Pm−poQp
z=0.12−09
z=0.013
Q=√ SX 2+SY 2
n
Q=√ 424,77+50512,569
Q=77.69
QP=√ PQn
QP=√ 0(77.69)9
QP=0
Pm= pn
Pm=1.109
Pm=0.12
En cuánto estimaría las ventas de la quinta semana
Se obtuvieron los siguientes datos para determinar la relación entre cantidad de fertilizante y producción de papa por hectárea.
Sacos de Fertilizante por hectárea 3 4 5 6 7 8 9 10 11 12Rendimiento en Quintales 45 48 52 55 60 65 68 70 74 76
Encuentre la ecuación de regresión de la cosecha sobre el fertilizante, por el método de mínimos cuadrados.
Y=a+bx
x=∑ xi
n=7510
=7,5 y=∑ yi
n=61310
=61,3
a=Y−b x
x Y XY X2 (xi−x ) ¿3 45 135 9 -4,5 20,254 48 192 16 -3,5 12,255 52 260 25 -2,5 6,256 55 330 63 -1,5 2,257 60 420 49 -0,5 0,258 65 520 64 0,5 0,259 68 612 81 1,5 2,25
10 70 700 100 2,5 6,2511 74 814 121 3,5 12,2512 76 912 144 4,5 20,25
∑ x=75 ∑ y=613 ∑ xy=¿4895¿∑ x2=672 ∑ (xi−x )=672 ∑ (xi−x )282,50
Y=a+bx
Y=40,9+2,72 x
r=n∑ xy−∑ x∑ y
√¿¿¿
r=9¿¿
r= 370600
√(34400)(4091600)
r= 370600375168,02
=0.99
Estime la cosecha si se aplica 12 sacos de fertilizantes.
10 20 30 40 50 60 70 80 900
100200300400500600700800900
1000
Ahorros YLinear (Ahorros Y)
Axis Title
Axis Title
Determina el coeficiente de determinación. De su comentario sobre este
valores
Yr=−5,27+10,79 xyr= -5,27 + 10,79(30)yr= 318,43
Estime la cosecha si se aplica 12 sacos de fertilizantes ¿Cuánto es el error o
residual
y=34,07+3,63 xy=34,07+3,63 (12 )=77.63-76=1.63 es el error.
El número de horas de estudio invertidas y las calificaciones finales
en un curso de matemáticas de una muestra 10 alumnos ha dado
los siguientes resultados:
Alumno A1 A2 A3 A4 A5 A6 A7 A8 A9 A10Horas de estudio 14 16 22 20 18 16 18 22 10 8Calificación 12 13 15 15 17 11 14 16 8 5
Determinar la recta de regresión de la calificación sobre el número de horas de estudios invertidos. Interprete la ecuación de regresión.
X=∑ Yn
=12,6
Y=∑ Xn
=16,4
Sxy=∑ xy
n−Y X
Sxy=221210
−(12,6 ) (16,4 )
Sxy=14,56
Sx=√∑ (X1−X) ²n
N X Y X2 Y2 XY (X1-X )2 (Y1-Y )2
A1 14 12 196 144 168 5,8 0,4A2 16 13 256 169 208 0,2 0,2A3 22 15 484 225 330 31,4 5,8A4 20 15 400 225 300 13,0 5,8A5 18 17 324 289 306 2,6 19,4A6 16 11 256 121 176 0,2 2,6A7 18 14 324 196 252 2,6 2,0A8 22 16 484 256 352 31,4 11,6A9 10 8 100 64 80 41,0 21,2A10 8 5 64 25 40 70,6 57,8
∑164 ∑126 ∑2888 ∑1714 ∑2212
∑198,4 ∑126,4
Sx=√ 198,410Sx=19,84
Sy=√∑ (Y 1−Y )2
n
Sy=√ 126,410Sy=12,64
S x2=∑ x2
n−X 2
Sx ²=288810
−(16,4)2
Sx ²=19,84
b=SXYSx ²
b=14,5619,84
b=0,734
a=Y−b X
a=12,6−(0,734 ) (16,4 )
a=0,565
Ecuación lineal de las dos variables.
y=a+bx
y=1.55+0.67 x
r=n∑ xy−∑ x∑ y
√¿¿¿
r=10¿¿
r= 1456
√(1984 )(1264)
r= 14561583.60
=¿ 0.92
Diagrama de dispersión en el plano cartesiano
0 200 400 600 800 1000 1200 14000
10
20
30
40
50
60
70
80
Series2
PASOS DE UNA PRUEBA DE HIPOTESIS
Primer paso formular la hipótesis nula y la hipótesis alternativa
Hipótesis nula
Ho = β=0
La hipótesis alternativa
Ha= β<0; β>0
Segundo paso determinar si la prueba es unilateral o bilateral
Bilateral
Tercer paso Asumir el nivel se significación de la prueba
99% ± 2.58
Cuarto paso determinar la distribución muestral que se usara en la
prueba
n<30
Quinto paso elaborar el esquema de la prueba
-2.58 +2.58
Sexto paso calcular el estadístico de la prueba
z= Pm−poQp
z=0.073−0
0 z=0.013
Q=√ SX 2+SY 2
n
Q=√ 19.84+12.6410
Q=1.40
QP=√ PQn
QP=√ 0(1.40)10
QP=0
Pm= pn
Pm=0.7310
Pm=0.073
Una muestra de 60 de las 350 agencias de ventas de automóviles de
una importadora registrada en un mes con X (autos vendidos por
agencia), Y (ventas en miles de dólares) ha dado los siguientes
resultados:
x=10 , y=10 , ∑ x2=7000 ,∑ y2=42000 , ∑ xy=8000
Determine la ecuación de regresión:
Y=a+bX
sxy=∑ xy
n−x y
sxy=800060
−10∗20=−66.67
s x2=∑ x2
n−¿
s x2=700060
−¿
b= sxy
s x2=−66.6716.67
=−4
a= y−bx
a=20−(−4 ) (10 )=60
Ecuación
y=a+bx
y=60−4 x
Calcule el coeficiente de terminación ¿Qué porcentaje de la variación total
es explicada por la regresión?
y=∑ y
n
∑ y= y n
∑ y=20∗60=1200
x=∑ x
n
∑ x=xn
∑ x=10∗60=600
r=n∑ xy−∑ x∑ y
√¿¿¿
r=60 (8000 )−(600)(1200)
√¿¿¿
r= −240000254358.44
=−0,94
Los contadores con frecuencia estiman los gastos generales
basados en el nivel de producción. En la tabla que sigue se da la
información recabada sobre gastos generales y las unidades
producidas en 10 plantas y se desea estimar una ecuación de
regresión para estimar gastos generales futuros.
Gastos generales ($) 300 1000 1100 1200 600 800 900 500 400 200
Unidades producidas 15 45 55 75 30 40 45 20 18 10
N x Y X2 Y2 X Y (xi-x)2 (yi-y)2
1 300 15 90000 225 4500 160000,00 412,09
2 1000 45 1000000 2025 45000 90000,00 94,093 1100 55 1210000 3025 60500 160000,00 388,094 1200 75 1440000 5625 90000 250000,00 1576,095 600 30 360000 900 18000 10000,00 28,096 800 40 640000 1600 32000 10000,00 22,097 900 45 810000 2025 40500 40000,00 94,098 500 20 250000 400 10000 40000,00 234,099 400 18 160000 324 7200 90000,00 299,2910 200 10 40000 100 2000 250000.00 640.09sumatoria 7000 353 6000000 16249 309700 1100000,00 3788,10
Determine la ecuación de regresión y haga un análisis del coeficiente de
regresión.
X=∑ X i
N
X=7 00010
X=700
Y=∑Y i
N
Y=35310
Y=35,3
SXY=∑ XY
n– X∗Y
SXY=30970010
−(700)(35,3)
SXY=30970−24710
SXY=6260
SX=√∑ (X i−X )2
N
SX=√ 110000010
SX=331,66
SX 2=109998,36
b=SXY
SX 2
b= 6260109 998,36
b=0,06
a=Y−b X
a=35,3−0,06(700)
a=−6,7
Y=a+bx
Y=−6,7+0,06 x
Diagrama de dispersión en el plano cartesiano
0 200 400 600 800 1000 1200 14000
10
20
30
40
50
60
70
80
Series2
PASOS DE UNA PRUEBA DE HIPOTESIS
Primer paso formular la hipótesis nula y la hipótesis alternativa
Hipótesis nula
Ho = β=0
La hipótesis alternativa
Ha= β<0; β>0
Segundo paso determinar si la prueba es unilateral o bilateral
Bilateral
Tercer paso Asumir el nivel se significación de la prueba
99% ± 2.58
Cuarto paso determinar la distribución muestral que se usara en la
prueba
n<30
Quinto paso elaborar el esquema de la prueba
-2.58 +2.58
Sexto paso calcular el estadístico de la prueba
z= Pm−poQp
z=0.073−0
0 z=0.013
Q=√ SX 2+SY 2
n
Q=√ 19.84+12.6410
Q=1.40
QP=√ PQn
QP=√ 0(1.40)10
QP=0
Pm= pn
Pm=0.7310
Pm=0.073
La calificación de un grupo de estudiantes en el examen parcial (x) y en
el examen final (y), fueron las siguientes.
x y x y X y x y12 15 18 20 15 17 13 148 10 12 14 12 15 10 13
10 12 10 12 11 12 12 1513 14 12 10 12 13 13 149 12 14 16 11 12 12 13
14 15 9 11 10 13 16 1811 16 10 13 14 12 15 17
a) Determinar la ecuación de regresión lineal de Y en X
X y xy X2 Y2 (xi-x) (xi-x)2 (yi-y) (yi-y)2
12 15 180 144 225 0 0 -1 18 10 80 64 100 4 17 4 15
10 12 120 100 144 2 4 2 313 14 182 169 196 -1 1 0 09 12 108 81 144 3 9 2 3
14 15 210 196 225 -2 4 -1 1
11 16 176 121 256 1 1 -2 518 20 360 324 400 -6 35 -6 3812 14 168 144 196 0 0 0 010 12 120 100 144 2 4 2 312 10 120 144 100 0 0 4 1514 16 224 196 256 -2 4 -2 59 11 99 81 121 3 9 3 8
10 13 130 100 169 2 4 1 115 17 255 225 289 -3 9 -3 1012 15 180 144 225 0 0 -1 111 12 132 121 144 1 1 2 312 13 156 144 169 0 0 1 111 12 132 121 144 1 1 2 310 13 130 100 169 2 4 1 114 12 168 196 144 -2 4 2 313 14 182 169 196 -1 1 0 010 13 130 100 169 2 4 1 112 15 180 144 225 0 0 -1 113 14 182 169 196 -1 1 0 012 13 156 144 169 0 0 1 116 18 288 256 324 -4 15 -4 1715 17 255 225 289 -3 9 -3 10
338 388 4803 4222 5528 142 151
x=∑ xi
n
x=33828
=12
y=∑ yi
n
y=38828
=14
b=n∑ xi yi−∑ xi∑ yi
n∑ X i2−¿¿¿
b=28 (4803 )− (338 )(388)28(4222)−(338)2
b=134484−131144118216−114244
b=0,85
a=Y−b Xa=14−0,85 (12 )=3,80
Y=a+bxy=3,8+0,85 x
El gerente de personal de la empresa P&C quiere estudiar la relación
entre el ausentismo y la edad de sus trabajadores. Tomo una muestra
aleatoria de 10 trabajadores de la empresa y encontró los siguientes
datos.
Edad (año) 25 46 58 37 55 32 4
1
50 23 60
Ausentismo (días por
año)
18 12 8 15 10 13 7 9 16 6
a) Use el método de mínimos cuadrados para hallar la ecuación muestral
que relaciona las dos variables.
Edad (años)
Ausentismo
x Y X Y X2 Y2 (xi-x) (xi-x)2 (yi-y) (yi-y)2
25 18 450 625 324 -17,7 313,29 6,6 43,5646 12 552 2116 144 3,3 10,89 0,6 0,3658 8 464 3364 64 15,3 234,09 -3,4 11,5637 15 555 1369 225 -5,7 32,49 3,6 12,9655 10 550 3025 100 12,3 151,29 -1,4 1,9632 13 416 1024 169 -10,7 114,49 1,6 2,5641 7 287 1681 49 -1,7 2,89 -4,4 19,3650 9 450 2500 81 7,3 53,29 -2,4 5,7623 16 368 529 256 -19,7 388,09 4,6 21,1660 6 360 3600 36 17,3 299,29 -5,4 29,16
427 114 4452 19833 1448 1600,1 148,4
y=a+b x
b=n∑ xi y i−∑ x∑ y
n∑ x2−¿¿
x=∑ xi
n
x=42710
=42.7
y=∑ yi
n
y=11410
=11.4
b=10 (4452 )−(427 )(114 )10 (19833)−(427)2
=¿
b= 44520−48678198330−182329
=¿
b=−415816001
=−0.26
a= y−bxa=11.4−(−0.26 )42.7=22.502 [email protected]=22.502−0.26 x=ecuacion lineal .
b) Calcule el coeficiente de determinación. De su comentario sobre el ajuste
de la línea de regresión a los datos de la muestra.
r=n∑ xy−∑ x∑ y
√¿¿¿r=10¿¿
r= 4158
√(16001)(1484)
r= 41584872.93
=0.85
En la gráfica se puede observar que se obtiene una regresión lineal negativa y los
puntos de dispersión no se encuentran tan dispersos a la línea.
En un estudio para determinar la relación entre edad (X) y presión
sanguínea (Y) una muestra aleatoria de 9 mujeres ha dado los siguientes
resultados.
x 54 40 70 35 62 45 55 50 38
y 148 123 155 115 150 126 152 144 114
a) Encuentre la ecuación de regresión de Y en X y estime la presión sanguínea
para una mujer de 75 años.
b) Utilizando t-Student pruebe la hipótesis B=0.9, contra la hipótesis B > 0,9 al
nivel de significación a=0.05
c) Pruebe la hipótesis nula Ho: p=0,9 contra H1: p > 0.9
Número Edad(X) Presión (Y) X2 Y2 X*Y (X-X)2 (Y-Y)2
1 54 148 2916 21904 7992 16,90 136,11
2 40 123 1600 15129 4920 97,79 177,78
3 70 155 4900 24025 10850 404,46 348,44
4 35 115 1225 13225 4025 221,68 455,11
5 62 150 3844 22500 9300 146,68 186,78
6 45 126 2025 15876 5670 23,90 106,78
7 55 152 3025 23104 8360 26,12 245,44
8 50 144 2500 20736 7200 0,01 58,78
9 38 114 1444 12996 4332 141,35 498,78
449 1227 23479 169495 62649 1078,89 2214,00
X=∑ Yn
=49,88
Y=∑ Xn
=136,33
Sxy=∑❑
❑
xy
n−x y
Sxy=626499
−(49,88 ) (136,33 )
Sxy=6961−6800,14=160,86
Sx=❑√∑❑❑ (X1−X ) ²n
Sx=❑√ 1078,899
Sx=10,95
Sy=❑√∑❑
❑
(Y 1−Y )2
n
Sy=❑√ 22149Sy=15,68
S x2=∑❑
❑
x2
n−X 2
Sx ²=234799
−(49,88)2
Sx ²=2608,77−2488.01=120,76
b=SXYSx ²
b=171,696120,76
b=1.42
a=Y−b X
a=136,33− (1.42 ) (49,88 )
a=65,50
Ecuación lineal de las dos variables.
y=a+bx
y=1.42+65,50x
r=n∑
❑
❑
xy−∑❑
❑
x∑❑
❑
y
❑√¿¿¿
r=9¿¿
r= 12918❑√(9710)(19926)
r=0,928
Diagrama de dispersión en el plano cartesiano
0 200 400 600 800 1000 1200 14000
10
20
30
40
50
60
70
80
Series2
PASOS DE UNA PRUEBA DE HIPOTESIS
Primer paso formular la hipótesis nula y la hipótesis alternativa
Hipótesis nula
Ho = β=0
La hipótesis alternativa
Ha= β<0; β>0
Segundo paso determinar si la prueba es unilateral o bilateral
Bilateral
Tercer paso Asumir el nivel se significación de la prueba
99% ± 2.58
Cuarto paso determinar la distribución muestral que se usara en la prueba
n<30
Quinto paso elaborar el esquema de la prueba
-2.58 +2.58
Sexto paso calcular el estadístico de la prueba
z= Pm−poQp
z=0.073−0
0 z=0 .013
Q=❑√ SX2+SY 2
n
Q=❑√ 120,76+2469
Q=1.90
QP=❑√ PQn
QP=❑√ 0 (1.90)9
QP=0
Pm= pn
Pm=0.739
Pm=0.08
En un estudio para determinar la relación entre edad (X) y presión
sanguínea (Y) una muestra aleatoria de 9 mujeres ha dado los siguientes
resultados:
X 54 40 70 35 62 45 55 50 38Y 148 123 155 115 150 126 152 144 114
a) Halle la ecuación de regresión de Y en X y estime la presión sanguínea
para una mujer de 75 años.
b) Utilizando t-Student pruebe la hipótesis β=0.9, contra la hipótesis β>0.9 al
nivel de significación α=0,05.
c) Pruebe la hipótesis Ho : ρ=0.9 contra H 1: ρ>0.9
a) Determinar la ecuación lineal de las dos variables.
Desarrollo
X Y X Y X2 Y2 (xi-x) (xi-x)2 (yi-y) (yi-y)2
54 148 7992 2916 21904 4,11 16,90 11,67 136,1140 123 4920 1600 15129 -9,89 97,79 -13,33 177,7870 155 10850 4900 24025 20,11 404,46 18,67 348,4435 115 4025 1225 13225 -14,89 221,68 -21,33 455,1162 150 9300 3844 22500 12,11 146,68 13,67 186,7845 126 5670 2025 15876 -4,89 23,90 -10,33 106,7855 152 8360 3025 23104 5,11 26,12 15,67 245,4450 144 7200 2500 20736 0,11 0,01 7,67 58,7838 114 4332 1444 12996 -11,89 141,35 -22,33 498,78
449 1227 62649 23479 169495 0,00 1078,89 0,00 2214
Primer caso
Yr=Y +r ( sysx ) x−r ( sysx ) x
X=∑ x1n
= 4499
=49,89
Y=∑ y1n
=12279
=136.33
r=n∑ xy−∑ x∑ y
√¿¿¿
r=9 (62649 )−(449)(1227)
√¿¿¿
r= 12918
√9710∗19926= 1291813909,76
=0.93
sx=√∑ ¿¿¿¿
sx=√ 1078,899=10.94→desviacion standar
s x2=¿
sy=√∑ ¿¿¿¿
sy=√ 22149 =15,68→desviacionstandar
s y2=¿
Yr= y+r ( sysx ) x−r ( sysx ) x
Yr=136.33+0.93( 15,6810,94 ) x−0.93 ( 15,6810,94 )49,89
Yr=136,33+1,33x−66,35
Yr=69,98+1,33x
Para una persona de 75 años vamos a encontrar la presión sanguínea.
Yr=69,98+1,33(70)
Yr=169,73
El gerente de ventas de una cadena de tiendas obtuvo información de los
pedidos por internet y del número de ventas realizadas por esa modalidad.
Como parte de su presentación en la próxima reunión de vendedores al
gerente le gustaría dar información específica sobre la relación entre el
número de pedidos y el número de ventas realizadas.
TIENDA 1 2 3 4 5 6 7 8 9 10
NÚMERO
DE
PEDIDOS
50 56 60 68 65 50 79 35 4215
NÚMERO
DE
VENTAS
45 55 50 65 60 40 75 30 3812
a) Use el método de mínimos cuadrados para expresar la relación entre estas
dos variables.
b) Haga un análisis de los coeficientes de regresión.
c) ¿Proporcionan los datos suficiente evidencia para indicar que las unidades
producidas aportan información para producir los gastos generales?
d) Realice un análisis de la bondad del ajuste de la ecuación de regresión
lineal.
e) ¿Qué puede usted concluir acerca de la correlación poblacional entre
gastos generales y unidades producidas?
Desarrollo
TIENDANÚMERO
DE PEDIDOS
NÚMERO DE
VENTASXY X2 X-X (X-X)2 Y2 Y-X (Y-X)2
1 50 45 2250 2500 -2 4 2025 -2 42 56 55 3080 3136 4 16 3025 8 643 60 50 3000 3600 8 64 2500 3 94 68 65 4420 4624 16 256 4225 18 3245 65 60 3900 4225 13 169 3600 13 1696 50 40 2000 2500 -2 4 1600 -7 497 79 75 5925 6241 27 729 5625 28 7848 35 30 1050 1225 -17 289 900 -17 2899 42 38 1596 1764 -10 100 1444 -9 81
10 15 12 180 225 -37 1369 144 -35 1225TOTAL 520 470 27401 30040 0 3000 25088 0 2998
X=52010
=52
Y=47010
=47
r=n∑ xy−∑ x∑ y
√¿¿¿
r=10(27401)−(520)(470)
√¿¿¿
r= 274010−244400√(300400−270400)(250880−220900)
r= 29610
√(30000)(29980)
r= 29610
√899400000
r= 29610
√29989,99833r=0,987
SX=√∑ ¿¿¿¿
sx=√ 300010 =17,32→desviacion standar
s x2=¿
sy=√∑ ¿¿¿¿
sy=√ 299810 =17,31→desviacion standar
s y2=(17,31)=299,64→varianza
b=n∑ xy−∑ x∑ y
n∑ x2−¿¿¿
b=10 (27401 )−(520)(470)10 (30040 )−(520 )
b=274010−244400300400−270400
b=2961030000
b=0,987
a= y−bx
a=47−0,987 (52)
a=¿ -4,324
Ecuación lineal de las dos variables.
y=a+bx
y=−4,324+0,987 x
PASOS DE UNA PRUEBA DE HIPOTESIS
1. Formular la hipótesis nula y la hipótesis alternativa
Hipótesis nula
Ho = β=0
La hipótesis alternativa
Ha= β<0; β>0
2. Determinar si la prueba es unilateral o bilateral
Bilateral
3. Asumir el nivel se significación de la prueba
95% ± 1,96
4. Determinar la distribución muestral que se usara en la prueba
n<30
Como n es menor que 30 utilizaremos la T de estudent
5. Elaborar el esquema de la prueba
-1.96 +1.96
6. Calcular el estadístico de la prueba
z= Pm−poQp
z=0.0987−0
10 z=9,87∗10−3 (0,00987)
Q=√ SX 2+SY 2
n
Q=√ 299,98+299,6410
Q=7,74
QP=√ PQn
QP=√ 0(7,74)10
QP=0
Pm= pn
Pm=0,98710
Pm=0,0987
En este caso la hipótesis nula se acepta. Es decir si existe relación entre el
número de pedidos y las ventas que se realizan en las tiendas.
Con los siguientes datos muestrales
Coeficiente de inteligencia: IQ 135 115 95 100 110 120 125 130 140
Notas de un examen 16 13 12 12 14 14 15 15 18
a) Halle la ecuación de regresión muestral
b) Interprete la pendiente de parcial.
c) Utilizando t-Student pruebe la hipótesis 𝛃 = 0, contra la hipótesis 𝛃>0 al
nivel de significación α=0,05. ¿Se puede aceptar que 𝛃=1?
d) El grado de asociación entre las dos variables.
e) Utilizando t-Student pruebe la hipótesis p=0 contra la hipótesis p>0 al nivel
de significación α= 0,05
Coeficiente de iteligencia IQ (X)
Notas de un exámen (Y)
XY X2 Y 2 X i−X (X ¿¿i−X )2¿
135 16 2160 18225 256 16,11 259,57115 13 1495 13225 169 -3,89 15,12
95 12 1140 9025 144 -23,89 570,68100 12 1200 10000 144 -18,89 356,79110 14 1540 12100 196 -8,89 79,01120 14 1680 14400 196 1,11 1,23125 15 1875 15625 225 6,11 37,35130 15 1950 16900 225 11,11 123,46140 18 2520 19600 324 21,11 445,68
1070 129 15560 129100 1879 1888,89
X=Σ X i
n
X=10709
=118,89
Y=ΣY i
n
Y=1299
=14,33
SXY=ΣXYn
−XY
SXY=155609
−(118,89×14,33)
SXY=25,195
SX=√ Σ(X i−X )2
n
SX=√ 1888,899
SX=14,487
SX2=209,876
b=SXY
SX2
b= 25,195209,876
b=0,12
a=Y−b X
a=14,33−0,12(118,89)
a=0,0632
Y=a+bx
Y=0,0632+0,12x
1) Ho= 0
Ha>0
2) Es unilateral con cola derecha
3) NC= 95%
Nivel de significación α=0,05
Z= 1,65
4) n < 30 9 < 30 t—Student
5)
r=n∑ xy−∑ x∑ y
√¿¿¿
Z= 1,65
Zona de aceptaciónZona de rechazo
r=9 (15560 )−(1070)(129)
√¿¿¿
r=0,9357
X Y XY X2 Y2 X1-X(X1-X
)2 Y1-Y (Y1-Y )2
0 64 0 0 4096 -1,0 1,0 -10,8 117,01 69 69 1 4761 0,0 0,0 -5,8 33,82 94 188 4 8836 1,0 1,0 19,2 368,10 55 0 0 3025 -1,0 1,0 -19,8 392,61 60 60 1 3600 0,0 0,0 -14,8 219,52 92 184 4 8464 1,0 1,0 17,2 295,30 70 0 0 4900 -1,0 1,0 -4,8 23,21 80 80 1 6400 0,0 0,0 5,2 26,92 89 178 4 7921 1,0 1,0 14,2 201,20 84 0 0 7056 -1,0 1,0 9,2 84,41 82 82 1 6724 0,0 0,0 7,2 51,62 99 198 4 9801 1,0 1,0 24,2 584,90 73 0 0 5329 -1,0 1,0 -1,8 3,31 76 76 1 5776 0,0 0,0 1,2 1,42 95 190 4 9025 1,0 1,0 20,2 407,40 77 0 0 5929 -1,0 1,0 2,2 4,81 56 56 1 3136 0,0 0,0 -18,8 354,02 80 160 4 6400 1,0 1,0 5,2 26,90 50 0 0 2500 -1,0 1,0 -24,8 615,81 50 50 1 2500 0,0 0,0 -24,8 615,82 89 178 4 7921 1,0 1,0 14,2 201,20 70 0 0 4900 -1,0 1,0 -4,8 23,21 65 65 1 4225 0,0 0,0 -9,8 96,32 90 180 4 8100 1,0 1,0 15,2 230,60 64 0 0 4096 -1,0 1,0 -10,8 117,01 67 67 1 4489 0,0 0,0 -7,8 61,12 80 160 4 6400 1,0 1,0 5,2 26,9
∑27 ∑2020 ∑2221 ∑45∑15631
0∑0,0 ∑18,0 ∑0,0
∑5184,1
Determine la ecuación de regresión de gastos sobre ingresos
Y=∑ YN
=74,81
X=∑ XN
=1
r=n∑ xy−∑ x∑ y
√¿¿¿
r=27 (2221 )−(27 )(2020)
√ [27 (45 )−(27)2 ] [27 (156310)−(2020)2 ]
r= 54278247,75
=0,66
DESVIACIÓN
Sx=√∑ ( X1−X )2
n
Sx=√ 1827Sx=0,81
Sy=√∑ (Y 1−Y )2
n
Sy=√ 5184,127
Sy=13,86
ECUACIÓN
Y R=Y +r ( SySx ) x−r ( SySx )x
Y R=74,81+0.66 ( 13,860,81 ) x−0.66( 13,860,81 )1 Y R=74,81+11,167 x−11,16
Y R=63,648+11,167 x
0 0.5 1 1.5 2 2.50
20
40
60
80
100
120
Nivel Socioeconomico
Gast
os e
n ed
ucac
ión
CONCLUSIONES
El conocimiento de la prueba de hipótesis La prueba de hipótesis nos ayudan a una correcta forma de emplear el
mecanismo en cuanto a encontrar valores de las variables El planteamiento de problemas relacionados a la prueba de hipótesis las
transformaciones ayudan a reforzar el conocimiento Los ejercicios vinculados al comercio exterior ayudan a una mejor
comprensión El realizar ejercicios de reforzamiento ayudan a un fácil manejo de la
prueba de hipótesis
RECOMENDACIONES
Todos conocemos y manejamos un mismo folleto de la prueba de hipótesis Auto educarnos realizando ejercicios que nos ayuden a nuestro desarrollo Investigar término desconocidos acerca del tema Proponer un intercambio de ideas con los compañeros para aclarar dudas Reforzar nuestros conocimientos mediante nuestra investigación.
CRONOGRAMA DE ACTIVIDADES
SEMANA
ACTIVIDAD 1 2 3 4 5DISEÑO DEL PROYECTO x
ELABORACIÓN DEL PROYECTO x
DESARROLLO DEL PROYECTO x
INFORME FINAL x
ENTREGA DEL PROYECTO
x
BIBLIOGRAFIA
Física Vectorial 1 (Vallejo & Zambrano, 2001)
Anexos
Se obtuvieron los siguientes datos para determinar la relación entre cantidad de exportaciones y importaciones realizadas de banano desde el Ecuador hacia los EE UU y del ingreso desde los EE UU de productos derivados del petróleo.
X1 Y1 XY X² X1-Ẋ (X1- Ẋ)² Y² Yi-Ỹ Yi-Ỹ²45 20 900 2025 3 9 400 -7,3 53,2950 36 1800 2500 8 64 1296 8,7 75,6930 45 1350 900 -12 144 2025 17,7 313,2950 26 1300 2500 8 64 676 -1,3 1,6955 28 1540 3025 13 169 784 0,7 0,4965 35 2275 4225 23 529 1225 7,7 59,2945 30 1350 2025 3 9 900 2,7 7,2935 18 630 1225 -7 49 324 -9,3 86,4925 20 500 625 -17 289 400 -7,3 53,2920 15 300 400 -22 484 225 -12,3 151,29
420 273 11945 19450 1810 8255 802,1
Desarrollo
Ỹ=∑ Yin
=27.3
Ẋ=∑ Xin
=42
Sxy=∑ xy
n−Ỹ Ẋ
Sxy=1194610
−(27.3 ) (42 )
Sxy=48
Sx=√∑ (Xi−Ẋ ) ²n
Sx=√ 181010Sx=13.45desviacionestandar
Sx ²=181varianza
b=SXYSx ²
b= 48181
=0.27
a=Ỹ−bẊ
a=27.3− (0.27 ) (42 )
a=15.96
Y=a+bx
Y=15.96+0.27 x
Se obtuvieron los siguientes datos para determinar la relación entre cantidad de productos colombianos comercializados en Ecuador y la aceptación de productos nacionales en los diferentes centros de venta.
X1 Y1 XY X² X1-Ẋ (X1- Ẋ)² Y² Yi-Ỹ Yi-Ỹ²25 15 375 625 -8 64 225 -23,8 566,4435 60 2100 1225 2 4 3600 21,2 449,4450 75 3750 2500 17 289 5625 36,2 1310,4425 60 1500 625 -8 64 3600 21,2 449,4465 45 2925 4225 32 1024 2025 6,2 38,4435 40 1400 1225 2 4 1600 1,2 1,4440 25 1000 1600 7 49 625 -13,8 190,4420 18 360 400 -13 169 324 -20,8 432,6415 15 225 225 -18 324 225 -23,8 566,4420 35 700 400 -13 169 1225 -3,8 14,44
330 388 14335 13050 2160 19074 4019,6
Desarrollo
Ỹ=∑ Yin
=38.8
Ẋ=∑ Xin
=33
Sxy=∑ xy
n−Ỹ Ẋ
Sxy=1433510
−(38.8 ) (33 )
Sxy=153.10
Sx=√∑ (Xi−Ẋ ) ²n
Sx=√ 216010Sx=14.70desviacionestandar
Sx ²=216varianza
b=SXYSx ²
b=153.10216
=0.71
a=Ỹ−bẊ
a=38.8− (0.71 ) (33 )
a=15.37
Y=a+bx
Y=15.37+0.71 x