28
Integrante 1: Laura Katerine Munevar Ortiz Código: 201414357 Sección: 05 Integrante 2: Juan Pablo Medina Flechas Código: 201414269 Sección: 01 1 Laura Katerine Munevar 20141426

Probabilidad I

Embed Size (px)

DESCRIPTION

Taller clase de probabilidad

Citation preview

Integrante 1: Laura Katerine Munevar Ortiz Cdigo: 201414357 Seccin: 05Integrante 2: Juan Pablo Medina Flechas Cdigo: 201414269 Seccin: 01

201414269Laura Katerine Munevar Ortiz

0501201414269Juan Pablo Medina Flechas

Punto 1. Intervalos de Confianzaa. Realice un intervalo de confianza del 90% para la media del consumo de combustible de ambos modelos de camiones.Para realizar el IC para la media conociendo que es una distribucin normal, sin embargo con varianza poblacional desconocida, realizamos las siguientes observaciones para cada uno de los modelos de camiones:SUPUESTOS:1) Variable aleatoria: X~N(,2) Parmetros poblacionales desconocidas3) Muestra aleatoria: , n, S se pueden calcular a partir de la muestra aleatoriaESTADSTICO1) Estimador del parmetro : ~N(,2) Construccin del estadstico: ~CONSTRUCCIN DEL IC PARA EL PARMETRO

X: Consumo de los camiones DH11 = 0,10S =1 Km/Ln =18 = 14,3 Km/L= =1,7396

Y: Consumo de los camiones F15 = 0,10S =1,5 Km/Ln =12 = 14 Km/L= =1,7959

b. Realice un intervalo de confianza del 98% para la desviacin estndar del consumo de combustible de ambos modelos de camiones. Para realizar el IC para la desviacin estndar, lo que hacemos es la estimacin de la varianza poblacional, posteriormente con la relacin directa de la variacin con la desviacin sacamos la raz cuadrada de la varianza. Realizamos las siguientes observaciones para cada uno de los modelos de camiones:SUPUESTOS:1) Variable aleatoria: X~N(,2) Parmetros poblacionales desconocidas3) Muestra aleatoria: , n, S se pueden calcular a partir de la muestra aleatoriaESTADSTICO:

CONSTRUCCIN DEL IC PARA EL PARMETRO

X: Consumo de los camiones DH11 = 0,02S =1 Km/Ln =18= =33,4087= = 6,41

El intervalo de confianza para el consumo de los camiones DH11 que nos piden ser:

Y: Consumo de los camiones F15 = 0,02S =1,5 Km/Ln =12= =24,72= = 3,05

El intervalo de confianza del consumo de los camiones F15 que nos piden ser:

c. La compaa est interesada en conocer si existe alguna diferencia significativa entre la varianza del consumo de combustible de los dos modelos de camiones. Realice un intervalo de confianza del 95% para la razn de las varianzas ( 2 2). Explique cul es la importancia de esta prueba en el desarrollo del literal d, y determine si la varianza del consumo de combustible es igual para los dos modelos de camin, DH11 y F15. Para realizar el intervalo de confianza para la razn de las varianzas, realizamos las siguientes observaciones: SUPUESTOS:1) Variables aleatorias: X~N(,, Y~N(,2) Parmetros poblacionales desconocidas3) Muestra aleatoria: , se pueden calcular a partir de la muestra aleatoriaESTADSTICO:

CONSTRUCCIN DEL IC PARA EL PARMETRO ( )

= 0,05

Se puede observar que el valor de uno se encuentra dentro del intervalo por lo tanto no se puede realizar ninguna conclusin con una significancia del 5%, no se puede determinar que el combustible DH11 es igual al F15. Para el literal d, sabemos que es posible que no sean iguales o iguales.

d. Realice un intervalo de confianza del 99% para la diferencia de las medias de consumo de combustible de los dos modelos ( ). Para esto, tenga en cuenta la conclusin del literal anterior acerca de las varianzas de ambas poblaciones. Son iguales las medias del consumo de los dos modelos de camiones?Para realizar el intervalo de confianza para la diferencia de las medias de consumo de combustible para los dos modelos, realizamos las siguientes observaciones:ESTADSTICO:

CONSTRUCCIN DEL INTERVALO DE CONFIANZA PARA EL PRAMETRO (

1=x2=y = =

= 0,01= =2,7633

Sp =1,2211

Se puede observar que el intervalo contiene el valor del cero, por lo tanto con una significancia del 5% no se puede concluir que el promedio del consumo de los camiones es el mismo.

Para complementar el anlisis anterior, se desea conocer la proporcin de camiones de cada modelo que presentan un rendimiento mayor a los 14.6 km/l, que corresponde al rendimiento mnimo que espera la compaa. Segn los representantes de Dino Hutro, de una muestra aleatoria de 65 camiones DH11, 48 presentaron un consumo de combustible mayor al establecido por la empresa. Por otro lado, la gerencia de Futn asegur que, de una muestra aleatoria de 77 camiones F15, 45 superaban dicha meta de consumo. Teniendo en cuenta lo anterior, responda los siguientes literales: e. Realice un intervalo de confianza del 90% para la proporcin de camiones DH11 que presentan un consumo mayor a 14.6 kilmetros por litro.Teniendo en cuenta que la muestra es mayor a 30 datos, por el teorema de lmite central se puede decir que el estudio converge a una normal: N(,

f. Realice un intervalo de confianza del 90% para la proporcin de camiones F15 que presentan un consumo inferior a 14.6 km/l.

g. Qu puede concluir acerca de los intervalos de confianza realizados en los literales e y f? Son comparables estos intervalos de confianza? Con una confiabilidad del 90%, la proporcin de rendimiento de los camiones DH11 que presentan un consumo de combustible mayor al 14,6 Km/L estar entre 0,65 y 0,83. Por otra parte, con una confiabilidad del 90%, la proporcin de camiones F15 que presentan consumo inferior a 14,6 Km/L estar entre 0,33 y 0,51. No son comparables estos intervalos de confianza, ya que uno menciona el consumo inferior de los F15 y el otro el consumo superior de los DH11, por tanto estn en proporciones diferentes, no comparables.h. Realice un intervalo de confianza del 92% para la diferencia de las proporciones en el consumo de combustible entre los dos modelos de camiones para un consumo mayor a 14.6 kilmetros por litro (11 15). Son iguales estas proporciones entre los dos modelos? Podra establecer cul de los dos modelos es una mejor opcin para la compaa?

X=1 Y=2

Dado que el calor del cero no se encuentra dentro del intervalo de confianza, se puede concluir que con una confiabilidad del 92%, las proporciones del consumo de gasolina entre las dos marcas de camiones para un consumo mayor a 14,6 Km/L son diferentes.

Punto 2. Error Tipo I y Error Tipo IIEl ingeniero est considerando dos criterios de rechazo para evaluar este nuevo sistema y poder concluir si es el adecuado para el nuevo prototipo: Criterio 1: Rechazar Ho si 59.5 Criterio 2: Rechazar Ho si 59 .

Con base en la informacin anterior, responda los siguientes literales: a. Especifique las hiptesis nula y alterna, el mejor estimador para el parmetro, y el estadstico de prueba que se debe utilizar. HIPTESIS:H0: = 60H1: 60

ESTIMADOR PARA EL PARMETRO: ~N(,

ESTADSTICO DE PRUEBA:~ N(0,1)

b. Calcule el Error Tipo I, el Error Tipo II y la Potencia para la prueba planteada en el Criterio 1. Asuma H1: = 58.5= P(Rechazar H0|H0 verdadera) = P(PP( Z < -1,414) = 1 P(Z < 1,414) = 0,0793= P(No rechazar H0|H0 falsa) = P(1- PP( Z < 2,83) = 1 0,9977 = 0,0023Potencia = 1- = 1-0,0023 = 0,9977

c. Calcule el Error Tipo I, el Error Tipo II y la Potencia para la prueba planteada en el Criterio 2. Asuma H1: = 58.5= P(Rechazar H0|H0 verdadera) = P(PP( Z < -2,83) = 1 P(Z < 2,83) = 1- 0,9977 = 0,0023= P(No rechazar H0|H0 falsa) = P(1- PP( Z < 1,41) = 1 0,9207 = 0,0793Potencia = 1- = 1-0,0793 = 0,9207

d. Si el ingeniero define que el mximo Error Tipo I permitido es de 0.1, cul prueba debera escoger entre las dos alternativas? Al observar el error permitido en cada prueba se observa que las dos cumplen con el criterio de error tipo I siendo dichas menores que uno, por lo tanto se debe observar la potencia y escoger la de mayor valor, En este caso la prueba ms indicada ser la del criterio 1e. El ingeniero encargado tom la muestra aleatoria de 200 pruebas y encontr que el promedio de la distancia de frenado fue de 59.2 metros. Segn esto, se podra asegurar que el nuevo sistema es adecuado para el prototipo alemn?Con base en las pruebas realizadas se puede observar que al escoger el criterio uno se est rechazando la hiptesis nula por tanto es adecuado el nuevo sistema para el prototipo alemn, ya que la distancia promedio en la que se detendr es inferior a 60 metros.Punto 3. Pruebas de Hiptesisa. Previo a la recesin, la empresa consideraba que la Sucursal A tena unas ventas diarias promedio de 3.9 miles de dlares. Plantee una prueba de hiptesis que le permita evaluar si actualmente el nivel promedio de ventas es inferior a dicho valor. Para esto no olvide especificar las hiptesis nula y alterna, el estadstico de prueba, la regin de rechazo y concluir en trminos del problema. Use un nivel de significancia del 1%. HIPTESIS:H0: = 3,9H1: 3,9

= -0,6 ;

Para rechazar la hiptesis nula se debe tener en cuenta que: t Z0,90Z0,90=1,29

Dado que el estadstico de prueba no cae en la regin de rechazo, se concluye que no hay evidencia estadstica suficiente para asegurar que la proporcin de meses en la sucursal A genera mayores ingresos. Siendo esta diferente de 0,6 con un nivel de significancia del 10% f. (5 puntos) Plantee una prueba de hiptesis que le permita evaluar si la proporcin de das en los que la Sucursal A ha generado mayores ventas que la Sucursal B en los ltimos 45 das, es mayor que en los 30 das anteriores a estos. Se sabe que en los 30 das anteriores, la Sucursal A gener mayores ventas que la Sucursal B en 20 de ellos. Para realizar la prueba especifique las hiptesis nula y alterna, el estadstico de prueba, la regin de rechazo y concluya. Use un nivel de significancia del 10%.HIPTESIS:H0: pA- pB = 0H1: pA- pB 0 = 2,45; Se rechaza la hiptesis nula si Z >Z0,90Z0,90=1,29

Dado que es estadstico de prueba cae en la regin de rechazo, se concluye que con un nivel de significancia del 10% se rechaza que las dos proporciones son iguales.

Punto 4. Bondad de AjusteEn general se plantea que:

Ya que no conocemos los parmetros de la variable aleatoria, y debemos crear 8 clases que sean equiprobables, emplearemos estimadores para hallar los lmites superiores de cada clase:

De la muestra aleatoria presentada tenemos que:

Realizamos una estandarizacin en donde tenemos que,

Para hallas cada uno de los lmites de las clases, sabemos que la tabla empieza en el valor mnimo posible que es 82. Ahora para hallar el lmite superior que permita que la probabilidad sea de 0.125 hallamos el valor de en tablas de distribucin normal y posteriormente despejamos Xi de la ecuacin de estandarizacin. As:

Para calcular los dems valores de los lmites, la probabilidad se va acumulando de 0.125 en 0.125 hasta llegar al final. Los limites se hallaron con exactitud por medio de la funcin de Excel =Inv.norm(p;media;desv_estandar). a. Plantee la prueba de hiptesis.

b. Identifique el estadstico de prueba con su distribucin y calclelo.

c. Grafique la distribucin del estadstico de prueba, identifique la regin crtica y el punto crtico. Adicionalmente, ubique el valor del estadstico de prueba.

d. Concluya en trminos del problema.No existe evidencia estadstica para rechazar la hiptesis de que el tiempo que un estudiante universitario dedica a las redes sociales en un da se distribuya normalmente.Punto 5. Regresin Lineala. Plantee el modelo de regresin lineal mltiple en trminos de los distintos .

.....

Modelo conceptual: Modelo Estimado: b. Utilice SPSS para encontrar el valor de los parmetros del modelo. Debe colocar un pantallazo del resultado arrojado por SPSS e indicar por aparte en el informe cules son los valores correspondientes de cada .

c. Indique si el modelo es globalmente significativo con un = 5%. Debe presentar en el informe la hiptesis nula, la hiptesis alterna, el estadstico de prueba, la regin de rechazo y la conclusin sobre la significancia global del modelo a partir de la prueba realizada.

El valor arrojado como significancia por el programa nos indica que este (su rea de probabilidad) est dentro de la regin de rechazo de Ho (dentro de 0,05) marcada por , por lo cual:A partir de la prueba realizada, existe evidencia estadstica para rechazar la hiptesis de que el modelo planteado no es globalmente significativo (Ho). Al menos un .

d. Concluya sobre la significancia global del modelo a partir del P-Value. Justifique claramente su respuesta.

A partir del P-Value sabemos que el rea bajo la curva a partir del estadstico de prueba es menor al rea general de rechazo a partir del punto crtico sealado por la significancia.

Por lo anterior, existe evidencia estadstica para rechazar la hiptesis de que el modelo planteado no es globalmente significativo (Ho). Al menos un . e. Presente en el informe el valor del P-value de la prueba de significancia individual de cada y concluya respecto a las variables que son significativas en el modelo para explicar la variable Contenido de SO2 en el aire. Utilice = 0.05.

.

f. Cmo cambian los P-value de la prueba de significancia individual de cada si ahora se utiliza una significancia () del 10%? Qu variables son ahora significativas en el modelo para explicar la variable Contenido de SO2 en el aire?

Cambiando el nivel de significancia del 5% al 10 % se pudo determinar que los p-value para cada se mantuvieron constantes.

.

15