Estadística Trabajo Final 440003001

Embed Size (px)

Citation preview

  • TRABAJO DE

    INVESTIGACION Ing. Patricia Razo

    MATERIA PROBABILIDAD Y ESTADSTICA

    ALUMNO IBRAHIM NIO ALVAREZ 440003001

  • 1

    TEMA PGINA

    Qu es la estadstica? 2

    El uso de la Estadstica 2

    Qu industrias emplean Estadsticos? 3

    Tcnicas de utilizadas por la estadstica 4

    Promedio estadstica 4

    Probabilidades 4

    Hiptesis Alternativa 4

    Hiptesis nula 4

    Axiomas de probabilidad 5

    Distribucin binomial 5

    Desviacin estndar (SD) 5

    Teorema binomial 5

    Bimodal 6

    La mediana 6

    Media Geomtrica 6

    Media Aritmtica 6

    Regla de Bayes 6

    Variacin Chance, error oportunidad 6

    Ley de los Promedios 7

    Argumento lgico 7

    Margen de error 8

    Distribucin de probabilidad marginal 8

    Parmetro 9

    Particin 9

    Permutacin 9

    Distribucin de Poisson 10

    Poblacin 10

    Media poblacional 10

    Porcentaje de la poblacin 10

    Poblacin Desviacin Estndar 10

    Distribucin de probabilidad 11

    Muestra 11

    Media de la muestra 12

    Porcentaje de la muestra 12

    Desviacin estndar de muestra, S 12

    Conclusin 13

  • 2

    INTRODUCCIN A LA ESTADSTICA

    Qu es la estadstica?

    La estadstica es la ciencia del aprendizaje a partir de los datos y de medicin, control y comunicacin de

    la incertidumbre; y por lo tanto proporciona la navegacin esencial para controlar el curso de los avances

    cientficos y sociales (Davidianos, M. y Louis, TA, 10.1126/science.1218685).

    Estadsticos aplican el pensamiento y los mtodos estadsticos para una amplia variedad de actividades

    cientficas, sociales y de negocios en reas tales como la astronoma, la biologa, la educacin, la

    economa, la ingeniera, la gentica, la comercializacin, la medicina, la psicologa, la salud pblica, el

    deporte, entre otras muchas. "La mejor cosa sobre ser un estadstico es que se llega a jugar en el patio

    trasero de todos los dems." (John Tukey, Laboratorios Bell, de la Universidad de Princeton)

    Muchas de las decisiones econmicas, sociales, polticas y militares no se pueden hacer sin las tcnicas

    estadsticas, tales como el diseo de experimentos para obtener la aprobacin federal de un frmaco de

    nueva fabricacin.

    El uso de la Estadstica

    Utilizar los datos para resolver problemas en una amplia variedad de campos

    Aplicar los conocimientos matemticos y estadsticos a los problemas sociales, econmicos,

    mdicos, polticos y ecolgicos

    Trabajar de forma individual y / o como parte de un equipo interdisciplinario

    Viaja a consultar con otros profesionales o asistir a conferencias, seminarios y actividades de

    formacin permanente

    Haga avanzar las fronteras de la estadstica, las matemticas, y la probabilidad mediante la

    educacin y la investigacin

  • 3

    Qu industrias emplean Estadsticos?

    Estadsticas proporciona el razonamiento y mtodos para la produccin y la comprensin de los datos.

    Los estadsticos son especialistas, pero las estadsticas demandas sean generalistas, tambin. Una de las

    ventajas de trabajar en las estadsticas es que se puede combinar su inters con casi cualquier otro campo

    de la ciencia, la tecnologa, o de negocios.

    Salud y Medicina

    Animal Salud

    Bioestadstica

    Ensayos clnicos

    Epidemiologa

    Gentica

    Farmacologa

    Salud Pblica

    Negocios e Industria

    Agricultura

    Qumica

    Ciencias de la Computacin

    Economa Ingeniera Finanzas Seguros Manufactura Marketing de Mejoramiento de la Calidad

    Confiabilidad

    Gobierno

    Censo

    Ecologa

    Forestal

    Regulacin Gubernamental Ley de Defensa Nacional de Investigacin Demogrfica de evaluacin

    de riesgos Encuestas

  • 4

    TCNICAS DE UTILIZADAS POR LA ESTADSTICA

    Promedio

    Un trmino que a veces vaga. Por lo general, indica la media aritmtica, pero tambin puede denotar la

    mediana, el modo, la media geomtrica, y medios ponderados, entre otras cosas.

    Probabilidades

    Las probabilidades a favor de un evento es la relacin de la probabilidad de que el evento se produce a la

    probabilidad de que el evento no se produce. Por ejemplo, supongamos que un experimento puede dar

    lugar a cualquiera de n resultados posibles, todas igualmente probables, y que k de los resultados da lugar

    a una "victoria" y n - k resultado en una "prdida". A continuacin, la oportunidad de ganar es k / n ; la

    posibilidad de no ganar es ( n - k ) / n ; y las probabilidades a favor de ganar son ( k / N ) / ( ( n - k ) / n ) =

    K / ( n-k ), que es el nmero de resultados favorables dividido por el nmero de resultados desfavorables.

    Tenga en cuenta que las probabilidades no son sinnimo de probabilidad, pero los dos se pueden convertir

    de ida y vuelta. Si las probabilidades a favor de un evento son q , entonces la probabilidad del evento es

    q / (1 + q ). Si la probabilidad de un evento es p , las probabilidades a favor del evento son p / (1 - p ) y las

    probabilidades en contra del evento son: (1 - p ) / p .

    Hiptesis Alternativa

    En la prueba de hiptesis, una hiptesis nula (tpicamente de que no hay ningn efecto) se compara con

    una hiptesis alternativa (tpicamente de que hay un efecto, o que hay un efecto de un signo particular).

    Por ejemplo, al evaluar si un nuevo medicamento para el cncer funciona, la hiptesis nula normalmente

    sera que el remedio no funciona, mientras que la hiptesis alternativa sera que el remedio funciona.

    Cuando los datos son suficientemente improbable bajo el supuesto de que la hiptesis nula es verdadera,

    la hiptesis nula se rechaza en favor de la hiptesis alternativa.

    Hiptesis nula

    En la prueba de hiptesis, la hiptesis de que desean falsificar sobre la base de los datos. La hiptesis nula

    es tpicamente de que algo no est presente, que no hay ningn efecto, o que no hay ninguna diferencia

    entre el tratamiento y el control.

  • 5

    Axiomas de probabilidad

    Hay tres axiomas de probabilidad: Lo ms probable es siempre por lo menos igual a cero. La probabilidad

    de que algo ocurra es del 100%. Si dos eventos no pueden ocurrir tanto en el mismo tiempo (si son

    disjuntos o mutuamente excluyentes), la probabilidad de que sea uno ocurre es la suma de las

    probabilidades de que se produce cada uno. Por ejemplo, consideremos un experimento que consiste en

    lanzar una moneda una vez. El primer axioma dice que la probabilidad de que la moneda cae cara, por

    ejemplo, debe ser al menos igual a cero. El segundo axioma dice que la probabilidad de que la moneda

    cae cara o bien tierras colas o tierras en su borde o no aterriza en todo es 100%. El tercer axioma dice que

    la probabilidad de que la moneda cae cara o bien sale cruz es la suma de la probabilidad de que la moneda

    cae cara y la posibilidad de que sale cruz, porque ambos no pueden ocurrir en el mismo sorteo. Todos los

    otros hechos matemticos sobre probabilidad se pueden derivar de estos tres axiomas. Por ejemplo, es

    cierto que la probabilidad de que un evento no se produce es (100% - la posibilidad de que se produzca el

    evento). Esto es una consecuencia de las segunda y tercera axiomas.

    Distribucin binomial

    Una variable aleatoria tiene una distribucin binomial (con parmetros n y p ) si es el nmero de "xitos"

    en un nmero fijo n de independientes ensayos aleatorios, todos los cuales tienen la misma probabilidad

    p de que resulta en "xito". Bajo estos supuestos, la probabilidad de k xitos (y n-k fracasos) es n C k p k

    (1 -p ) n-k , donde n C k es el nmero de combinaciones de n objetos tomados de k en un momento: n C k

    = n ! / ( k ! ( n-k )!). El valor esperado de una variable aleatoria con la distribucin binomial es n p , y el

    error estndar de una variable aleatoria con la distribucin binomial es ( n p (1 - p ) ) . Esta pgina

    muestra el histograma de probabilidad del distribucin binomial.

    Desviacin estndar (SD)

    La desviacin estndar de un conjunto de nmeros es el valor eficaz del conjunto de las desviaciones entre

    cada elemento del conjunto y de la media del conjunto.

    Teorema binomial

    El teorema binomial dice que (x + y) n = x n + nx n-1 y + ... + n C k x n-k y k + ... + y n .

    Bimodal

    Tener dos modos.

  • 6

    La mediana

    "Valor medio" de una lista. El nmero ms pequeo tal que por lo menos la mitad de los nmeros de la

    lista no son mayores que l. Si la lista tiene un nmero impar de entradas, la mediana es la media de

    entrada en la lista despus de ordenar la lista en orden creciente. Si la lista tiene un nmero par de

    entradas, la mediana es el menor de los dos nmeros centrales despus de la clasificacin. La mediana

    puede estimarse a partir de un histograma por encontrar el nmero ms pequeo de tal manera que el

    rea bajo el histograma a la izquierda de ese nmero es 50%.

    Media Geomtrica

    La media geomtrica de n nmeros { x 1 , x 2 , x 3 , ..., x n } es el n de la raz de su producto:

    ( x 1 x 2 x 3 ... x n ) 1 / n .

    Media Aritmtica

    La suma de una lista de nmeros, dividido por el nmero de nmeros.

    Regla de Bayes

    La regla de Bayes expresa la probabilidad condicional del evento A dado el evento B en trminos de la

    probabilidad condicional del evento B dado el evento A y la probabilidad incondicional de A:

    P (A | B) = P (B | A) P (A) / ( P (B | A) P (A) + P (B | A c ) P (A c ) )

    En esta expresin, la probabilidad incondicional de A tambin se conoce como la probabilidad previa de

    una, porque es la probabilidad asignada a A antes de la observacin de los datos. Del mismo modo, en

    este contexto, P (A | B) se llama la probabilidad posterior de A dado B , porque es la probabilidad de un

    actualizado para reflejar (es decir, para condicionar en) el hecho de que B se observ que se produzca.

    Variacin Chance, error oportunidad

    Una variable aleatoria se puede descomponer en una suma de su valor esperado variacin y posibilidades

    en torno a su valor esperado. El valor esperado de la variacin al azar es cero; el error estndar de la

  • 7

    variacin de oportunidad es el mismo que el error estndar de la variable aleatoria-el tamao de una

    diferencia "tpico" entre la variable aleatoria y su valor esperado. Ver tambin el error de muestreo.

    Ley de los Promedios

    La Ley de los Promedios dice que el promedio de independientes observaciones de variables aleatorias

    que tienen la misma distribucin de probabilidad es cada vez ms probable para estar cerca del valor

    esperado de las variables aleatorias como el nmero de observaciones crece. Ms precisamente, si X 1, X

    2 , X 3 , ..., son independientes de las variables aleatorias con la misma distribucin de probabilidad , y E

    (X) es su comn valor esperado , entonces para cada nmero > 0,

    P {| (X 1 + X 2 + ... + X n ) / n - E (X) |

  • 8

    Margen de error

    Una medida de la incertidumbre en una estimacin de un parmetro; por desgracia, no todo el mundo

    est de acuerdo en lo que debe significar. El margen de error de una estimacin es tpicamente una o dos

    veces el estimado el error estndar de la estimacin.

    Distribucin de probabilidad marginal

    La distribucin de probabilidad marginal de una variable aleatoria que tiene una distribucin de

    probabilidad conjunta con algunas otras variables aleatorias es la distribucin de probabilidad de que la

    variable aleatoria sin tener en cuenta los valores que las otras variables aleatorias toman. La distribucin

    marginal de una variable aleatoria discreta X 1 que tiene una distribucin conjunta con otras variables

    aleatorias discretas se puede encontrar a partir de la distribucin conjunta sumando sobre todos los

    valores posibles de las otras variables. Por ejemplo, supongamos que dos dados justos de forma

    independiente. Vamos X 1 sea el nmero de puntos que se muestran en la primera matriz, y sea X 2 ser

    el nmero total de puntos que se muestran en los dos dados. A continuacin, la distribucin conjunta de

    X 1 y X 2 es la siguiente:

    P (X 1 = 1, X 2 = 2) = P (X 1 = 1, X 2 = 3) = P (X 1 = 1, X 2 = 4) = P (X 1 = 1, X 2 = 5 ) = P (X 1 = 1, X 2 = 6) = P

    (X 1 = 1, X 2 = 7) =

    P (X 1 = 2, X 2 = 3) = P (X 1 = 2, X 2 = 4) = P (X 1 = 2, X 2 = 5) = P (X 1 = 2, X 2 = 6 ) = P (X 1 = 2, X 2 = 7) = P (X

    1 = 2, X 2 = 8) = ...

    ... P (X 1 = 6, X 2 = 7) = P (X 1 = 6, X 2 = 8) = P (X 1 = 6, X 2 = 9) = P (X 1 = 6, X 2 = 10) = P (X 1 = 6, X 2 = 11) =

    P (X 1 = 6, X 2 = 12) = 1/36.

    La distribucin de probabilidad marginal de X 1 es

    P (X 1 = 1) = P (X 1 = 2) = P (X 1 = 3) = P (X 1 = 4) = P (X 1 = 5) = P (X 1 = 6) = 1 / 6.

    Podemos comprobar que la probabilidad marginal de que X 1 = 1 es de hecho la suma de la distribucin

    de probabilidad conjunta sobre todos los valores posibles de X 2 para el que X 1 = 1 :

    P (X 1 = 1) = P (X 1 = 1, X 2 = 2) + P (X 1 = 1, X 2 = 3) + P (X 1 = 1, X 2 = 4) + P (X 1 = 1, X 2 = 5) + P (X 1 = 1, X

    2 = 6) + P (X 1 = 1, X 2 = 7) = 6/36 = 1/6.

  • 9

    Del mismo modo, la distribucin de probabilidad marginal de X 2 es

    P (X 2 = 2) = P (X 2 = 12) = 1/36

    P (X 2 = 3) = P (X 2 = 11) = 1/18

    P (X 2 = 4) = P (X 2 = 10) = 3/36

    P (X 2 = 5) = P (X 2 = 9) = 1/9

    P (X 2 = 6) = P (X 2 = 8) = 5/36

    P (X 2 = 7) = 1/6.

    Una vez ms, podemos comprobar que la probabilidad marginal de que X 2 = 4 es 3/36 mediante la adicin

    de las probabilidades conjuntas para todos los valores posibles de X 1 para el que X 2 = 4 :

    P (X 2 = 4) = P (X 1 = 1, X 2 = 4) + P (X 1 = 2, X 2 = 4) + P (X 1 = 3, X 2 = 4) = 3/36 .

    Parmetro

    Una propiedad numrica de una poblacin, como su media.

    Particin

    Una particin de un evento A es una coleccin de eventos {A 1 , A 2 , A 3 , ...} tal que los acontecimientos

    de la coleccin son disjuntos , y su unin es una . Es decir,

    A j A k = {} a menos que j = k , y

    A = A 1 A 2 A 3 ....

    Permutacin

    Una permutacin de un conjunto es una disposicin de los elementos del conjunto en algn orden. Si el

    conjunto tiene n las cosas en ella, hay n ! diferentes ordenamientos de sus elementos. Para el primer

    elemento en un ordenamiento, hay n posibles opciones, para el segundo, sigue habiendo N -1 posibles

    opciones, para la tercera, hay N -2, etc ., y para el n -simo elemento de la ordenacin, hay est quedando

    una sola opcin. Por la regla fundamental de conteo, el nmero total de secuencias es, pues, n ( n -1)

    ( n -2) ... 1. Del mismo modo, el nmero de ordenamientos de longitud k se puede formar a partir de

  • 10

    N k cosas se N ( n -1) ( N -2) ... ( n - k 1) = n ! / ( n-k ) !. Esto se denota N P K , el nmero de

    permutaciones de n cosas tomada k en un momento.

    Distribucin de Poisson

    Es una discreta distribucin de probabilidad que depende de un parmetro, m. Si X es una variable

    aleatoria con la distribucin de Poisson con parmetro m, entonces la probabilidad de que X = K es

    E - m m k / k !, k = 0, 1, 2, ...,

    Poblacin

    Una coleccin de las unidades objeto de estudio. Unidades pueden ser personas, lugares, objetos, pocas,

    medicamentos, procedimientos o muchas otras cosas. Gran parte de la estadstica se refiere a la

    estimacin de las propiedades numricas (parmetros) de una poblacin entera de una muestra aleatoria

    de las unidades de la poblacin.

    Media poblacional

    La media de los nmeros en una poblacin numrica. Por ejemplo, la media de la poblacin de una caja

    de boletos numerados es la media de la lista formada por todos los nmeros en todas las entradas. La

    media de la poblacin es un parmetro.

    Porcentaje de la poblacin

    El porcentaje de unidades en una poblacin que poseen una propiedad especificada. Por ejemplo, el

    porcentaje de una determinada coleccin de los votantes registrados que estn registrados como

    republicanos. Si cada unidad que posee la propiedad est marcada con "1", y cada unidad que no posee

    la propiedad est marcada con "0", el porcentaje de la poblacin es la misma que la media de esa lista de

    ceros y unos; es decir, el porcentaje de la poblacin es la media de poblacin para una poblacin de ceros

    y unos. El porcentaje de la poblacin es un parmetro.

    Poblacin Desviacin Estndar

    La desviacin estndar de los valores de una variable de una poblacin. Se trata de un parmetro, no una

    estadstica la desviacin estndar de la muestra.

  • 11

    Distribucin de probabilidad

    La distribucin de probabilidad de una variable aleatoria especifica la probabilidad de que la variable toma

    un valor en cualquier subconjunto de los nmeros reales. (. Los subconjuntos tienen que satisfacer algunas

    condiciones tcnicas que no son importantes para este curso) La distribucin de probabilidad de una

    variable aleatoria est completamente caracterizado por la funcin de distribucin de probabilidad

    acumulativa; los trminos a veces se utilizan como sinnimos. La distribucin de probabilidad de una

    discreta variable aleatoria puede ser caracterizada por la posibilidad de que la variable aleatoria toma

    cada uno de sus valores posibles. Por ejemplo, la distribucin de probabilidad de que el nmero total de

    puntos S muestran en la tirada de dos dados justos se puede escribir como una tabla:

    La distribucin de probabilidad de una continua variable aleatoria puede ser caracterizada por su funcin

    de densidad de probabilidad.

    s P (S = s)

    2 1/36

    3 2/36

    4 3/36

    5 4/36

    6 5/36

    7 6/36

    8 5/36

    9 4/36

    10 3/36

    11 2/36

    12 1/36

    Muestra

    Una muestra es una coleccin de unidades de una poblacin.

  • 12

    Media de la muestra

    La aritmtica media de una muestra aleatoria de una poblacin. Es una estadstica utilizada para estimar

    la media de poblacin . Supongamos que hay hay n de datos, { x 1 , x 2 , ..., x n }. La media muestral es ( x

    1 + x 2 + ... + x n ) / n . El valor esperado de la media de la muestra es la media de poblacin . Para el

    muestreo con reemplazo, el SE de la media de la muestra es la poblacin desviacin estndar dividida por

    la raz cuadrada del tamao de la muestra . Para el muestreo sin reemplazo, el SE de la media de la muestra

    es la correccin finito-poblacin ( ( N-n ) / ( N -1) ) veces el SE de la media muestral para el muestreo

    con reemplazo, con N el tamao de la poblacin y N el tamao de la muestra.

    Porcentaje de la muestra

    El porcentaje de una muestra aleatoria con una determinada propiedad, como por ejemplo el porcentaje

    de votantes registrados como demcratas en una muestra aleatoria simple de los votantes. La media de

    la muestra es una estadstica utilizada para estimar el porcentaje de la poblacin. El valor esperado del

    porcentaje de la muestra a partir de una muestra aleatoria simple o una muestra aleatoria con el

    reemplazo es el porcentaje de la poblacin. El SE del porcentaje de la muestra para el muestreo con

    reemplazo es ( p (1 - p ) / n ) , donde p es el porcentaje de la poblacin y n es el tamao de la muestra.

    El SE del porcentaje de la muestra para el muestreo sin reemplazo es la correccin finito-poblacin ( ( N-

    n ) / ( N -1) ) veces el SE del porcentaje de la muestra para el muestreo con reemplazo, con N el tamao

    de la poblacin y N el tamao de la muestra. El SE del porcentaje de la muestra a menudo se calcula por

    el arranque.

    Desviacin estndar de muestra, S

    La desviacin estndar de la muestra S es un estimador de la desviacin estndar de una poblacin basada

    en una muestra aleatoria de la poblacin. La desviacin estndar de la muestra es una estadstica que

    mide la "hacia fuera" de la muestra es de alrededor de la media muestral. Es muy similar a la desviacin

    estndar de la muestra, pero en lugar de un promedio de los cuadrados de las desviaciones (Para obtener

    el valor eficaz de las desviaciones de los datos de la media muestral) se divide la suma de las desviaciones

    al cuadrado de (nmero de datos - 1 ) antes de tomar la raz cuadrada. Supongamos que hay n de datos,

    { x 1 , x 2 , ..., x n }, con una media M = ( x 1 + x 2 + ... + x n ) / n . Entonces

    s = ( (( x 1 - M ) 2 + ( x 2 - M ) 2 + ... + ( x n - M ) 2 ) / ( n -1) )

  • 13

    CONCLUSIN

    Los estadsticos proporcionan una gua crucial para determinar qu informacin es fiable y que las

    predicciones se puede confiar. Ellos a menudo ayudan a la bsqueda de pistas sobre la solucin de un

    misterio cientfico y, a veces mantener los investigadores de ser engaados por falsas impresiones. Como

    se vio en ejemplos y ejercicios durante el curso de esta materia, pudimos aplicar y crear nuestras propias

    conclusiones del uso de las distintas tcnicas.

    Como herramienta bsica dentro de las estadsticas es el uso de la calculadora cientfica, pues no facilita

    y proporciona mayos facilidad al momento de procesar la informacin.