88
UNIVERSIDAD GRAN MARISCAL DE AYACUCHO ESCUELA DE ADMINISTRACIÒN CATEDRA ESTADISTICA SEDE EL TIGRE VARIABLE ALEATORIA DOCENTE: HAMLET MATA MATA PARTICIPANTE: JENIFER TELIS ELTIGRE / ANZOÀTEGUI

MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,

UNIVERSIDAD GRAN MARISCAL DE AYACUCHO

ESCUELA DE ADMINISTRACIOgraveN

CATEDRA ESTADISTICA

SEDE EL TIGRE

VARIABLE ALEATORIA

DOCENTE HAMLET MATA MATA

PARTICIPANTE JENIFER TELIS

ELTIGRE ANZOAgraveTEGUI

INTRODUCCIOacuteN

A menudo se presenta la necesidad de calcular el nuacutemero de maneras

distintas en que un suceso se presenta o puede ser realizado Otras veces es

importante determinar la probabilidad de ocurrencia de un evento especiacutefico En

ambos casos se apela al sentido comuacuten o se establecen meacutetodos que permitan

sistematizar tales caacutelculos Con frecuencia el sentido comuacuten ayuda a entender por

queacute se eligioacute un procedimiento dado mientras que la formalizacioacuten del caacutelculo las

viacuteas para encontrar las soluciones apropiadas

A la hora de contrastar nuestra hipoacutetesis nula de partida varios factores

van a determinar la prueba estadiacutestica que utilizaremos y se refieren al nuacutemero

tipo y distribucioacuten de las variables y a la forma en que se eligioacute el estudio

La matemaacutetica nacioacute de la necesidad de contar y ordenar disentildear modelos

eficientes en un medio cada vez maacutes complejo y simplificar una variedad

inmensa de informacioacuten es el drama de nuestro tiempo

Con la realizacioacuten de este trabajo pudimos conocer la importancia de la

Estadiacutestica en todos los campo que componen la sociedad tambieacuten pudimos

conocer que es un valor esperado variables aleatorias como se dividen

distribucioacuten simeacutetrica distribucioacuten sesgada distribucioacuten de probabilidad y su

uso distribucioacuten discreta definicioacuten caracteriacutesticas ejemplo distribucioacuten

Bernoulli Exponencial Multinomial Uniforme Binomial y Binomial negativa

Poisson Geomeacutetrica Hipergeometrica y Zeta Tambieacuten pudimos conocer sobre

la Teoriacutea combinatoria Variacioacuten y la Combinacioacuten

PRUEBAS PARAMEacuteTRICAS

Porque comparan los grupos a traveacutes de una medida de tendencia central

(paraacutemetro) la media aritmeacutetica Como vemos este valor adquiere una vital

importancia

Mientras que las pruebas que suponen una distribucioacuten de probabilidad

determinada para los datos se denominan pruebas parameacutetricas

Dentro de las pruebas parameacutetricas las maacutes habituales se basan en la

distribucioacuten de probabilidad normal y al estimar los paraacutemetros del modelo se

supone que los datos constituyen una muestra aleatoria de esa distribucioacuten por lo

que la eleccioacuten del estimador y el caacutelculo de la precisioacuten de la estimacioacuten

elementos baacutesicos para construir intervalos de confianza y contrastar hipoacutetesis

dependen del modelo probabiliacutestico supuesto

Cuando un procedimiento estadiacutestico es poco sensible a alteraciones en el

modelo probabiliacutestico supuesto es decir que los resultados obtenidos son

aproximadamente vaacutelidos cuando eacuteste variacutea se dice que es un procedimiento

robusto

Las inferencias en cuanto a las medias son en general robustas por lo que

si el tamantildeo de muestra es grande los intervalos de confianza y contrastes

basados en la t de Student son aproximadamente vaacutelidos con independencia de la

verdadera distribucioacuten de probabilidad de los datos pero si eacutesta distribucioacuten no es

normal los resultados de la estimacioacuten seraacuten poco precisos

iquestEn queacute condiciones la media es realmente un valor representativo de una serie de

datos Como sabemos existen otras medidas de tendencia central que seguacuten la

distribucioacuten de los datos pueden llegar a ser maacutes representativas Cuando los

datos siguen una distribucioacuten normal la media actuacutea como una buena medida

resumen Recordemos algunas de las caracteriacutesticas de esta distribucioacuten

Viene determinada por dos paraacutemetros la media (micro) y la desviacioacuten tiacutepica () Es

acampanada y simeacutetrica alrededor de la media

Recordemos que por ejemplo si se cumplen los supuestos de

normalidad (fig 1)

El valor de la micro plusmn 1 incluiraacute aproximadamente el 683 central de las

observaciones

El valor de la micro plusmn 2 incluiraacute aproximadamente el 953 central de las

observaciones

El valor de la micro plusmn 3 incluiraacute praacutecticamente todas las observaciones el

997

Conocidas la micro y la se puede reconstruir la distribucioacuten de las

observaciones

La igualdad de variancias es el otro gran obstaacuteculo que deberemos salvar

Dos distribuciones pueden tener el mismo valor en el paraacutemetro media mostrando

el primer valor cercano a la media (poca dispersioacuten variancia pequentildea) y la

segunda valores alejados de dicho paraacutemetro (maacutes dispersioacuten gran variancia)

Como vemos estas dos variables siguen diferentes patrones aunque tienen en

comuacuten el mismo valor de la media (fig 2)

iquestPor queacute tienen estas asunciones Las pruebas parameacutetricas asumen que

los datos de las variables a comparar se distribuyen de igual forma pero que entre

ellos existe un desplazamiento fijo es decir para cada valor de una muestra hay

un valor igual pero incrementado en un valor constante (K) al que podriacuteamos

llamar desplazamiento (fig 3) Si este valor constante se acerca al valor 0 no

habriacutea diferencias entre los grupos ya que existiriacutea un solapamiento entre los

valores a comparar Cuanto maacutes se aleje del valor 0

mayores seraacuten las diferencias

Obseacutervese la importancia de asumir que este valor de desplazamiento de

una muestra a la otra es constante Si estamos comparando dos diferentes

tratamientos por ejemplo un placebo y un principio activo en dos muestras que

son homogeacuteneas basalmente este valor K seraacute el efecto que podremos imputar al

principio activo en cada caso la diferencia entre medias representa no el efecto

promedio sino el efecto del tratamiento en cada caso Si por el contrario este

efecto no fuera constante ya no se cumpliriacutean los supuestos de estas pruebas

Fig 1

Fig 2

Fig 3

Dentro de las pruebas parameacutetricas se tienen para muestras grandes y para

muestras pequentildeas Un supuesto que se aplica a ambas es que la muestra que se

toma debe haber sido seleccionada en forma aleatoria o probabiliacutestica En las

pruebas parameacutetricas de muestra pequentildea se requiere el supuesto de que las

muestras fueron extraiacutedas de una poblacioacuten con distribucioacuten normal y cuando se

trata de dos o maacutes muestras tambieacuten se requiere una prueba de igualdad de

varianzas Existen pruebas estadiacutesticas por medio de las cuales se podriacutea

comprobar esto sin embargo suele no daacutersele importancia a esto y se pasa por

alto El anaacutelisis de varianza tambieacuten se basa en el supuesto de normalidad de las

poblaciones y en el de que sus varianzas son iguales

En las pruebas en las que se tienen menos supuestos es en las de muestra

grande las cuales se pueden aplicar sin saber o comprobar si la poblacioacuten o

poblaciones eran normales estas pruebas se dice que son robustas porque no es

necesario que se cumpla dicho supuesto Cuando la prueba que se requiere no es

robusta no es necesario correr el riesgo de estar equivocados en las conclusiones

en ellos En cambio se dispone de muchas pruebas estadiacutesticas no parameacutetricas

que tienen una aplicacioacuten semejante a las parameacutetricas de muestra pequentildea en las

que se tienen menos supuestos

PRUEBAS NO PARAMEacuteTRICAS

Se denominan pruebas no parameacutetricas aquellas que no presuponen una

distribucioacuten de probabilidad para los datos por ello se conocen tambieacuten como de

distribucioacuten libre (distribution free) En la mayor parte de ellas los resultados

estadiacutesticos se derivan uacutenicamente a partir de procedimientos de ordenacioacuten y

recuento por lo que su base loacutegica es de faacutecil comprensioacuten Cuando trabajamos

con muestras pequentildeas (n lt 10) en las que se desconoce si es vaacutelido suponer la

normalidad de los datos conviene utilizar pruebas no parameacutetricas al menos para

corroborar los resultados obtenidos a partir de la utilizacioacuten de la teoriacutea basada en

la normal

Cuando se analizan datos medidos por una variable cuantitativa continua

las pruebas estadiacutesticas de estimacioacuten y contraste frecuentemente empleadas se

basan en suponer que se ha obtenido una muestra aleatoria de una distribucioacuten de

probabilidad de tipo normal o de Gauss Pero en muchas ocasiones esta

suposicioacuten no resulta vaacutelida y en otras la sospecha de que no sea adecuada no

resulta faacutecil de comprobar por tratarse de muestras pequentildeas En estos casos

disponemos de dos posibles mecanismos los datos se pueden transformar de tal

manera que sigan una distribucioacuten normal o bien se puede acudir a pruebas

estadiacutesticas que no se basan en ninguna suposicioacuten en cuanto a la distribucioacuten de

probabilidad a partir de la que fueron obtenidos los datos y por ello se denominan

pruebas no parameacutetricas (distribution free)

La mayoriacutea de las pruebas de hipoacutetesis requieren suposiciones especiacuteficas

acerca de la poblacioacuten o poblaciones que se muestran En muchos casos debemos

suponer que las poblaciones tienen maacutes o menos la forma de distribuciones

normales o que se conocen sus varianzas o se sabe que son iguales o bien que las

muestras son independientes Como hay muchos casos donde no se pueden

cumplir estas suposiciones los estadiacutesticos han generado teacutecnicas alternativas

basadas en suposiciones menos estrictas que se han dado a conocer como

ldquoPruebas no parametricasrdquo

En estos casos se emplea como paraacutemetro de centralizacioacuten la mediana

que es aquel punto para el que el valor de X estaacute el 50 de las veces por debajo y

el 50 por encima

Propiedades

1 No se relacionan con el estudio de un paraacutemetro de la poblacioacuten

Por lo general cuando se hace referencia a pruebas no parameacutetricas se puede estar

hablando tanto de las no parameacutetricas como de las libres de distribucioacuten

(distribution free tests)

Las dos indicaciones maacutes importantes que se deben tener en cuenta para utilizar

una prueba no parameacutetrica son que

1 la distribucioacuten de la poblacioacuten no sea normal

2 la escala de medicioacuten de la variable en cuestioacuten sea categoacuterica

Los meacutetodos no parameacutetricos son menos poderosos que los parameacutetricos Esto

quiere decir que es maacutes difiacutecil rechazar la hipoacutetesis nula con las pruebas no

parameacutetricas

Por esa razoacuten los estadiacutesticos por lo general recurren a los meacutetodos no

parameacutetricos soacutelo cuando los datos no cumplen con los supuestos parameacutetricos

Sin embargo hay problemas de investigacioacuten en los que las variables categoacutericas

son las indicadas y por lo tanto soacutelo un meacutetodo no parameacutetrico es el indicado Los

pasos en las pruebas de hipoacutetesis no parameacutetricas son los mismos de las

parameacutetricas Los cambios por lo general se limitan a cambios en la foacutermula para

obtener el valor observado y en la tabla que se utiliza Pero se habla de hipoacutetesis

nula nivel de significacioacuten error tipo I y tipo II etc

El uso de meacutetodos no parametricos ofrece numerosas ventajas

1 los meacutetodos no parametricos se pueden usar con todo tipos de datos

ndash informacioacuten cualitativa (de escala nominal) informacioacuten en forma de rangos

(escala ordinal) asiacute como informacioacuten medida de un modo mas exacto (escala de

intervalo o de razoacuten)

2 por lo general son faacuteciles de aplicar y raacutepidos de calcular con

tamantildeos pequentildeos de muestra En ocasiones son tan sencillos que basta contar

con la frecuencia con que algunas caracteriacutesticas aparecen en los datos Por lo

tanto a menudo se usan para estudios piloto o preliminares yo en situaciones en

que se desean respuestas raacutepidas

3 hacen menos premisas menos estrictas (mas faacuteciles de cumplir) que

los procedimientos claacutesicos por lo tanto gozan de mayor aplicabilidad y

proporcionan un conjunto de conclusiones mas generales de base mas amplia

4 permiten solucionar problemas que no implican pruebas de

paraacutemetros de poblacioacuten

5 son mas econoacutemicos que los procedimientos claacutesicos ya que el

investigador puede aumentar la potencia y a pesar de ello ahorrar dinero tiempo y

trabajo al recopilar muestras de datos mayores medibles con mas aproximacioacuten

lo que soluciona con mayor rapidez el problema

6 seguacuten el procedimiento seleccionado los meacutetodos no parametricos

pueden ser tan poderosos (o casi tanto) como el procesamiento claacutesico cuando se

cumplen las premisas de este ultimo y quizaacutes sean un poco mas poderosos aun

cuando no se cumplan

Los procedimientos no parametricos tambieacuten ofrecen algunas desventajas

1 no conviene usar meacutetodos no parametricos cuando se pueden

cumplir todas las premisas de los procedimientos claacutesicos y los datos se miden en

una escala bien sea de intervalos de razones A menos de que se empleen

procedimientos claacutesicos en estos casos el investigador no esta aprovechando por

completo los datos Se pierde informacioacuten al convertir datos recopilados (de una

escala de intervalo o de razoacuten) a rangos (escala ordinal) o categoriacuteas (escala

nominal) En particular en esas circunstancias algunas pruebas no parametricas

muy raacutepidas y sencillas tienen mucha menos potencia que los procedimientos

claacutesicos y por lo general se deben evitar

2 seguacuten aumenta el tamantildeo de la muestra en ocasiones el manejo

requerido de datos para los procedimientos no parametricos se hace laborioso a

menos que se disponga de un paquete de computacioacuten adecuado

3 con frecuencia se necesitan tablas especiales de valores

criacuteticos y estas no se obtienen con tanta facilidad como las tablas de los

valores criacuteticos normales t 2X y F Ccedil

Prueba de signos para una sola muestra

Salvo para las pruebas con muestra grande todas las pruebas estaacutendar

concernientes a medias estaacuten basadas en la suposicioacuten de que las poblaciones que

se muestrean tienen aproximadamente la forma de distribuciones normales

Cuando en un caso determinado esta suposicioacuten resulta insostenible la prueba

estaacutendar se puede sustituir por una de varias alternativas no parametricas entre

ellas la ldquoprueba de signosrdquo

La prueba de signos de una sola muestra se aplica cuando se muestrea una

poblacioacuten simeacutetrica continua de manera que la probabilidad de que un valor de la

muestra sea menor que la media o mayor que la media es en ambos casos frac12 Para

probar la hipoacutetesis nula ( O ) contra una hipoacutetesis alternativa apropiada con

base en una muestra aleatoria de tamantildeo n se sustituye cada valor de la muestra

mayor que O por un signo de mas y cada valor de la muestra menor que O por

un signo de menos despueacutes se aprueba la hipoacutetesis nula de que estos signos de

mas y menos son valores de una variable aleatoria que tiene distribucioacuten binomial

con 2

1p (si un valor de la muestra es igual a O simplemente lo rechazamos)

Prueba de suma de rangos

Se puede utilizar cuando se desea probar una hipoacutetesis relacionada a un

paraacutemetro que refleje una tendencia central Cuando no se cumplen las premisas

de la prueba t el procedimiento de Wilcoxon es probable que sea mas potente

para detectar la existencia de diferencias importantes que su contraparte

correspondiente

Para llevar a cabo la prueba de rangos y signos de Wilcoxon se puede

aplicar el siguiente procedimiento de seis pasos

1 para cada partiacutecula en una muestra de n partidas se obtiene un

resultado de diferencia Di

2 despueacutes no se toman en cuenta los signos + y ndash y se obtiene un

grupo de n diferencias absolutas iD

3 se omite de cualquier anaacutelisis adicional cualquier diferencia

absoluta con resultados de 0 con lo cual se obtiene un grupo de n resultados de

diferencias absolutas que no sean cero donde n

4 despueacutes se asignan rangos Ri desde uno hasta n a cada una de las

iD de modo que el resultado de diferencia absoluta mas pequentildeo obtiene una

clasificacioacuten de uno y el mayor de n Por la falta de precisioacuten en el proceso de

medicioacuten si dos o mas iD son iguales a cada una se asigna el ldquorango promediordquo

de los rangos que de lo contrario se les hubieran asignado individualmente si no

hubiera ocurrido la igualdad de los datos

5 ahora se asignan de nuevo el siacutembolo + o el signo ndash a cada uno de

los n rangos de Ri dependiendo de si originalmente Di era positiva o negativa

6 la prueba estadiacutestica de Wilcoxon W se obtiene como la suma de

las clasificaciones +

n

i

iRW1

Para muestras de n 20 se puede utilizar tablas para obtener los valores

criacuteticos de la prueba estadiacutestica W tanto para las pruebas de una cola como de dos

a diversos niveles de significacioacuten Se rechaza la hipoacutetesis nula en una prueba de

dos colas si el valor observado W es igual o excede al valor critico superior o es

igual o inferior al valor critico inferior Se rechaza la hipoacutetesis nula en una prueba

de una cola en direccioacuten positiva si el valor observado W es igual o excede el

valor critico superior Se rechaza la hipoacutetesis nula para una prueba de una cola en

direccioacuten negativa si el valor observado de w es inferior o igual al valor critico

inferior

Para nge20 la prueba estadiacutestica W tiene distribucioacuten aproximadamente

normal y se puede utilizar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis nula

W

WWZ

VARIABLES ALEATORIA Y COMO SE DIVIDEN

Una variable es aleatoria si toma diferentes valores como resultado de un

experimento aleatorio Puede ser discreta o continua Si puede tomar soacutelo un

nuacutemero limitado de valores entonces es una variable aleatoria discreta En el otro

extremo si puede tomar cualquier valor dentro de un intervalo dado entonces se

trata de una variable aleatoria continua

Se puede pensar en una variable aleatoria como un valor o una magnitud

que cambia de una presentacioacuten a otra sin seguir una secuencia predecible Los

valores de una variable aleatoria son los valores numeacutericos correspondientes a

cada posible resultado de un experimento aleatorio

La distribucioacuten de probabilidad de una variable aleatoria proporciona una

probabilidad para cada valor posible y estas probabilidades deben sumar 1

VALOR ESPERADO DE UNA VARIABLE ALEATORIA

El valor esperado es una idea fundamental en el estudio de las distribuciones de

probabilidad

Para obtener el valor esperado de una variable aleatoria discreta se

multiplica cada valor que la variable puede tomar por la probabilidad de

presentacioacuten de ese valor y luego se suman esos productos Es un promedio

pesado de los resultados que se esperan en el futuro El valor esperado pesa cada

resultado posible con respecto a la frecuencia con que se espera se que presente

En consecuencia las presentaciones maacutes comunes tienen asignadas un peso

mayor que las menos comunes

El valor esperado tambieacuten puede ser obtenido a partir de estimaciones

subjetivas En ese caso el valor esperado no es maacutes que la representacioacuten de las

convicciones personales acerca del resultado posible

VARIABLES ALEATORIAS DISCRETAS

Variable que toma un nuacutemero finito o infinito de valores numerables

Sean x1 x2 x3 xn los distintos valores que puede tomar la variable

aleatoria

Y p(x1) p(x2) p(xn) su probabilidad

Los pares de valores (xj p(xj)) constituyen la distribucioacuten de probabilidades de la

variable aleatoria

p(x) se denomina funcioacuten de probabilidad y debe cumplir con las siguientes

propiedades

0 lt p(xj) lt 1 (p(x) es una probabilidad y por lo tanto debe tomar valores

entre 0 y 1)

1)( jxP (la suma de probabilidades repartidas entre todos los valores

de la variable debe ser igual a 1)

De la misma manera que calculamos frecuencias acumuladas podemos acumular

probabilidades obteniendo la funcioacuten de distribucioacuten de probabilidades

Esta funcioacuten representa la probabilidad de que la variable aleatoria sea menor o

igual que un determinado valor

F(xj) = P (X lt xj)

Graacuteficamente la funcioacuten aumenta de a saltos ya que entre dos valores

consecutivos de una variable discreta no puede tomar valores intermedios

VARIABLES ALEATORIAS CONTINUAS

En este caso en lugar de trabajar con la probabilidad de valores

particulares de la variable resulta maacutes apropiado calcular probabilidades

asociadas a intervalos Para distribuir propiedades se usa una funcioacuten que mide

concentracioacuten de probabilidades alrededor de un punto que se denomina

funcioacuten de densidad de probabilidad (fdp) y se denota como f(x)

Una funcioacuten de densidad de probabilidad debe cumplir con las siguientes

propiedades

F(x) gt 0 (la funcioacuten es no negativa para cualquier valor de x f(x) no es

una probabilidad y puede valer maacutes de 1)

el aacuterea bajo la curva de la funcioacuten vale 1)

La funcioacuten de distribucioacuten para una variable aleatoria continua se calcula

F(a) = P(X lt

La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula

P (alt x lt b) = F(b) - F(a)

La probabilidad de que la variable tome un valor particular se puede expresar

como

F(c) - F(c) = 0

DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO

Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia

valores de una variable aleatoria con sus respectivas probabilidades es

decir Probabilidad de x = Funcioacuten de x

Las distribuciones se caracterizan por una foacutermula que determina el tipo de

distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio

muestral

En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una

funcioacuten de la probabilidad que representa los resultados que se van obteniendo en

un experimento aleatorio

Asiacute para un nuacutemero dado x la probabilidad es

A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la

variable X y representa la probabilidad de que la variable tome el valor desde

hasta x

Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de

probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad

Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos

y seraacuten mutuamente excluyentes y su suma es el

suceso por lo que tenemos entonces que

y finalmente

Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos

los valores de la variable aleatoria x conoceremos completamente la distribucioacuten

de probabilidad de la variable

Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten

de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente

Es decir la probabilidad de todo el espacio muestral es 1 tal y como

establece la teoriacutea de la probabilidad y por otra parte

Es decir la probabilidad del suceso nulo es cero

Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de

probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes

praacutectico el uso de la funcioacuten de densidad

En el caso de una variable discreta la distribucioacuten puede describirse

mediante una funcioacuten de probabilidad que para cada valor de x de la variable X

determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de

una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de

distribucioacuten la que para cada valor provee la probabilidad de no ser superado

evidentemente el valor de la funcioacuten de distribucioacuten es igual

a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo

inferior del dominio de la variable hasta x inclusive Lista de los resultados de un

experimento con las probabilidades que se esperariacutean ver asociadas con cada

resultado

Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores

diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12

En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica

Para el caso de 1 solo dado donde todos los valores tienen la misma

probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme

Prueba de aleatoriedad

Con frecuencia se supone que los datos recopilados constituyen una

muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la

utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash

Wolfowitz de corridas de una muestra para aleatoriedadrdquo

Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o

la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos

siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la

partida tiene una propiedad en particular o de la cantidad o magnitud en que se

posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la

sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con

distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente

de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que

la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las

partidas que la preceden o las que la suceden en forma tal que la probabilidad de

su ocurrencia varia de una posicioacuten a otra el proceso no se considera como

aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando

esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en

forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico

Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el

tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico

de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una

prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede

rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la

sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de

una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2

exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por

consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis de aleatoriedad

U

UUZ

donde

U = numero total de corridas

U = valor medio de U 12 21

n

nnU

U = desviacioacuten estaacutendar de U 1

222

2121

nn

nnnnnU

n1 = numero de eacutexitos en la muestra

n2 = numero de fracasos en la muestra

n = tamantildeo de la muestra n = n1 + n2

PRUEBA DE McNEMAR

Suele darse el caso en que se desean comparar las proporciones de los

datos de muestras tomados de poblaciones relacionadas En este caso se quisiera

determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a

alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea

determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y

otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede

utilizar la prueba desarrollada por McNemar

El principal intereacutes es determinar si hay diferencia entre las dos

proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta

que el otro (prueba de una cola)

La prueba estadiacutestica para la prueba de McNemar es

CB

CBZ

PRUEBA U DE MANN ndash WHITNEY

Es una alternativa no parametrica a la prueba t de dos muestras para la

diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula

μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos

la forma de distribuciones normales de hecho la prueba solo requiere que las

poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no

importa si se cumple o no esta suposicioacuten

Estadiacutesticos U1 y U2

111

2112

1 W

nnnnU

222

2122

1 W

nnnnU

PRUEBA DE RACHAS

Son todas las diferencias que tiene el mismo signo y se presentan en una

misma fila Una serie de n diferencias puede tener solamente una racha (toda

positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las

rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de

poblaciones con la misma distribucioacuten de frecuencias Colocamos las

observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces

contamos el numero de rachas item de cada una de las muestras Si hay menos

rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales

rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten

La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de

que las observaciones se han sacado aleatoriamente de una sola poblacioacuten

Para hacer esto se halla la mediana de la muestra y se designa las

observaciones situadas por debajo de la mediana por un signo menos (-) y las

observaciones situadas por encima de la mediana por un signo (+) Si el numero

de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado

rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el

numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10

puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la

tabla normal con

u

uu

z

2

1

12

21

21

NN

NNu

)1()(

2(2

21

2

21

2121212

NNNN

NNNNNNu

DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES

DISTRIBUCIONES DE EJEMPLO Y USO

DISTRIBUCIOacuteN NORMAL O GAUSSIANA

Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que

multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal

Esta distribucioacuten de caracteriza porque los valores se distribuyen formando

una campana de Gauss en torno a un valor central que coincide con el valor

medio de la distribucioacuten

Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a

la izquierda

Esta distribucioacuten viene definida por dos paraacutemetros

X N (m S2)

m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro

de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores

estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores

estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de

ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten

estaacutendar

Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina

normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo

que permiten obtener esos mismos valores donde se recoge la probabilidad

acumulada para cada punto de la curva de esta distribucioacuten

Ademaacutes toda distribucioacuten normal se puede transformar en una normal

tipificada

Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con

media 10 y varianza 4 Transformarla en una normal tipificada

X N (10 4)

Para transformarla en una normal tipificada se crea una nueva variable (Y)

que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica

(que es la raiacutez cuadrada de la varianza)

En el ejemplo la nueva variable seriacutea

Esta nueva variable se distribuye como una normal tipificada

permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor

Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos

indicado de que las probabilidades para cada valor de la curva se encuentran

recogidas en una tabla

MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)

La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten

normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta

distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros

y lo que representamos del modo si su funcioacuten de densidad

es

Observacioacuten

Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y

la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes

adelante65

La forma de la funcioacuten de densidad es la llamada campana de Gauss

Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten

normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1

Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un

uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto

con lo cual en coinciden la media la mediana

y la moda y por uacuteltimo calcular sus puntos de inflexioacuten

El soporte de la distribucioacuten es todo de modo que la mayor parte de la

masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se

encuentra concentrado alrededor de la media y las ramas de la curva se extienden

asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la

media es posible (aunque poco probable)

La forma de la campana de Gauss depende de los paraacutemetros y

indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)

Figura Distribuciones gaussianas con diferentes medias e igual

dispersioacuten

(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor

sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor

de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea

``maacutes aplastado seraacute

Figura Distribuciones gaussianas con igual media pero varianza

diferente

La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes

adelante que es

Como consecuencia la distribucioacuten normal es reproductiva con respecto a

los paraacutemetros y ya que

Observacioacuten

Como se ha mencionado anteriormente la ley de probabilidad gaussiana la

encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza

por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el

de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que

apuntar un hecho negativo para esta ley de probabilidad

La funcioacuten no posee primitiva66

conocida67

Las consecuencias desde el punto de vista praacutectico son importantes ya que

eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de

la normal y nos tenemos que limitar a decir que

sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente

esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho

puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto

se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en

problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde

se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie

limitada de valores xi dados Normalmente F se encuentra tabulada para una

distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten

normal tipificada

En el caso de que tengamos una distribucioacuten diferente se

obtiene Z haciendo el siguiente cambio

De manera general se tiene

Proposicioacuten (Cambio de origen y escala)

Sean Entonces

Este resultado puede ser utilizado del siguiente modo Si y nos

interesa calcular

1 Hacemos el cambio y calculamos

2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de

modo aproximado) Como

tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada

Ejemplo

Supongamos que cierto fenoacutemeno pueda ser representado mediante una

va y queremos calcular la probabilidad de que Xtome un valor

entre 39 y 48 es decir

Comenzamos haciendo el cambio de variable

de modo que

Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que

hemos mencionado anteriormente

Proposicioacuten

Sea Entonces

Demostracioacuten

Por ser la normal una ley de probabilidad se tiene que

es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con

respecto a se obtiene el valor 0

luego

Para demostrar la igualdad entre la y basta con aplicar la misma

teacutecnica pero esta vez derivando con respecto a

Luego

Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en

primer lugar la va tipificada de X

y calculamos

Como por la proposicioacuten 5 deducimos que

CURVA NORMAL ESTANDARIZADA

Una variable numeacuterica puede clasificarse como discreta o continua Las

variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas

con la idea de contar Las variables continuas se pueden asociar con la idea de

medir utilizando fracciones y decimales Cuando la variable es continua el

modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal

El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten

normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran

cantidad de variables continuas

El modelo matemaacutetico

La funcioacuten matemaacutetica que se usa como modelo es

e = 271

π = 314

μx = media de la poblacioacuten

σx = desviacioacuten estaacutendar de la poblacioacuten

x = un valor de la variable continua

Como e y π son constantes la forma de la curva normal depende

solamente de los dos parametros de la distribucioacuten normal la media μx y la

desviacioacuten estaacutendar σx

Las diferentes curvas normales van a variar dependiendo de esos dos

paraacutemetros

En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar

visualmente como una curva en forma de campana El aacuterea debajo de esta curva se

halla por medio del integral de la funcioacuten y corresponde al por ciento o la

proporcioacuten de puntuaciones que se encuentran en el intervalo dado

Propiedades de las distribuciones normales

a Son simeacutetricas y tienen forma de campana

b Al ser simeacutetricas la media la moda y la mediana coinciden

c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea

de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media

d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la

curva se encuentra a tres desviaciones estaacutendar de la media

En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral

de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de

diferentes secciones de la curva o se utiliza la computadora para calcular ese valor

del aacuterea

La distribucioacuten normal estandarizada

Puesto que hay un nuacutemero infinito de combinaciones para los dos

paraacutemetros hay un nuacutemero infinito de curvas normales diferentes

Este problema se ha resuelto praacutecticamente al transformar los valores de

todas las distribuciones normales a los valores de una distribucioacuten normal

estandarizada representada por la curva normal estandarizada (standard normal

curve)

Las puntuaciones estandarizadas se logran restando la media a cada

observacioacuten y dividiendo entre la desviacioacuten estaacutendar

donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar

Propiedades de la distribucioacuten normal estandarizada

μ z = 0

σ z = 1

En muchas ocasiones se quieren comparar puntuaciones que pertenecen a

dos distribuciones normales diferentes La diferencia entre las dos distribuciones

radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo

la comparacioacuten se hace posible si se convierten las puntuaciones de ambas

distribuciones a puntuaciones z que corresponden a la distribucioacuten normal

estandarizada

Percentiles y rangos percentiles de una distribucioacuten normal estandarizada

Si se desea hallar la percentiles o el rango percentil en una distribucioacuten

normal no estandarizada se recurre al procedimiento de convertir las puntuaciones

de la distribucioacuten normal dada a puntuaciones z que corresponden a la

distribucioacuten normal estandarizada

Estos valores en la distribucioacuten normal estandarizada se pueden obtener

por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en

las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el

intervalo dado

Es necesario visualizar siempre el aacuterea debajo de la curva como el por

ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo

dado

Cuando una distribucioacuten de puntuaciones es normal estandarizada la

pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar

en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o

cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten

dada

DISTRIBUCIOacuteN GAMMA

Una variable aleatoria X asociada a un experimento aleatorio tiene una

distribucioacuten GAMMA si se caracteriza por las siguientes propiedades

Algunas alternativas de funciones de densidad se pueden ver en la graacutefica

del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)

respectivamente =1

=1

La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo

III

El modelo Gamma se ha utilizado frecuentemente en variables tales como

ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el

intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson

ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900

ndash Flujos maacuteximos MARKOVIC 1965

ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965

ndash Altura de la precipitacioacuten mensual WHITCOMB 1940

ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia

infin

ndash Ingresos familiares

ndash Edad del hombre al contraer matrimonio por primera vez

ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en

subestaciones a una frecuencia part

Ejemplo

Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos

de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia

promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo

de tiempo se encuentre hasta que ocurre el segundo ciclo

a Dentro de una desviacioacuten con respecto del tiempo promedio

b A maacutes de dos desviaciones por encima de la media

Solucioacuten

X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en

horas

Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)

= 2

Y Nuacutemero de ciclos hora ---------Y~P( =002)

E(Y) = 002 =

X ~ G(2 002)

Ejemplo

En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de

kilovatios por hora puede considerarse como una variable aleatoria con

distribucioacuten GAMMA de paraacutemetros = 3 y

= 05

La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de

KWhora

iquestCuaacutel es la probabilidad de que este abastecimientos sea

a Insuficiente en un diacutea cualquiera

b Se consuman entre 3 y 8 millones de K WHora

c c Encuentre E(x) y V(x)

SOLUCIOacuteN

DISTRIBUCIOacuteN PARETO

En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad

continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores

es

Su funcioacuten de distribucioacuten es

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto

son

El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (

DISTRIBUCIOacuteN T DE STUDENT

Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una

distribucioacuten t con n grados de libertad

Cuando n--gtinfinito a curva t coincide com la normal estandarizada

FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX

MOMENTOS

La distribucioacuten -Student se construye como un cociente entre una normal

y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-

Student con n grados de libertad a la de una va T

donde Este tipo de distribuciones aparece cuando

tenemos n+1 va independientes

y nos interesa la distribucioacuten de

La funcioacuten de densidad de es

Figura Funcioacuten de densidad de una de Student

La distribucioacuten de Student tiene propiedades parecidas a

Es de media cero y simeacutetrica con respecto a la misma

Es algo maacutes dispersa que la normal pero la varianza decrece hasta

1 cuando el nuacutemero de grados de libertad aumenta

Figura Comparacioacuten entre las funciones de densidad de y

Para un nuacutemero alto de grados de libertad se puede aproximar la

distribucioacuten de Student por la normal es decir

Figura Cuando aumentan los grados de libertad la distribucioacuten de

Student se aproxima a la distribucioacuten normal tipificada

Para calcular

DISTRIBUCIOacuteN BETA

Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede

representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un

intervalo de longitud finita Tales como

Proporcioacuten de impurezas en un producto quiacutemico

La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten

La proporcioacuten vendida de un lote durante un tiempo t

La humedad relativa medida en cierto lugar

Porcentaje del costo total destinado a reparacioacuten de maquinaria

Porcentaje de costo adicional destinado a reparacioacuten de maquinaria

La distribucioacuten del tiempo necesario para completar una fase del proyecto

PERT

Evaluacioacuten de programas y teacutecnicas de revisioacuten

Ejemplo

La proporcioacuten de tramos de una autopista que requieren repararse

semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros

= 3 y =2

a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten

b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista

requieren reparacioacuten en un antildeo cualquiera

DISTRIBUCIOacuteN CAUCHY

En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de

Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es

donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene

valor esperado ni varianza

Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V

2 lt 1 el

numero U V tiene la distribucioacuten Cauchy

La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un

grado de libertad

Ejemplo

Sean y dos observaciones independientes de una distribucioacuten

Cauchy con funcioacuten de densidad

Puede demostrarse que si y son tales que entonces la

funcioacuten de verosimilitud de es bimodal

Sean y Supongamos que se desea hacer inferencias sobre el

valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa

Especiacuteficamente interesa encontrar la distribucioacuten final de

Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la

distribucioacuten final de tiene una forma complicada Es conveniente notar sin

embargo que corresponde a la densidad marginal de respecto a la

densidad conjunta

DISTRIBUCIOacuteN BERNOULLI

Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto

suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el

que no lo sea (fracaso) En realidad no se trata maacutes que de una variable

dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello

que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas

obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la

situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este

experimento mediante una va discreta Xque toma los valores X=0 si el suceso no

ocurre y X=1 en caso contrario y que se denota

Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar

una moneda al aire y considerar la va

Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de

probabilidad es

y su funcioacuten de distribucioacuten

Su funcioacuten caracteriacutestica es

Los principales momentos de la X los podemos calcular directamente

o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina

Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)

cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de

intentos

CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE

BERNOULLI

Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la

probabilidad y asegurar que se cumplen las tres condiciones necesarias en

particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del

resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3

requiere que los ensayos o intentos de un proceso de Bernoulli sean

estadiacutesticamente independientes es decir que el resultado de un intento no puede

afectar de ninguacuten modo el resultado de cualquier otro intento

DISTRIBUCIOacuteN EXPONENCIAL

Modelo para variable aleatoria continua que permite representar variables

del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos

Componentes

En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de

probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para

valores x gt 0 es

f(x) = λe - λx

Su funcioacuten de distribucioacuten es

Aqui e significa el nuacutemero e

El valor esperado y la varianza de una variable aleatoria X con

distribucioacuten exponencial son

E[X] = 1 λ

V(X) = 1 λ2

Ejemplo

Ejemplos para la distribucioacuten exponencial son los tiempos dentro

accidentes con probabilidad invariable

La funcioacuten de densidad para λ igual 05 10 y 15

DISTRIBUCIOacuteN MULTINOMIAL

La distribucioacuten multinomial es similar a la distribucioacuten binomial con la

diferencia de que en lugar de dos posibles resultados en cada ensayo

La distribucioacuten multinomial sigue el siguiente modelo

Donde

X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo

que el partido POPO lo hayan votado 3 personas)

n indica el nuacutemero de veces que se ha repetido el suceso (en el

ejemplo 5 veces)

n es factorial de n (en el ejemplo 5 4 3 2 1)

p1 es la probabilidad del suceso X1 (en el ejemplo el 40)

Veamos el ejemplo

Luego

P = 00256

Es decir que la probabilidad de que las 5 personas elegidas hayan votado

de esta manera es tan soacutelo del 256

Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1

Veamos otro ejemplo

En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el

40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4

invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos

Aplicamos el modelo

LuegoP = 00384

Por lo tanto la probabilidad de que el grupo esteacute formado por personas de

estos paiacuteses es tan soacutelo del 384

DISTRIBUCIOacuteN UNIFORME

En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de

probabilidad cuyos valores tienen la misma probabilidad

Caso discreto

Su funcioacuten de probabilidad es en el caso discreto con valores posibles

p(xi) = 1 n

Su funcioacuten de distribucioacuten es en el caso discreto

Su media estadiacutestica es

Caso continuo

Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b

La funcioacuten de densidad en el caso continuo entre a y b es

Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12

Ejemplos

Para un dado perfecto todos los resultados tienen la misma probabilidad 1

6

Calcular variables aleatorias

Las variables aleatorias de probabilidad uniforme pueden calcularse con un

generador de variables aleatorias

DISTRIBUCIOacuteN BINOMIAL

En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad

discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con

probabilidad p de un eacutexito

Su funcioacuten de densidad es

Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)

posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos

((1 - p)n - x

)

El valor esperado de una variable aleatoria de probabilidad binominal es

E[x] = np y su varianza V[x] = np(1 - p)

DISTRIBUCIOacuteN BINOMIAL NEGATIVA

Sobre una sucesioacuten de va de Bernouilli independientes

Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r

eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de

distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo

Su ley de probabilidad se deduce siguiendo el esquema

De nuevo el conjunto de posibles valores de esta va discreta es

Su funcioacuten caracteriacutestica es

y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima

Ejemplo

Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en

operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal

que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda

definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para

intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus

5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones

que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se

necesiten 10 intervenciones

Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por

una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan

4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso

Identificando los paraacutemetros se tiene

Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el

nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy

simple

Y=X+r

Luego

Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente

es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de

que X=10-4=6 Por tanto

La distribucioacuten binomial negativa tambieacuten se puede definir como el

nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas

contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que

DISTRIBUCIOacuteN DE POISSON

Modelo para variable aleatoria discreta que permite calcular la

probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten

discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo

muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos

o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual

a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es

independiente de cuaacutendo se presenta dicho periacuteodo

En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de

probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos

es

Aquiacute e significa el nuacutemero e y x significa el factorial de x

La distribucion de Poisson describe el nuacutemero de sucesos en una unidad

de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un

proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens

en una carrera

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten

Poisson son

E[X] = V[X] = λ

La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos

entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un

conmutador la demanda (necesidades) de los pacientes que requieren servicio en

una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el

nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos

ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una

variable aleatoria discreta que toma valores enteros (0 1 2)

Caacutelculo de la probabilidad de Poisson

La letra X por lo general representa a una variable discreta y puede tomar

valores enteros Utilizamos la letra X para representar a la variable aleatoria y la

letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La

probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson

se calcula con la foacutermula

LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA

DISTRIBUCIOacuteN BINOMIAL

La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la

binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan

cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es

grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan

con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena

aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es

igual o menor que 005 En los casos en que se cumplen estas condiciones

podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media

de la distribucioacuten de Poisson

DISTRIBUCIOacuteN GEOMEacuteTRICA

En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten

probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores

discretos es

P(X = x) = p(1 - p)x - 1

Su funcioacuten de distribucioacuten es

El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media

estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2

Ejemplo

El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es

una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6

DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA

En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de

probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de

masa para valores es

Aqui (a sobre b) es el coeficiente binomial

El valor esperado de una variable aleatoria X de distribucioacuten

hipergeomeacutetrica es

Y su varianza

DISTRIBUCIOacuteN ZETA

En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad

discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos

es

Aqui ζ(s) es la funcioacuten zeta de Rieman con

El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto

DISTRIBUCION CHI CUADRADO

El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una

comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es

diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con

ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno

es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario

estas dos frecuencias acusan una diferencia significativa para por ejemplo un

nivel de significacioacuten del 5

El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la

asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada

por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito

bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor

del famoso libro Statistical Methods for Research Workers (1925) donde se

marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con

Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde

estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y

el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las

pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba

exacta de Fisher

Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico

publicitario presentado a grupos de clientes comparar la rentabilidad de un

proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos

de los turistas por determinados espacios geograacuteficos o por determinados

servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las

frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las

frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o

tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o

de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2

x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos

turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han

ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han

tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula

que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido

en los sitios A y B

Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es

independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo

A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces

alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este

anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos

empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de

las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51

La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten

igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es

2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del

Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del

5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206

podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para

suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B

Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias

observadas empiacutericamente de dos muestras con las frecuencias esperadas o

teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el

Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de

las materias primas perecederas Los resultados son seguacuten atributos cualitativos

los siguientes Primero veremos las frecuencias empiacutericas u observadas

Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten

Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son

131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas

Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y

fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres

columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta

maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x

120 260 = 6046 b2 = 129 x 120 260 = 5954

Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten

igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de

2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de

libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La

diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna

conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten

Es una medida de la discrepancia existente entre las frecuencias

observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso

de frecuencias () debido a que permite determinar las desviaciones entre ellas

ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la

expresioacuten

E

EOX

2

2

Donde

O frecuencia observada

E frecuencia teoacuterica esperada

TEST DE CHI-CUADRADO DE CONTINGENCIA

Un caso particular del test de chi-cuadrado que permite hacer un test sobre

la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-

cuadrado de contingencia Los dos caracteres observados en una misma

poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases

de se denotan las de por Tambieacuten vamos a

denotar

el efectivo conjunto de y es el nuacutemero de individuos para los

cuales toma el valor e el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

Estos valores se representan en una tabla de doble entrada conocida como

tabla de contingencia

Cada fila y cada columna corresponden a una submuestra particular La

fila de iacutendice es la distribucioacuten en las clases de los individuos para

los cuales el caraacutecter toma el valor La columna de iacutendice es la

distribucioacuten en las clases de los individuos para los cuales el caraacutecter

toma el valor Dividiendo las filas y las columnas por su suma se obtienen

frecuencias condicionales para cada una de las distribuciones empiacutericas Para

y las denotaremos por

y

Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y

los perfiles columna Para el modelo probabilista las observaciones provienen de

una muestra

de una ley bidimensional La hipoacutetesis a comprobar

es que los dos marginales de esta ley son independientes Si este es el caso los

perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna

de la de

y

Es equivalente a decir que las frecuencias conjuntas deben estar cerca de

los productos de las frecuencias marginales

Las frecuencias conjuntas por un lado (distribucioacuten observada) y los

productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen

dos distribuciones de probabilidad sobre el conjunto producto

Podemos por tanto calcular la distancia de

chi-cuadrado de una con respecto a la otra

Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la

distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale

Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la

definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado

Por lo dicho anteriormente para suficientemente grande podemos

aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el

nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados

a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las

que han sido estimadas Hay para el caraacutecter y para el caraacutecter

(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley

chi-cuadrado seraacute por tanto

Vamos a presentar un ejemplo de dos caracteres binarios que tienen que

ver con enfermos para los cuales se ha observado si tienen o no una tendencia al

suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y

neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las

tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla

de contingencia observada es

Tendencia Sin tendencia Total

Psicosis 20 180 200

Nneurosis 60 140 200

Total 80 320 400

La distancia de chi-cuadrado de contingencia calculada a partir de esta

tabla es de El valor tomado por el estadiacutegrafo es el cual

debemos comparar con la ley El p-valor es de

Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre

la tendencia al suicidio y la clasificacioacuten de las enfermedades

El test no precisa el sentido de esta dependencia Para describirla hay que

comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre

los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten

PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS

Los investigadores se interesan constantemente en las diferencias entre dos

poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado

civil profesioacuten color de ojos preferencia por una marca etc)

Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de

contingenciardquo

Se puede realizar una prueba para la diferencia entre dos proporciones

sobre la base de muestras independientes usaacutendose como instrumento la prueba

de chi cuadrado

El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es

la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se

podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda

Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la

ecuacioacuten

n

nnE CR

donde

nR nuacutemero total en el rengloacuten

nC nuacutemero total en la columna

n tamantildeo total de la muestra

El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado

entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia

al cuadrado se divide entre la frecuencia esperada de la celda

La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se

rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el

valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados

de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el

tamantildeo de la muestra

CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD

Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a

las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se

puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la

distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado

siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal

Por consiguiente al probar la diferencia entre las dos proporciones la

distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes

Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia

direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten

normal

La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede

ilustrar mediante el siguiente ejemplo

Cuartos de bantildeos modernos

Cocina moderna Caren

cia

existenc

ia

totales

Carencia 72 8 80

Existencia 7 146 153

La hipoacutetesis nula y alternativa seriacutean

YN ppH 0

YN ppH 0

Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de

significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute

Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H

A partir de la informacioacuten del cuadro

10080

8

N

NSN

n

Xp 95420

153

146

Y

YSY

n

Xp

A partir de la expresioacuten

21

21

111

nnpp

pPZ SS

donde

661015380

1468

p

por lo tanto

0813

153

1

80

133906610

95420100

Z

Totales 79 154 223

Dado que 1960813 Z se rechaza la 0H por lo tanto hay

diferencia entre las dos proporciones

Usando la prueba de chi cuadrado y la tabla de contingencia de este

ejemplo se tiene

Las frecuencias teoacutericas se pueden obtener a partir de la siguiente

ecuacioacuten

n

nnE CR

Por lo tanto se tiene

1227233

7980E 8852

233

15480E

8851233

79153E 12101

233

154153E

Chi cuadrado se obtiene a partir de la expresioacuten

E

EOX

2

2

A partir de la tabla se tiene

O E (O ndash E) (O ndash E)2

(O ndash E)2E

7

2

2

712

+4488 20142144 742704

7 5

188

- 4488 20142144 388245

8 5 -4488 20142144 380903

288

1

46

1

0112

+4488 20142144 199191

1711043

10431712 CALCULADOX

Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el

84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo

tanto hay diferencia entre las dos proporciones

Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la

distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos

distribuciones que a un nivel de significancia de 005 el valor de 196 es el

cuadrado de 3 841 es decir 22 ZX

CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA

La afirmacioacuten de que no existen diferencias entre proporciones significa

que las dos variables son independientes Cuando las conclusiones se presentan en

esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo

Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que

no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la

hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos

variables Independientemente de que la prueba de chi cuadrado se considera una

prueba de diferencia entre dos proporciones o una prueba de independencia los

caacutelculos y resultados son exactamente los mismos

CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE

Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o

intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que

ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de

probabilidades

Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que

seguir varios pasos Primero se tiene que establecer la distribucioacuten de

probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada

paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la

media) se deben establecer mediante hipoacutetesis o estimarlos con base a la

informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para

determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o

intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado

para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la

informacioacuten

BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON

La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de

Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la

cantidad de automoacuteviles estacionados en una cochera cubierta siguen una

distribucioacuten de Poisson 0H

En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero

de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una

muestra aleatoria de 233 casas

Numero de automoacuteviles Frecuencia

0 61

1 151

2 21

233

Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados

de la distribucioacuten de frecuencia

No de automoacuteviles Frecuencia observada On

0 61 0

1 151 151

2 21 42

233 193

808280233

193

1

n

On

X

n

i por lo tanto 80X

El valor de la media muestral se utilizara como el estimado de X

Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)

y se obtiene la frecuencia teoacuterica para cada una

Automoacutevil

n

Frecuencia

O

Probabilidad

XP

Frecuencia (E)

XPn

0 61 04493 104687

1 151 03595 87764

2 21 01438 33505

Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de

significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX

El valor calculado de chi cuadrado es

50679

2

2

K

CALCULADO

E

EOX

Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de

automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una

distribucioacuten de Poisson

CORRECCIOacuteN DE YATES

Cuando se aplican a datos discretos los resultados para distribuciones

continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres

comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de

Yates la cual viene dada mediante la expresioacuten

E

EOX CALCULADO

502

2

En general la correccioacuten se hace solamente cuando el numero de grados

de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos

resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en

relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia

esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi

cuadrado corregido y no corregido Si ambos valores conducen a la misma

conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se

presentan dificultades Si conducen a conclusiones diferentes se puede o bien

incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear

meacutetodos de probabilidad exactos

El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente

ejemplo

En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces

Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de

significancia del 005

No de caras Frecuencia Probabilidad Frecuencia (E)

Cara 115 05 100

cruce 85 05 100

2054

100

0510085

100

0510011522

2

CALCULADOX

Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado

con correccioacuten de Yates es

8432 TABULADOX

Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha

PRUEBA EXACTA DE FISHER

Para examinar la igualdad de las varianzas de dos poblaciones

independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de

las varianzas de las dos muestras Suponiendo que la informacioacuten de cada

poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2

2

2

1 SS sigue una

distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso

estadiacutestico RA Fisher

Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de

grados de libertad los grados de libertad en el numerador y en el denominador

la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea

2

2

2

111 21

S

SF nn

donde

n1 = tamantildeo de muestra en el grupo 1

n2 = tamantildeo de muestra en el grupo 2

n1 ndash 1 = grados de libertad en el grupo 1

n2 ndash 1 = grados de libertad en el grupo 2

2

1S varianza de la muestra en el grupo 1

2

2S varianza de la muestra en el grupo 2

Al probar la igualdad de dos varianzas se pueden emplear pruebas de una

cola o de dos colas

El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente

ejemplo

Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas

alta en la planta A que en la planta B Para determinar la variabilidad se puede

establecer una prueba de una cola en la forma siguiente

22 BAOH

22

1 BAH

Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta

A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta

ubicada en la cola superior de la distribucioacuten

Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de

libertad en el numerador y 19 en el denominador a un nivel de significancia de

001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene

71162 AS y 20142 BS por lo tanto

38512014

71162

2

1924 F como 1385 lt

292 no se rechaza la hipoacutetesis nula ( OH )

CONCLUSIOacuteN

La conclusioacuten que los resultados de una medida variable es la causa de

variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten

estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero

no puede reclamar legitimidad

La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en

describir la distribucioacuten de las variables estudiadas y en particular de los datos

numeacutericos Ademaacutes de las medidas descriptivas correspondientes el

comportamiento de estas variables puede explorarse graacuteficamente de un modo

muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro

organizador de las ciencias computarizadas y el modelo que nos dota de un

mejor razonamiento para implementar programas eficientes En este sentido la

combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un

reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en

colegios y universidades

Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de

combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y

evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras

loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre

operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten

juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la

teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones

simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades

que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea

BIBLIOGRAFIacuteA

AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis

Third Edition Texts in Statistical Science Chapman and Hall

BOXG E P HUNTER W G HUNTER JS (1978) Statistics for

Experimenters John Wiley amp Sons

BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores

Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de

Modelos Ed Revertsbquo SA

Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed

Piraacutemide

Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten

(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica

Matemaacutetica I Universidad de Antioquia

Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma

Madrid

Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill

Meacutexico

Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten

yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico

Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw

ndashHill 4ta Edicioacuten Colombia

CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana

Meacutexico

COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas

COX DR (1958) Planning of experiments New York John Wiley amp Sons

DANIEL C Applications of Statistics to Industrial Experimentation Willey

DAVIES OL The Design and Analysis of Industrial Experiments Hafner

(McMillan)

DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias

Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico

SA de CV Meacutexico

De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H

(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico

Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta

Estadiacutestica Editorial Microsoft corporation USA

ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial

Limusa SA Meacutexico

EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis

Arnold

FEDERER W (1965) Experimental design Oxford Publ Co

GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la

Varianza Grupo Editorial Universitario

FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico

McGraw Hill

FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque

ModernoEditorial SA Meacutexico

George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y

Meacutetodosrdquo Ed McGraw-Hill

GILL JL (1978) Design and Analysis of Experiments in the Animal and

Medical Sciences Iowa State University Press

JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression

and Experimental Design Springer-Verlag

Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor

Caracas

GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining

Institute

GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data

Mining Institute

Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial

Bourgeoacuten Caracas

Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la

EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute

Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial

BourgeoacutenCA Caracas ndash Venezuela

HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis

Multivariante 5ordf Edicioacuten Prentice Hall

JOBSON JD (1992) Applied Multivariate Data Analysis Volume II

Categorical and Multivariate Methods Springer-Verlag

KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial

Hispanoamericana Meacutexico

KIRK RE Experimental Design Procedures for the Behavioral Sciencies

BrooksCole Publishing Company

LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e

inferencia Estadiacutestica Editorial Limusa Meacutexico

LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV

Grupo Noriega Editores Meacutexico

LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial

HARLA Meacutexico

LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta

edicioacuten Editorial McGaw-Hill Usa

Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial

Hispanoameacuterica VI edicioacuten Meacutexico

LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire

Multidimensionnelle 3ordf Edition DUNOD

LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e

Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB

Caracas- Venezuela

LORENZEN T J Anderson V L (1993) Design of experiments A No-Name

Approach Marcel Dekker Inc

Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc

(1999) SPSS 90 Manual de Usuario SPSS Chicago

MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis

Academic Press

Enfocados hacia SPSS

Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de

wwwspssparatodoscom 2005

MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten

Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla

Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea

Ediciones Alfaomega SAN Meacutexico

MASON RL Statistical Design and Analysis of Experiments with Applications

to Engineering and Science John Wiley amp Sons New York

MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y

Economiacutea Editorial Iberoamericana Meacutexico

MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in

agriculture and experimental biology Second edition Chapman amp Hall

MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo

Editorial Iberoameacuterica

MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers

John Wiley amp Sons

Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial

Reverte Mejicana Meacutexico

Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da

Edicioacuten Meacutexico

Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc

Graw Hill

PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones

Editorial Limusa Meacutexico

NETER J et al Applied Linear Statistical Models Regression Analysis of

Variance and Experimental Designs Library of Congress Cataloging Publication

Data

OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp

RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo

Editorial Universitario

PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos

Lineales y Series Temporales Vol 1 y 2 Alianza Editorial

Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores

Spain SA Espantildea 2005

PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial

Mir Moscuacute

RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed

McGraw-Hill

Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca

UCV Caracas ndash Venezuela

RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE

Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en

Psicologiacuteardquo p 1

SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons

Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti

Caracas ndash Venezuela

Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores

deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico

Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica

Editorial Harla Meacutexico

STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y

procedimientos Segunda edicioacuten McGraw Hill

SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas

Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1

Ediciones UNESR Caracas

URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante

Coartiacuteculo Plan Nuevo Editorial AC

VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II

Anaacutelisis Multivariante) Mc-Graw Hill

Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows

Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea

2002

WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros

Editorial Interamericana Meacutexico

Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8

Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage

Learning Editores p 364 ISBN 9706861947

Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea

Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea

Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de

CV Meacutexico

Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para

Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico

DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR

httpesmwikipediaorgwikiSPSS

httpwwwbuenastareascomensayosque-es-el-SPSS1465478html

httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-

del-software-estadistico-integral-spss-base-160

httpesanswersyahoocomquestionindexqid=20070727073908aatuamw

httpwwwslidesharenetleticiagpestructura-de-spss-3126476

httpwwwehowenespanolcomprograma-spss-sobre_48697

httpwwwugres~bioestmedicinamanual_spsspdf

httpwwwmonografiascomtrabajos12tutortutorshtml

httpwwwspsscom

wwwspssparatodoscom

httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html

httpwwwspssfreecomcapitulotreshtml

httpwwwuvesRELIEVEemail relieveuves

httpwwwscribdcomdochellipspss-introduccioacuten

httpeswikipediaorgwikiSPSS

httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd

f

httpwwwspsscomaressuccessargentinashtml

httpeswikipediaorgwikiSPSS

httpwww-01ibmcomsoftwareesanalyticsspss

httppsicofcepurvesspssindex0htm

httpssitesgooglecomsiteestadisticaconelspss

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpe-stadisticabioucmesweb_spssindice_spsshtml

httpwwwquimicaurvesquimiogeneralanovacastpdf

httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da

tosyMultivariable14anova1_SPSSpdf

httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800

20AnE1lisis20de20Varianzaspdf

httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-

pearson

httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf

httpwwwuoceduin3emathdocsRegresionLinealpdf

httpeswikipediaorgwikiRegresiC3B3n_lineal

httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES

ION_LINEAL_CON_SPSSpdf

httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN

EAL20SIMPLE20CON20SPSSpdf

httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE

SION_LINEAL_CON_SPSSpdf

httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm

httpeswikipediaorgwikiNivel_de_medida

httphtmlrincondelvagocomregresion-lineal-simplehtml

httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp

lepdf

httpwwwvitutorcomestadisticabi8html

httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf

httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-

Martinez_1pdf

httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml

httpesslidesharenetpatolinkecuacin-de-regresin-lineal

httpeswikipediaorgwikiMC3ADnimos_cuadrados

httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios

httpwwwwordreferencecomdefinicioncorrelaciC3B3n

httpwwwditutorcomestadistica_2correlacion_estadisticahtml

httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson

httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n

httpeswikipediaorgwikiMatriz_de_correlaciC3B3n

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpwwwinfecepiunizares

httpwwwltbioestadisticaumaes

httpwwwuaqmxmatematicasestadisticasxu3html

httpwwwmembers-americastripodcom

httpwwwmsiplceorg

httpwwwbnvcocrsesionnotaaspg

httpwwwaltavistacom

httpwwwauyantepuycom

httpwwwinees

httpwwwudeccl

httpwwwrincondelvagocom

httpwwwmonografiascom

httpwwwfestadisticafguamesindicadoresiprihtml

httpwwwuaqmxmatematicasestadisticaxu3html

httpwwwinegoboiwd0801htmlE

httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm

httpwwwitlpedumx

httpwwweclaevespanovestadisticasna93nnsnann7eshtml

httpw3moritesmmx~cmendozamaestestoohtml

httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml

httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion

httpwwwunleduarfaveseiencuestasindexhtml

httpwwwmonografiascomtrabajos11operaoperashtml

httpwwwmonografiascomtrabajos6hisohisoshtml

httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos

httpwwwmonografiascomtrabajos16sistema-operativosistema-

operativoshtmlTIPPOS

httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-

operativoshtml

httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei

httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml

httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-

operativo

httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software

httpwwwsscccoclinformaticaconceptoshtml

httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr

httpwwwcadcommxhistoria_de_la_computacionhtm

httpwwweswikipediaorgwikiBus_(informC3A1tica)

httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla

httpwwwcavsicompreguntasrespuestasque-es-el-teclado

httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm

Page 2: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,

INTRODUCCIOacuteN

A menudo se presenta la necesidad de calcular el nuacutemero de maneras

distintas en que un suceso se presenta o puede ser realizado Otras veces es

importante determinar la probabilidad de ocurrencia de un evento especiacutefico En

ambos casos se apela al sentido comuacuten o se establecen meacutetodos que permitan

sistematizar tales caacutelculos Con frecuencia el sentido comuacuten ayuda a entender por

queacute se eligioacute un procedimiento dado mientras que la formalizacioacuten del caacutelculo las

viacuteas para encontrar las soluciones apropiadas

A la hora de contrastar nuestra hipoacutetesis nula de partida varios factores

van a determinar la prueba estadiacutestica que utilizaremos y se refieren al nuacutemero

tipo y distribucioacuten de las variables y a la forma en que se eligioacute el estudio

La matemaacutetica nacioacute de la necesidad de contar y ordenar disentildear modelos

eficientes en un medio cada vez maacutes complejo y simplificar una variedad

inmensa de informacioacuten es el drama de nuestro tiempo

Con la realizacioacuten de este trabajo pudimos conocer la importancia de la

Estadiacutestica en todos los campo que componen la sociedad tambieacuten pudimos

conocer que es un valor esperado variables aleatorias como se dividen

distribucioacuten simeacutetrica distribucioacuten sesgada distribucioacuten de probabilidad y su

uso distribucioacuten discreta definicioacuten caracteriacutesticas ejemplo distribucioacuten

Bernoulli Exponencial Multinomial Uniforme Binomial y Binomial negativa

Poisson Geomeacutetrica Hipergeometrica y Zeta Tambieacuten pudimos conocer sobre

la Teoriacutea combinatoria Variacioacuten y la Combinacioacuten

PRUEBAS PARAMEacuteTRICAS

Porque comparan los grupos a traveacutes de una medida de tendencia central

(paraacutemetro) la media aritmeacutetica Como vemos este valor adquiere una vital

importancia

Mientras que las pruebas que suponen una distribucioacuten de probabilidad

determinada para los datos se denominan pruebas parameacutetricas

Dentro de las pruebas parameacutetricas las maacutes habituales se basan en la

distribucioacuten de probabilidad normal y al estimar los paraacutemetros del modelo se

supone que los datos constituyen una muestra aleatoria de esa distribucioacuten por lo

que la eleccioacuten del estimador y el caacutelculo de la precisioacuten de la estimacioacuten

elementos baacutesicos para construir intervalos de confianza y contrastar hipoacutetesis

dependen del modelo probabiliacutestico supuesto

Cuando un procedimiento estadiacutestico es poco sensible a alteraciones en el

modelo probabiliacutestico supuesto es decir que los resultados obtenidos son

aproximadamente vaacutelidos cuando eacuteste variacutea se dice que es un procedimiento

robusto

Las inferencias en cuanto a las medias son en general robustas por lo que

si el tamantildeo de muestra es grande los intervalos de confianza y contrastes

basados en la t de Student son aproximadamente vaacutelidos con independencia de la

verdadera distribucioacuten de probabilidad de los datos pero si eacutesta distribucioacuten no es

normal los resultados de la estimacioacuten seraacuten poco precisos

iquestEn queacute condiciones la media es realmente un valor representativo de una serie de

datos Como sabemos existen otras medidas de tendencia central que seguacuten la

distribucioacuten de los datos pueden llegar a ser maacutes representativas Cuando los

datos siguen una distribucioacuten normal la media actuacutea como una buena medida

resumen Recordemos algunas de las caracteriacutesticas de esta distribucioacuten

Viene determinada por dos paraacutemetros la media (micro) y la desviacioacuten tiacutepica () Es

acampanada y simeacutetrica alrededor de la media

Recordemos que por ejemplo si se cumplen los supuestos de

normalidad (fig 1)

El valor de la micro plusmn 1 incluiraacute aproximadamente el 683 central de las

observaciones

El valor de la micro plusmn 2 incluiraacute aproximadamente el 953 central de las

observaciones

El valor de la micro plusmn 3 incluiraacute praacutecticamente todas las observaciones el

997

Conocidas la micro y la se puede reconstruir la distribucioacuten de las

observaciones

La igualdad de variancias es el otro gran obstaacuteculo que deberemos salvar

Dos distribuciones pueden tener el mismo valor en el paraacutemetro media mostrando

el primer valor cercano a la media (poca dispersioacuten variancia pequentildea) y la

segunda valores alejados de dicho paraacutemetro (maacutes dispersioacuten gran variancia)

Como vemos estas dos variables siguen diferentes patrones aunque tienen en

comuacuten el mismo valor de la media (fig 2)

iquestPor queacute tienen estas asunciones Las pruebas parameacutetricas asumen que

los datos de las variables a comparar se distribuyen de igual forma pero que entre

ellos existe un desplazamiento fijo es decir para cada valor de una muestra hay

un valor igual pero incrementado en un valor constante (K) al que podriacuteamos

llamar desplazamiento (fig 3) Si este valor constante se acerca al valor 0 no

habriacutea diferencias entre los grupos ya que existiriacutea un solapamiento entre los

valores a comparar Cuanto maacutes se aleje del valor 0

mayores seraacuten las diferencias

Obseacutervese la importancia de asumir que este valor de desplazamiento de

una muestra a la otra es constante Si estamos comparando dos diferentes

tratamientos por ejemplo un placebo y un principio activo en dos muestras que

son homogeacuteneas basalmente este valor K seraacute el efecto que podremos imputar al

principio activo en cada caso la diferencia entre medias representa no el efecto

promedio sino el efecto del tratamiento en cada caso Si por el contrario este

efecto no fuera constante ya no se cumpliriacutean los supuestos de estas pruebas

Fig 1

Fig 2

Fig 3

Dentro de las pruebas parameacutetricas se tienen para muestras grandes y para

muestras pequentildeas Un supuesto que se aplica a ambas es que la muestra que se

toma debe haber sido seleccionada en forma aleatoria o probabiliacutestica En las

pruebas parameacutetricas de muestra pequentildea se requiere el supuesto de que las

muestras fueron extraiacutedas de una poblacioacuten con distribucioacuten normal y cuando se

trata de dos o maacutes muestras tambieacuten se requiere una prueba de igualdad de

varianzas Existen pruebas estadiacutesticas por medio de las cuales se podriacutea

comprobar esto sin embargo suele no daacutersele importancia a esto y se pasa por

alto El anaacutelisis de varianza tambieacuten se basa en el supuesto de normalidad de las

poblaciones y en el de que sus varianzas son iguales

En las pruebas en las que se tienen menos supuestos es en las de muestra

grande las cuales se pueden aplicar sin saber o comprobar si la poblacioacuten o

poblaciones eran normales estas pruebas se dice que son robustas porque no es

necesario que se cumpla dicho supuesto Cuando la prueba que se requiere no es

robusta no es necesario correr el riesgo de estar equivocados en las conclusiones

en ellos En cambio se dispone de muchas pruebas estadiacutesticas no parameacutetricas

que tienen una aplicacioacuten semejante a las parameacutetricas de muestra pequentildea en las

que se tienen menos supuestos

PRUEBAS NO PARAMEacuteTRICAS

Se denominan pruebas no parameacutetricas aquellas que no presuponen una

distribucioacuten de probabilidad para los datos por ello se conocen tambieacuten como de

distribucioacuten libre (distribution free) En la mayor parte de ellas los resultados

estadiacutesticos se derivan uacutenicamente a partir de procedimientos de ordenacioacuten y

recuento por lo que su base loacutegica es de faacutecil comprensioacuten Cuando trabajamos

con muestras pequentildeas (n lt 10) en las que se desconoce si es vaacutelido suponer la

normalidad de los datos conviene utilizar pruebas no parameacutetricas al menos para

corroborar los resultados obtenidos a partir de la utilizacioacuten de la teoriacutea basada en

la normal

Cuando se analizan datos medidos por una variable cuantitativa continua

las pruebas estadiacutesticas de estimacioacuten y contraste frecuentemente empleadas se

basan en suponer que se ha obtenido una muestra aleatoria de una distribucioacuten de

probabilidad de tipo normal o de Gauss Pero en muchas ocasiones esta

suposicioacuten no resulta vaacutelida y en otras la sospecha de que no sea adecuada no

resulta faacutecil de comprobar por tratarse de muestras pequentildeas En estos casos

disponemos de dos posibles mecanismos los datos se pueden transformar de tal

manera que sigan una distribucioacuten normal o bien se puede acudir a pruebas

estadiacutesticas que no se basan en ninguna suposicioacuten en cuanto a la distribucioacuten de

probabilidad a partir de la que fueron obtenidos los datos y por ello se denominan

pruebas no parameacutetricas (distribution free)

La mayoriacutea de las pruebas de hipoacutetesis requieren suposiciones especiacuteficas

acerca de la poblacioacuten o poblaciones que se muestran En muchos casos debemos

suponer que las poblaciones tienen maacutes o menos la forma de distribuciones

normales o que se conocen sus varianzas o se sabe que son iguales o bien que las

muestras son independientes Como hay muchos casos donde no se pueden

cumplir estas suposiciones los estadiacutesticos han generado teacutecnicas alternativas

basadas en suposiciones menos estrictas que se han dado a conocer como

ldquoPruebas no parametricasrdquo

En estos casos se emplea como paraacutemetro de centralizacioacuten la mediana

que es aquel punto para el que el valor de X estaacute el 50 de las veces por debajo y

el 50 por encima

Propiedades

1 No se relacionan con el estudio de un paraacutemetro de la poblacioacuten

Por lo general cuando se hace referencia a pruebas no parameacutetricas se puede estar

hablando tanto de las no parameacutetricas como de las libres de distribucioacuten

(distribution free tests)

Las dos indicaciones maacutes importantes que se deben tener en cuenta para utilizar

una prueba no parameacutetrica son que

1 la distribucioacuten de la poblacioacuten no sea normal

2 la escala de medicioacuten de la variable en cuestioacuten sea categoacuterica

Los meacutetodos no parameacutetricos son menos poderosos que los parameacutetricos Esto

quiere decir que es maacutes difiacutecil rechazar la hipoacutetesis nula con las pruebas no

parameacutetricas

Por esa razoacuten los estadiacutesticos por lo general recurren a los meacutetodos no

parameacutetricos soacutelo cuando los datos no cumplen con los supuestos parameacutetricos

Sin embargo hay problemas de investigacioacuten en los que las variables categoacutericas

son las indicadas y por lo tanto soacutelo un meacutetodo no parameacutetrico es el indicado Los

pasos en las pruebas de hipoacutetesis no parameacutetricas son los mismos de las

parameacutetricas Los cambios por lo general se limitan a cambios en la foacutermula para

obtener el valor observado y en la tabla que se utiliza Pero se habla de hipoacutetesis

nula nivel de significacioacuten error tipo I y tipo II etc

El uso de meacutetodos no parametricos ofrece numerosas ventajas

1 los meacutetodos no parametricos se pueden usar con todo tipos de datos

ndash informacioacuten cualitativa (de escala nominal) informacioacuten en forma de rangos

(escala ordinal) asiacute como informacioacuten medida de un modo mas exacto (escala de

intervalo o de razoacuten)

2 por lo general son faacuteciles de aplicar y raacutepidos de calcular con

tamantildeos pequentildeos de muestra En ocasiones son tan sencillos que basta contar

con la frecuencia con que algunas caracteriacutesticas aparecen en los datos Por lo

tanto a menudo se usan para estudios piloto o preliminares yo en situaciones en

que se desean respuestas raacutepidas

3 hacen menos premisas menos estrictas (mas faacuteciles de cumplir) que

los procedimientos claacutesicos por lo tanto gozan de mayor aplicabilidad y

proporcionan un conjunto de conclusiones mas generales de base mas amplia

4 permiten solucionar problemas que no implican pruebas de

paraacutemetros de poblacioacuten

5 son mas econoacutemicos que los procedimientos claacutesicos ya que el

investigador puede aumentar la potencia y a pesar de ello ahorrar dinero tiempo y

trabajo al recopilar muestras de datos mayores medibles con mas aproximacioacuten

lo que soluciona con mayor rapidez el problema

6 seguacuten el procedimiento seleccionado los meacutetodos no parametricos

pueden ser tan poderosos (o casi tanto) como el procesamiento claacutesico cuando se

cumplen las premisas de este ultimo y quizaacutes sean un poco mas poderosos aun

cuando no se cumplan

Los procedimientos no parametricos tambieacuten ofrecen algunas desventajas

1 no conviene usar meacutetodos no parametricos cuando se pueden

cumplir todas las premisas de los procedimientos claacutesicos y los datos se miden en

una escala bien sea de intervalos de razones A menos de que se empleen

procedimientos claacutesicos en estos casos el investigador no esta aprovechando por

completo los datos Se pierde informacioacuten al convertir datos recopilados (de una

escala de intervalo o de razoacuten) a rangos (escala ordinal) o categoriacuteas (escala

nominal) En particular en esas circunstancias algunas pruebas no parametricas

muy raacutepidas y sencillas tienen mucha menos potencia que los procedimientos

claacutesicos y por lo general se deben evitar

2 seguacuten aumenta el tamantildeo de la muestra en ocasiones el manejo

requerido de datos para los procedimientos no parametricos se hace laborioso a

menos que se disponga de un paquete de computacioacuten adecuado

3 con frecuencia se necesitan tablas especiales de valores

criacuteticos y estas no se obtienen con tanta facilidad como las tablas de los

valores criacuteticos normales t 2X y F Ccedil

Prueba de signos para una sola muestra

Salvo para las pruebas con muestra grande todas las pruebas estaacutendar

concernientes a medias estaacuten basadas en la suposicioacuten de que las poblaciones que

se muestrean tienen aproximadamente la forma de distribuciones normales

Cuando en un caso determinado esta suposicioacuten resulta insostenible la prueba

estaacutendar se puede sustituir por una de varias alternativas no parametricas entre

ellas la ldquoprueba de signosrdquo

La prueba de signos de una sola muestra se aplica cuando se muestrea una

poblacioacuten simeacutetrica continua de manera que la probabilidad de que un valor de la

muestra sea menor que la media o mayor que la media es en ambos casos frac12 Para

probar la hipoacutetesis nula ( O ) contra una hipoacutetesis alternativa apropiada con

base en una muestra aleatoria de tamantildeo n se sustituye cada valor de la muestra

mayor que O por un signo de mas y cada valor de la muestra menor que O por

un signo de menos despueacutes se aprueba la hipoacutetesis nula de que estos signos de

mas y menos son valores de una variable aleatoria que tiene distribucioacuten binomial

con 2

1p (si un valor de la muestra es igual a O simplemente lo rechazamos)

Prueba de suma de rangos

Se puede utilizar cuando se desea probar una hipoacutetesis relacionada a un

paraacutemetro que refleje una tendencia central Cuando no se cumplen las premisas

de la prueba t el procedimiento de Wilcoxon es probable que sea mas potente

para detectar la existencia de diferencias importantes que su contraparte

correspondiente

Para llevar a cabo la prueba de rangos y signos de Wilcoxon se puede

aplicar el siguiente procedimiento de seis pasos

1 para cada partiacutecula en una muestra de n partidas se obtiene un

resultado de diferencia Di

2 despueacutes no se toman en cuenta los signos + y ndash y se obtiene un

grupo de n diferencias absolutas iD

3 se omite de cualquier anaacutelisis adicional cualquier diferencia

absoluta con resultados de 0 con lo cual se obtiene un grupo de n resultados de

diferencias absolutas que no sean cero donde n

4 despueacutes se asignan rangos Ri desde uno hasta n a cada una de las

iD de modo que el resultado de diferencia absoluta mas pequentildeo obtiene una

clasificacioacuten de uno y el mayor de n Por la falta de precisioacuten en el proceso de

medicioacuten si dos o mas iD son iguales a cada una se asigna el ldquorango promediordquo

de los rangos que de lo contrario se les hubieran asignado individualmente si no

hubiera ocurrido la igualdad de los datos

5 ahora se asignan de nuevo el siacutembolo + o el signo ndash a cada uno de

los n rangos de Ri dependiendo de si originalmente Di era positiva o negativa

6 la prueba estadiacutestica de Wilcoxon W se obtiene como la suma de

las clasificaciones +

n

i

iRW1

Para muestras de n 20 se puede utilizar tablas para obtener los valores

criacuteticos de la prueba estadiacutestica W tanto para las pruebas de una cola como de dos

a diversos niveles de significacioacuten Se rechaza la hipoacutetesis nula en una prueba de

dos colas si el valor observado W es igual o excede al valor critico superior o es

igual o inferior al valor critico inferior Se rechaza la hipoacutetesis nula en una prueba

de una cola en direccioacuten positiva si el valor observado W es igual o excede el

valor critico superior Se rechaza la hipoacutetesis nula para una prueba de una cola en

direccioacuten negativa si el valor observado de w es inferior o igual al valor critico

inferior

Para nge20 la prueba estadiacutestica W tiene distribucioacuten aproximadamente

normal y se puede utilizar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis nula

W

WWZ

VARIABLES ALEATORIA Y COMO SE DIVIDEN

Una variable es aleatoria si toma diferentes valores como resultado de un

experimento aleatorio Puede ser discreta o continua Si puede tomar soacutelo un

nuacutemero limitado de valores entonces es una variable aleatoria discreta En el otro

extremo si puede tomar cualquier valor dentro de un intervalo dado entonces se

trata de una variable aleatoria continua

Se puede pensar en una variable aleatoria como un valor o una magnitud

que cambia de una presentacioacuten a otra sin seguir una secuencia predecible Los

valores de una variable aleatoria son los valores numeacutericos correspondientes a

cada posible resultado de un experimento aleatorio

La distribucioacuten de probabilidad de una variable aleatoria proporciona una

probabilidad para cada valor posible y estas probabilidades deben sumar 1

VALOR ESPERADO DE UNA VARIABLE ALEATORIA

El valor esperado es una idea fundamental en el estudio de las distribuciones de

probabilidad

Para obtener el valor esperado de una variable aleatoria discreta se

multiplica cada valor que la variable puede tomar por la probabilidad de

presentacioacuten de ese valor y luego se suman esos productos Es un promedio

pesado de los resultados que se esperan en el futuro El valor esperado pesa cada

resultado posible con respecto a la frecuencia con que se espera se que presente

En consecuencia las presentaciones maacutes comunes tienen asignadas un peso

mayor que las menos comunes

El valor esperado tambieacuten puede ser obtenido a partir de estimaciones

subjetivas En ese caso el valor esperado no es maacutes que la representacioacuten de las

convicciones personales acerca del resultado posible

VARIABLES ALEATORIAS DISCRETAS

Variable que toma un nuacutemero finito o infinito de valores numerables

Sean x1 x2 x3 xn los distintos valores que puede tomar la variable

aleatoria

Y p(x1) p(x2) p(xn) su probabilidad

Los pares de valores (xj p(xj)) constituyen la distribucioacuten de probabilidades de la

variable aleatoria

p(x) se denomina funcioacuten de probabilidad y debe cumplir con las siguientes

propiedades

0 lt p(xj) lt 1 (p(x) es una probabilidad y por lo tanto debe tomar valores

entre 0 y 1)

1)( jxP (la suma de probabilidades repartidas entre todos los valores

de la variable debe ser igual a 1)

De la misma manera que calculamos frecuencias acumuladas podemos acumular

probabilidades obteniendo la funcioacuten de distribucioacuten de probabilidades

Esta funcioacuten representa la probabilidad de que la variable aleatoria sea menor o

igual que un determinado valor

F(xj) = P (X lt xj)

Graacuteficamente la funcioacuten aumenta de a saltos ya que entre dos valores

consecutivos de una variable discreta no puede tomar valores intermedios

VARIABLES ALEATORIAS CONTINUAS

En este caso en lugar de trabajar con la probabilidad de valores

particulares de la variable resulta maacutes apropiado calcular probabilidades

asociadas a intervalos Para distribuir propiedades se usa una funcioacuten que mide

concentracioacuten de probabilidades alrededor de un punto que se denomina

funcioacuten de densidad de probabilidad (fdp) y se denota como f(x)

Una funcioacuten de densidad de probabilidad debe cumplir con las siguientes

propiedades

F(x) gt 0 (la funcioacuten es no negativa para cualquier valor de x f(x) no es

una probabilidad y puede valer maacutes de 1)

el aacuterea bajo la curva de la funcioacuten vale 1)

La funcioacuten de distribucioacuten para una variable aleatoria continua se calcula

F(a) = P(X lt

La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula

P (alt x lt b) = F(b) - F(a)

La probabilidad de que la variable tome un valor particular se puede expresar

como

F(c) - F(c) = 0

DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO

Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia

valores de una variable aleatoria con sus respectivas probabilidades es

decir Probabilidad de x = Funcioacuten de x

Las distribuciones se caracterizan por una foacutermula que determina el tipo de

distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio

muestral

En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una

funcioacuten de la probabilidad que representa los resultados que se van obteniendo en

un experimento aleatorio

Asiacute para un nuacutemero dado x la probabilidad es

A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la

variable X y representa la probabilidad de que la variable tome el valor desde

hasta x

Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de

probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad

Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos

y seraacuten mutuamente excluyentes y su suma es el

suceso por lo que tenemos entonces que

y finalmente

Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos

los valores de la variable aleatoria x conoceremos completamente la distribucioacuten

de probabilidad de la variable

Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten

de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente

Es decir la probabilidad de todo el espacio muestral es 1 tal y como

establece la teoriacutea de la probabilidad y por otra parte

Es decir la probabilidad del suceso nulo es cero

Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de

probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes

praacutectico el uso de la funcioacuten de densidad

En el caso de una variable discreta la distribucioacuten puede describirse

mediante una funcioacuten de probabilidad que para cada valor de x de la variable X

determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de

una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de

distribucioacuten la que para cada valor provee la probabilidad de no ser superado

evidentemente el valor de la funcioacuten de distribucioacuten es igual

a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo

inferior del dominio de la variable hasta x inclusive Lista de los resultados de un

experimento con las probabilidades que se esperariacutean ver asociadas con cada

resultado

Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores

diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12

En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica

Para el caso de 1 solo dado donde todos los valores tienen la misma

probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme

Prueba de aleatoriedad

Con frecuencia se supone que los datos recopilados constituyen una

muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la

utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash

Wolfowitz de corridas de una muestra para aleatoriedadrdquo

Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o

la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos

siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la

partida tiene una propiedad en particular o de la cantidad o magnitud en que se

posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la

sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con

distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente

de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que

la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las

partidas que la preceden o las que la suceden en forma tal que la probabilidad de

su ocurrencia varia de una posicioacuten a otra el proceso no se considera como

aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando

esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en

forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico

Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el

tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico

de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una

prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede

rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la

sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de

una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2

exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por

consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis de aleatoriedad

U

UUZ

donde

U = numero total de corridas

U = valor medio de U 12 21

n

nnU

U = desviacioacuten estaacutendar de U 1

222

2121

nn

nnnnnU

n1 = numero de eacutexitos en la muestra

n2 = numero de fracasos en la muestra

n = tamantildeo de la muestra n = n1 + n2

PRUEBA DE McNEMAR

Suele darse el caso en que se desean comparar las proporciones de los

datos de muestras tomados de poblaciones relacionadas En este caso se quisiera

determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a

alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea

determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y

otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede

utilizar la prueba desarrollada por McNemar

El principal intereacutes es determinar si hay diferencia entre las dos

proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta

que el otro (prueba de una cola)

La prueba estadiacutestica para la prueba de McNemar es

CB

CBZ

PRUEBA U DE MANN ndash WHITNEY

Es una alternativa no parametrica a la prueba t de dos muestras para la

diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula

μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos

la forma de distribuciones normales de hecho la prueba solo requiere que las

poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no

importa si se cumple o no esta suposicioacuten

Estadiacutesticos U1 y U2

111

2112

1 W

nnnnU

222

2122

1 W

nnnnU

PRUEBA DE RACHAS

Son todas las diferencias que tiene el mismo signo y se presentan en una

misma fila Una serie de n diferencias puede tener solamente una racha (toda

positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las

rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de

poblaciones con la misma distribucioacuten de frecuencias Colocamos las

observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces

contamos el numero de rachas item de cada una de las muestras Si hay menos

rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales

rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten

La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de

que las observaciones se han sacado aleatoriamente de una sola poblacioacuten

Para hacer esto se halla la mediana de la muestra y se designa las

observaciones situadas por debajo de la mediana por un signo menos (-) y las

observaciones situadas por encima de la mediana por un signo (+) Si el numero

de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado

rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el

numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10

puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la

tabla normal con

u

uu

z

2

1

12

21

21

NN

NNu

)1()(

2(2

21

2

21

2121212

NNNN

NNNNNNu

DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES

DISTRIBUCIONES DE EJEMPLO Y USO

DISTRIBUCIOacuteN NORMAL O GAUSSIANA

Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que

multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal

Esta distribucioacuten de caracteriza porque los valores se distribuyen formando

una campana de Gauss en torno a un valor central que coincide con el valor

medio de la distribucioacuten

Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a

la izquierda

Esta distribucioacuten viene definida por dos paraacutemetros

X N (m S2)

m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro

de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores

estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores

estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de

ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten

estaacutendar

Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina

normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo

que permiten obtener esos mismos valores donde se recoge la probabilidad

acumulada para cada punto de la curva de esta distribucioacuten

Ademaacutes toda distribucioacuten normal se puede transformar en una normal

tipificada

Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con

media 10 y varianza 4 Transformarla en una normal tipificada

X N (10 4)

Para transformarla en una normal tipificada se crea una nueva variable (Y)

que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica

(que es la raiacutez cuadrada de la varianza)

En el ejemplo la nueva variable seriacutea

Esta nueva variable se distribuye como una normal tipificada

permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor

Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos

indicado de que las probabilidades para cada valor de la curva se encuentran

recogidas en una tabla

MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)

La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten

normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta

distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros

y lo que representamos del modo si su funcioacuten de densidad

es

Observacioacuten

Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y

la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes

adelante65

La forma de la funcioacuten de densidad es la llamada campana de Gauss

Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten

normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1

Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un

uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto

con lo cual en coinciden la media la mediana

y la moda y por uacuteltimo calcular sus puntos de inflexioacuten

El soporte de la distribucioacuten es todo de modo que la mayor parte de la

masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se

encuentra concentrado alrededor de la media y las ramas de la curva se extienden

asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la

media es posible (aunque poco probable)

La forma de la campana de Gauss depende de los paraacutemetros y

indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)

Figura Distribuciones gaussianas con diferentes medias e igual

dispersioacuten

(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor

sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor

de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea

``maacutes aplastado seraacute

Figura Distribuciones gaussianas con igual media pero varianza

diferente

La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes

adelante que es

Como consecuencia la distribucioacuten normal es reproductiva con respecto a

los paraacutemetros y ya que

Observacioacuten

Como se ha mencionado anteriormente la ley de probabilidad gaussiana la

encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza

por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el

de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que

apuntar un hecho negativo para esta ley de probabilidad

La funcioacuten no posee primitiva66

conocida67

Las consecuencias desde el punto de vista praacutectico son importantes ya que

eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de

la normal y nos tenemos que limitar a decir que

sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente

esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho

puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto

se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en

problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde

se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie

limitada de valores xi dados Normalmente F se encuentra tabulada para una

distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten

normal tipificada

En el caso de que tengamos una distribucioacuten diferente se

obtiene Z haciendo el siguiente cambio

De manera general se tiene

Proposicioacuten (Cambio de origen y escala)

Sean Entonces

Este resultado puede ser utilizado del siguiente modo Si y nos

interesa calcular

1 Hacemos el cambio y calculamos

2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de

modo aproximado) Como

tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada

Ejemplo

Supongamos que cierto fenoacutemeno pueda ser representado mediante una

va y queremos calcular la probabilidad de que Xtome un valor

entre 39 y 48 es decir

Comenzamos haciendo el cambio de variable

de modo que

Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que

hemos mencionado anteriormente

Proposicioacuten

Sea Entonces

Demostracioacuten

Por ser la normal una ley de probabilidad se tiene que

es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con

respecto a se obtiene el valor 0

luego

Para demostrar la igualdad entre la y basta con aplicar la misma

teacutecnica pero esta vez derivando con respecto a

Luego

Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en

primer lugar la va tipificada de X

y calculamos

Como por la proposicioacuten 5 deducimos que

CURVA NORMAL ESTANDARIZADA

Una variable numeacuterica puede clasificarse como discreta o continua Las

variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas

con la idea de contar Las variables continuas se pueden asociar con la idea de

medir utilizando fracciones y decimales Cuando la variable es continua el

modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal

El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten

normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran

cantidad de variables continuas

El modelo matemaacutetico

La funcioacuten matemaacutetica que se usa como modelo es

e = 271

π = 314

μx = media de la poblacioacuten

σx = desviacioacuten estaacutendar de la poblacioacuten

x = un valor de la variable continua

Como e y π son constantes la forma de la curva normal depende

solamente de los dos parametros de la distribucioacuten normal la media μx y la

desviacioacuten estaacutendar σx

Las diferentes curvas normales van a variar dependiendo de esos dos

paraacutemetros

En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar

visualmente como una curva en forma de campana El aacuterea debajo de esta curva se

halla por medio del integral de la funcioacuten y corresponde al por ciento o la

proporcioacuten de puntuaciones que se encuentran en el intervalo dado

Propiedades de las distribuciones normales

a Son simeacutetricas y tienen forma de campana

b Al ser simeacutetricas la media la moda y la mediana coinciden

c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea

de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media

d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la

curva se encuentra a tres desviaciones estaacutendar de la media

En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral

de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de

diferentes secciones de la curva o se utiliza la computadora para calcular ese valor

del aacuterea

La distribucioacuten normal estandarizada

Puesto que hay un nuacutemero infinito de combinaciones para los dos

paraacutemetros hay un nuacutemero infinito de curvas normales diferentes

Este problema se ha resuelto praacutecticamente al transformar los valores de

todas las distribuciones normales a los valores de una distribucioacuten normal

estandarizada representada por la curva normal estandarizada (standard normal

curve)

Las puntuaciones estandarizadas se logran restando la media a cada

observacioacuten y dividiendo entre la desviacioacuten estaacutendar

donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar

Propiedades de la distribucioacuten normal estandarizada

μ z = 0

σ z = 1

En muchas ocasiones se quieren comparar puntuaciones que pertenecen a

dos distribuciones normales diferentes La diferencia entre las dos distribuciones

radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo

la comparacioacuten se hace posible si se convierten las puntuaciones de ambas

distribuciones a puntuaciones z que corresponden a la distribucioacuten normal

estandarizada

Percentiles y rangos percentiles de una distribucioacuten normal estandarizada

Si se desea hallar la percentiles o el rango percentil en una distribucioacuten

normal no estandarizada se recurre al procedimiento de convertir las puntuaciones

de la distribucioacuten normal dada a puntuaciones z que corresponden a la

distribucioacuten normal estandarizada

Estos valores en la distribucioacuten normal estandarizada se pueden obtener

por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en

las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el

intervalo dado

Es necesario visualizar siempre el aacuterea debajo de la curva como el por

ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo

dado

Cuando una distribucioacuten de puntuaciones es normal estandarizada la

pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar

en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o

cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten

dada

DISTRIBUCIOacuteN GAMMA

Una variable aleatoria X asociada a un experimento aleatorio tiene una

distribucioacuten GAMMA si se caracteriza por las siguientes propiedades

Algunas alternativas de funciones de densidad se pueden ver en la graacutefica

del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)

respectivamente =1

=1

La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo

III

El modelo Gamma se ha utilizado frecuentemente en variables tales como

ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el

intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson

ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900

ndash Flujos maacuteximos MARKOVIC 1965

ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965

ndash Altura de la precipitacioacuten mensual WHITCOMB 1940

ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia

infin

ndash Ingresos familiares

ndash Edad del hombre al contraer matrimonio por primera vez

ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en

subestaciones a una frecuencia part

Ejemplo

Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos

de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia

promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo

de tiempo se encuentre hasta que ocurre el segundo ciclo

a Dentro de una desviacioacuten con respecto del tiempo promedio

b A maacutes de dos desviaciones por encima de la media

Solucioacuten

X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en

horas

Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)

= 2

Y Nuacutemero de ciclos hora ---------Y~P( =002)

E(Y) = 002 =

X ~ G(2 002)

Ejemplo

En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de

kilovatios por hora puede considerarse como una variable aleatoria con

distribucioacuten GAMMA de paraacutemetros = 3 y

= 05

La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de

KWhora

iquestCuaacutel es la probabilidad de que este abastecimientos sea

a Insuficiente en un diacutea cualquiera

b Se consuman entre 3 y 8 millones de K WHora

c c Encuentre E(x) y V(x)

SOLUCIOacuteN

DISTRIBUCIOacuteN PARETO

En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad

continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores

es

Su funcioacuten de distribucioacuten es

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto

son

El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (

DISTRIBUCIOacuteN T DE STUDENT

Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una

distribucioacuten t con n grados de libertad

Cuando n--gtinfinito a curva t coincide com la normal estandarizada

FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX

MOMENTOS

La distribucioacuten -Student se construye como un cociente entre una normal

y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-

Student con n grados de libertad a la de una va T

donde Este tipo de distribuciones aparece cuando

tenemos n+1 va independientes

y nos interesa la distribucioacuten de

La funcioacuten de densidad de es

Figura Funcioacuten de densidad de una de Student

La distribucioacuten de Student tiene propiedades parecidas a

Es de media cero y simeacutetrica con respecto a la misma

Es algo maacutes dispersa que la normal pero la varianza decrece hasta

1 cuando el nuacutemero de grados de libertad aumenta

Figura Comparacioacuten entre las funciones de densidad de y

Para un nuacutemero alto de grados de libertad se puede aproximar la

distribucioacuten de Student por la normal es decir

Figura Cuando aumentan los grados de libertad la distribucioacuten de

Student se aproxima a la distribucioacuten normal tipificada

Para calcular

DISTRIBUCIOacuteN BETA

Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede

representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un

intervalo de longitud finita Tales como

Proporcioacuten de impurezas en un producto quiacutemico

La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten

La proporcioacuten vendida de un lote durante un tiempo t

La humedad relativa medida en cierto lugar

Porcentaje del costo total destinado a reparacioacuten de maquinaria

Porcentaje de costo adicional destinado a reparacioacuten de maquinaria

La distribucioacuten del tiempo necesario para completar una fase del proyecto

PERT

Evaluacioacuten de programas y teacutecnicas de revisioacuten

Ejemplo

La proporcioacuten de tramos de una autopista que requieren repararse

semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros

= 3 y =2

a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten

b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista

requieren reparacioacuten en un antildeo cualquiera

DISTRIBUCIOacuteN CAUCHY

En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de

Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es

donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene

valor esperado ni varianza

Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V

2 lt 1 el

numero U V tiene la distribucioacuten Cauchy

La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un

grado de libertad

Ejemplo

Sean y dos observaciones independientes de una distribucioacuten

Cauchy con funcioacuten de densidad

Puede demostrarse que si y son tales que entonces la

funcioacuten de verosimilitud de es bimodal

Sean y Supongamos que se desea hacer inferencias sobre el

valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa

Especiacuteficamente interesa encontrar la distribucioacuten final de

Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la

distribucioacuten final de tiene una forma complicada Es conveniente notar sin

embargo que corresponde a la densidad marginal de respecto a la

densidad conjunta

DISTRIBUCIOacuteN BERNOULLI

Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto

suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el

que no lo sea (fracaso) En realidad no se trata maacutes que de una variable

dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello

que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas

obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la

situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este

experimento mediante una va discreta Xque toma los valores X=0 si el suceso no

ocurre y X=1 en caso contrario y que se denota

Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar

una moneda al aire y considerar la va

Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de

probabilidad es

y su funcioacuten de distribucioacuten

Su funcioacuten caracteriacutestica es

Los principales momentos de la X los podemos calcular directamente

o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina

Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)

cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de

intentos

CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE

BERNOULLI

Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la

probabilidad y asegurar que se cumplen las tres condiciones necesarias en

particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del

resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3

requiere que los ensayos o intentos de un proceso de Bernoulli sean

estadiacutesticamente independientes es decir que el resultado de un intento no puede

afectar de ninguacuten modo el resultado de cualquier otro intento

DISTRIBUCIOacuteN EXPONENCIAL

Modelo para variable aleatoria continua que permite representar variables

del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos

Componentes

En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de

probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para

valores x gt 0 es

f(x) = λe - λx

Su funcioacuten de distribucioacuten es

Aqui e significa el nuacutemero e

El valor esperado y la varianza de una variable aleatoria X con

distribucioacuten exponencial son

E[X] = 1 λ

V(X) = 1 λ2

Ejemplo

Ejemplos para la distribucioacuten exponencial son los tiempos dentro

accidentes con probabilidad invariable

La funcioacuten de densidad para λ igual 05 10 y 15

DISTRIBUCIOacuteN MULTINOMIAL

La distribucioacuten multinomial es similar a la distribucioacuten binomial con la

diferencia de que en lugar de dos posibles resultados en cada ensayo

La distribucioacuten multinomial sigue el siguiente modelo

Donde

X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo

que el partido POPO lo hayan votado 3 personas)

n indica el nuacutemero de veces que se ha repetido el suceso (en el

ejemplo 5 veces)

n es factorial de n (en el ejemplo 5 4 3 2 1)

p1 es la probabilidad del suceso X1 (en el ejemplo el 40)

Veamos el ejemplo

Luego

P = 00256

Es decir que la probabilidad de que las 5 personas elegidas hayan votado

de esta manera es tan soacutelo del 256

Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1

Veamos otro ejemplo

En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el

40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4

invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos

Aplicamos el modelo

LuegoP = 00384

Por lo tanto la probabilidad de que el grupo esteacute formado por personas de

estos paiacuteses es tan soacutelo del 384

DISTRIBUCIOacuteN UNIFORME

En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de

probabilidad cuyos valores tienen la misma probabilidad

Caso discreto

Su funcioacuten de probabilidad es en el caso discreto con valores posibles

p(xi) = 1 n

Su funcioacuten de distribucioacuten es en el caso discreto

Su media estadiacutestica es

Caso continuo

Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b

La funcioacuten de densidad en el caso continuo entre a y b es

Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12

Ejemplos

Para un dado perfecto todos los resultados tienen la misma probabilidad 1

6

Calcular variables aleatorias

Las variables aleatorias de probabilidad uniforme pueden calcularse con un

generador de variables aleatorias

DISTRIBUCIOacuteN BINOMIAL

En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad

discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con

probabilidad p de un eacutexito

Su funcioacuten de densidad es

Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)

posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos

((1 - p)n - x

)

El valor esperado de una variable aleatoria de probabilidad binominal es

E[x] = np y su varianza V[x] = np(1 - p)

DISTRIBUCIOacuteN BINOMIAL NEGATIVA

Sobre una sucesioacuten de va de Bernouilli independientes

Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r

eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de

distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo

Su ley de probabilidad se deduce siguiendo el esquema

De nuevo el conjunto de posibles valores de esta va discreta es

Su funcioacuten caracteriacutestica es

y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima

Ejemplo

Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en

operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal

que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda

definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para

intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus

5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones

que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se

necesiten 10 intervenciones

Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por

una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan

4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso

Identificando los paraacutemetros se tiene

Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el

nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy

simple

Y=X+r

Luego

Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente

es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de

que X=10-4=6 Por tanto

La distribucioacuten binomial negativa tambieacuten se puede definir como el

nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas

contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que

DISTRIBUCIOacuteN DE POISSON

Modelo para variable aleatoria discreta que permite calcular la

probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten

discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo

muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos

o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual

a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es

independiente de cuaacutendo se presenta dicho periacuteodo

En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de

probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos

es

Aquiacute e significa el nuacutemero e y x significa el factorial de x

La distribucion de Poisson describe el nuacutemero de sucesos en una unidad

de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un

proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens

en una carrera

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten

Poisson son

E[X] = V[X] = λ

La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos

entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un

conmutador la demanda (necesidades) de los pacientes que requieren servicio en

una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el

nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos

ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una

variable aleatoria discreta que toma valores enteros (0 1 2)

Caacutelculo de la probabilidad de Poisson

La letra X por lo general representa a una variable discreta y puede tomar

valores enteros Utilizamos la letra X para representar a la variable aleatoria y la

letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La

probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson

se calcula con la foacutermula

LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA

DISTRIBUCIOacuteN BINOMIAL

La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la

binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan

cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es

grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan

con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena

aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es

igual o menor que 005 En los casos en que se cumplen estas condiciones

podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media

de la distribucioacuten de Poisson

DISTRIBUCIOacuteN GEOMEacuteTRICA

En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten

probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores

discretos es

P(X = x) = p(1 - p)x - 1

Su funcioacuten de distribucioacuten es

El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media

estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2

Ejemplo

El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es

una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6

DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA

En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de

probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de

masa para valores es

Aqui (a sobre b) es el coeficiente binomial

El valor esperado de una variable aleatoria X de distribucioacuten

hipergeomeacutetrica es

Y su varianza

DISTRIBUCIOacuteN ZETA

En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad

discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos

es

Aqui ζ(s) es la funcioacuten zeta de Rieman con

El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto

DISTRIBUCION CHI CUADRADO

El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una

comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es

diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con

ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno

es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario

estas dos frecuencias acusan una diferencia significativa para por ejemplo un

nivel de significacioacuten del 5

El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la

asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada

por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito

bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor

del famoso libro Statistical Methods for Research Workers (1925) donde se

marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con

Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde

estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y

el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las

pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba

exacta de Fisher

Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico

publicitario presentado a grupos de clientes comparar la rentabilidad de un

proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos

de los turistas por determinados espacios geograacuteficos o por determinados

servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las

frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las

frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o

tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o

de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2

x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos

turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han

ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han

tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula

que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido

en los sitios A y B

Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es

independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo

A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces

alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este

anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos

empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de

las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51

La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten

igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es

2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del

Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del

5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206

podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para

suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B

Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias

observadas empiacutericamente de dos muestras con las frecuencias esperadas o

teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el

Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de

las materias primas perecederas Los resultados son seguacuten atributos cualitativos

los siguientes Primero veremos las frecuencias empiacutericas u observadas

Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten

Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son

131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas

Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y

fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres

columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta

maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x

120 260 = 6046 b2 = 129 x 120 260 = 5954

Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten

igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de

2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de

libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La

diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna

conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten

Es una medida de la discrepancia existente entre las frecuencias

observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso

de frecuencias () debido a que permite determinar las desviaciones entre ellas

ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la

expresioacuten

E

EOX

2

2

Donde

O frecuencia observada

E frecuencia teoacuterica esperada

TEST DE CHI-CUADRADO DE CONTINGENCIA

Un caso particular del test de chi-cuadrado que permite hacer un test sobre

la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-

cuadrado de contingencia Los dos caracteres observados en una misma

poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases

de se denotan las de por Tambieacuten vamos a

denotar

el efectivo conjunto de y es el nuacutemero de individuos para los

cuales toma el valor e el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

Estos valores se representan en una tabla de doble entrada conocida como

tabla de contingencia

Cada fila y cada columna corresponden a una submuestra particular La

fila de iacutendice es la distribucioacuten en las clases de los individuos para

los cuales el caraacutecter toma el valor La columna de iacutendice es la

distribucioacuten en las clases de los individuos para los cuales el caraacutecter

toma el valor Dividiendo las filas y las columnas por su suma se obtienen

frecuencias condicionales para cada una de las distribuciones empiacutericas Para

y las denotaremos por

y

Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y

los perfiles columna Para el modelo probabilista las observaciones provienen de

una muestra

de una ley bidimensional La hipoacutetesis a comprobar

es que los dos marginales de esta ley son independientes Si este es el caso los

perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna

de la de

y

Es equivalente a decir que las frecuencias conjuntas deben estar cerca de

los productos de las frecuencias marginales

Las frecuencias conjuntas por un lado (distribucioacuten observada) y los

productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen

dos distribuciones de probabilidad sobre el conjunto producto

Podemos por tanto calcular la distancia de

chi-cuadrado de una con respecto a la otra

Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la

distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale

Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la

definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado

Por lo dicho anteriormente para suficientemente grande podemos

aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el

nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados

a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las

que han sido estimadas Hay para el caraacutecter y para el caraacutecter

(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley

chi-cuadrado seraacute por tanto

Vamos a presentar un ejemplo de dos caracteres binarios que tienen que

ver con enfermos para los cuales se ha observado si tienen o no una tendencia al

suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y

neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las

tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla

de contingencia observada es

Tendencia Sin tendencia Total

Psicosis 20 180 200

Nneurosis 60 140 200

Total 80 320 400

La distancia de chi-cuadrado de contingencia calculada a partir de esta

tabla es de El valor tomado por el estadiacutegrafo es el cual

debemos comparar con la ley El p-valor es de

Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre

la tendencia al suicidio y la clasificacioacuten de las enfermedades

El test no precisa el sentido de esta dependencia Para describirla hay que

comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre

los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten

PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS

Los investigadores se interesan constantemente en las diferencias entre dos

poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado

civil profesioacuten color de ojos preferencia por una marca etc)

Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de

contingenciardquo

Se puede realizar una prueba para la diferencia entre dos proporciones

sobre la base de muestras independientes usaacutendose como instrumento la prueba

de chi cuadrado

El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es

la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se

podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda

Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la

ecuacioacuten

n

nnE CR

donde

nR nuacutemero total en el rengloacuten

nC nuacutemero total en la columna

n tamantildeo total de la muestra

El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado

entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia

al cuadrado se divide entre la frecuencia esperada de la celda

La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se

rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el

valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados

de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el

tamantildeo de la muestra

CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD

Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a

las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se

puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la

distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado

siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal

Por consiguiente al probar la diferencia entre las dos proporciones la

distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes

Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia

direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten

normal

La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede

ilustrar mediante el siguiente ejemplo

Cuartos de bantildeos modernos

Cocina moderna Caren

cia

existenc

ia

totales

Carencia 72 8 80

Existencia 7 146 153

La hipoacutetesis nula y alternativa seriacutean

YN ppH 0

YN ppH 0

Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de

significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute

Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H

A partir de la informacioacuten del cuadro

10080

8

N

NSN

n

Xp 95420

153

146

Y

YSY

n

Xp

A partir de la expresioacuten

21

21

111

nnpp

pPZ SS

donde

661015380

1468

p

por lo tanto

0813

153

1

80

133906610

95420100

Z

Totales 79 154 223

Dado que 1960813 Z se rechaza la 0H por lo tanto hay

diferencia entre las dos proporciones

Usando la prueba de chi cuadrado y la tabla de contingencia de este

ejemplo se tiene

Las frecuencias teoacutericas se pueden obtener a partir de la siguiente

ecuacioacuten

n

nnE CR

Por lo tanto se tiene

1227233

7980E 8852

233

15480E

8851233

79153E 12101

233

154153E

Chi cuadrado se obtiene a partir de la expresioacuten

E

EOX

2

2

A partir de la tabla se tiene

O E (O ndash E) (O ndash E)2

(O ndash E)2E

7

2

2

712

+4488 20142144 742704

7 5

188

- 4488 20142144 388245

8 5 -4488 20142144 380903

288

1

46

1

0112

+4488 20142144 199191

1711043

10431712 CALCULADOX

Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el

84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo

tanto hay diferencia entre las dos proporciones

Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la

distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos

distribuciones que a un nivel de significancia de 005 el valor de 196 es el

cuadrado de 3 841 es decir 22 ZX

CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA

La afirmacioacuten de que no existen diferencias entre proporciones significa

que las dos variables son independientes Cuando las conclusiones se presentan en

esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo

Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que

no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la

hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos

variables Independientemente de que la prueba de chi cuadrado se considera una

prueba de diferencia entre dos proporciones o una prueba de independencia los

caacutelculos y resultados son exactamente los mismos

CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE

Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o

intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que

ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de

probabilidades

Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que

seguir varios pasos Primero se tiene que establecer la distribucioacuten de

probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada

paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la

media) se deben establecer mediante hipoacutetesis o estimarlos con base a la

informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para

determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o

intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado

para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la

informacioacuten

BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON

La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de

Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la

cantidad de automoacuteviles estacionados en una cochera cubierta siguen una

distribucioacuten de Poisson 0H

En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero

de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una

muestra aleatoria de 233 casas

Numero de automoacuteviles Frecuencia

0 61

1 151

2 21

233

Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados

de la distribucioacuten de frecuencia

No de automoacuteviles Frecuencia observada On

0 61 0

1 151 151

2 21 42

233 193

808280233

193

1

n

On

X

n

i por lo tanto 80X

El valor de la media muestral se utilizara como el estimado de X

Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)

y se obtiene la frecuencia teoacuterica para cada una

Automoacutevil

n

Frecuencia

O

Probabilidad

XP

Frecuencia (E)

XPn

0 61 04493 104687

1 151 03595 87764

2 21 01438 33505

Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de

significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX

El valor calculado de chi cuadrado es

50679

2

2

K

CALCULADO

E

EOX

Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de

automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una

distribucioacuten de Poisson

CORRECCIOacuteN DE YATES

Cuando se aplican a datos discretos los resultados para distribuciones

continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres

comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de

Yates la cual viene dada mediante la expresioacuten

E

EOX CALCULADO

502

2

En general la correccioacuten se hace solamente cuando el numero de grados

de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos

resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en

relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia

esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi

cuadrado corregido y no corregido Si ambos valores conducen a la misma

conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se

presentan dificultades Si conducen a conclusiones diferentes se puede o bien

incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear

meacutetodos de probabilidad exactos

El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente

ejemplo

En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces

Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de

significancia del 005

No de caras Frecuencia Probabilidad Frecuencia (E)

Cara 115 05 100

cruce 85 05 100

2054

100

0510085

100

0510011522

2

CALCULADOX

Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado

con correccioacuten de Yates es

8432 TABULADOX

Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha

PRUEBA EXACTA DE FISHER

Para examinar la igualdad de las varianzas de dos poblaciones

independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de

las varianzas de las dos muestras Suponiendo que la informacioacuten de cada

poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2

2

2

1 SS sigue una

distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso

estadiacutestico RA Fisher

Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de

grados de libertad los grados de libertad en el numerador y en el denominador

la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea

2

2

2

111 21

S

SF nn

donde

n1 = tamantildeo de muestra en el grupo 1

n2 = tamantildeo de muestra en el grupo 2

n1 ndash 1 = grados de libertad en el grupo 1

n2 ndash 1 = grados de libertad en el grupo 2

2

1S varianza de la muestra en el grupo 1

2

2S varianza de la muestra en el grupo 2

Al probar la igualdad de dos varianzas se pueden emplear pruebas de una

cola o de dos colas

El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente

ejemplo

Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas

alta en la planta A que en la planta B Para determinar la variabilidad se puede

establecer una prueba de una cola en la forma siguiente

22 BAOH

22

1 BAH

Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta

A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta

ubicada en la cola superior de la distribucioacuten

Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de

libertad en el numerador y 19 en el denominador a un nivel de significancia de

001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene

71162 AS y 20142 BS por lo tanto

38512014

71162

2

1924 F como 1385 lt

292 no se rechaza la hipoacutetesis nula ( OH )

CONCLUSIOacuteN

La conclusioacuten que los resultados de una medida variable es la causa de

variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten

estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero

no puede reclamar legitimidad

La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en

describir la distribucioacuten de las variables estudiadas y en particular de los datos

numeacutericos Ademaacutes de las medidas descriptivas correspondientes el

comportamiento de estas variables puede explorarse graacuteficamente de un modo

muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro

organizador de las ciencias computarizadas y el modelo que nos dota de un

mejor razonamiento para implementar programas eficientes En este sentido la

combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un

reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en

colegios y universidades

Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de

combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y

evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras

loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre

operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten

juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la

teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones

simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades

que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea

BIBLIOGRAFIacuteA

AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis

Third Edition Texts in Statistical Science Chapman and Hall

BOXG E P HUNTER W G HUNTER JS (1978) Statistics for

Experimenters John Wiley amp Sons

BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores

Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de

Modelos Ed Revertsbquo SA

Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed

Piraacutemide

Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten

(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica

Matemaacutetica I Universidad de Antioquia

Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma

Madrid

Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill

Meacutexico

Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten

yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico

Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw

ndashHill 4ta Edicioacuten Colombia

CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana

Meacutexico

COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas

COX DR (1958) Planning of experiments New York John Wiley amp Sons

DANIEL C Applications of Statistics to Industrial Experimentation Willey

DAVIES OL The Design and Analysis of Industrial Experiments Hafner

(McMillan)

DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias

Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico

SA de CV Meacutexico

De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H

(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico

Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta

Estadiacutestica Editorial Microsoft corporation USA

ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial

Limusa SA Meacutexico

EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis

Arnold

FEDERER W (1965) Experimental design Oxford Publ Co

GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la

Varianza Grupo Editorial Universitario

FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico

McGraw Hill

FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque

ModernoEditorial SA Meacutexico

George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y

Meacutetodosrdquo Ed McGraw-Hill

GILL JL (1978) Design and Analysis of Experiments in the Animal and

Medical Sciences Iowa State University Press

JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression

and Experimental Design Springer-Verlag

Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor

Caracas

GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining

Institute

GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data

Mining Institute

Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial

Bourgeoacuten Caracas

Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la

EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute

Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial

BourgeoacutenCA Caracas ndash Venezuela

HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis

Multivariante 5ordf Edicioacuten Prentice Hall

JOBSON JD (1992) Applied Multivariate Data Analysis Volume II

Categorical and Multivariate Methods Springer-Verlag

KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial

Hispanoamericana Meacutexico

KIRK RE Experimental Design Procedures for the Behavioral Sciencies

BrooksCole Publishing Company

LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e

inferencia Estadiacutestica Editorial Limusa Meacutexico

LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV

Grupo Noriega Editores Meacutexico

LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial

HARLA Meacutexico

LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta

edicioacuten Editorial McGaw-Hill Usa

Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial

Hispanoameacuterica VI edicioacuten Meacutexico

LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire

Multidimensionnelle 3ordf Edition DUNOD

LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e

Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB

Caracas- Venezuela

LORENZEN T J Anderson V L (1993) Design of experiments A No-Name

Approach Marcel Dekker Inc

Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc

(1999) SPSS 90 Manual de Usuario SPSS Chicago

MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis

Academic Press

Enfocados hacia SPSS

Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de

wwwspssparatodoscom 2005

MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten

Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla

Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea

Ediciones Alfaomega SAN Meacutexico

MASON RL Statistical Design and Analysis of Experiments with Applications

to Engineering and Science John Wiley amp Sons New York

MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y

Economiacutea Editorial Iberoamericana Meacutexico

MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in

agriculture and experimental biology Second edition Chapman amp Hall

MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo

Editorial Iberoameacuterica

MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers

John Wiley amp Sons

Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial

Reverte Mejicana Meacutexico

Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da

Edicioacuten Meacutexico

Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc

Graw Hill

PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones

Editorial Limusa Meacutexico

NETER J et al Applied Linear Statistical Models Regression Analysis of

Variance and Experimental Designs Library of Congress Cataloging Publication

Data

OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp

RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo

Editorial Universitario

PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos

Lineales y Series Temporales Vol 1 y 2 Alianza Editorial

Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores

Spain SA Espantildea 2005

PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial

Mir Moscuacute

RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed

McGraw-Hill

Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca

UCV Caracas ndash Venezuela

RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE

Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en

Psicologiacuteardquo p 1

SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons

Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti

Caracas ndash Venezuela

Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores

deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico

Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica

Editorial Harla Meacutexico

STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y

procedimientos Segunda edicioacuten McGraw Hill

SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas

Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1

Ediciones UNESR Caracas

URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante

Coartiacuteculo Plan Nuevo Editorial AC

VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II

Anaacutelisis Multivariante) Mc-Graw Hill

Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows

Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea

2002

WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros

Editorial Interamericana Meacutexico

Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8

Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage

Learning Editores p 364 ISBN 9706861947

Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea

Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea

Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de

CV Meacutexico

Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para

Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico

DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR

httpesmwikipediaorgwikiSPSS

httpwwwbuenastareascomensayosque-es-el-SPSS1465478html

httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-

del-software-estadistico-integral-spss-base-160

httpesanswersyahoocomquestionindexqid=20070727073908aatuamw

httpwwwslidesharenetleticiagpestructura-de-spss-3126476

httpwwwehowenespanolcomprograma-spss-sobre_48697

httpwwwugres~bioestmedicinamanual_spsspdf

httpwwwmonografiascomtrabajos12tutortutorshtml

httpwwwspsscom

wwwspssparatodoscom

httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html

httpwwwspssfreecomcapitulotreshtml

httpwwwuvesRELIEVEemail relieveuves

httpwwwscribdcomdochellipspss-introduccioacuten

httpeswikipediaorgwikiSPSS

httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd

f

httpwwwspsscomaressuccessargentinashtml

httpeswikipediaorgwikiSPSS

httpwww-01ibmcomsoftwareesanalyticsspss

httppsicofcepurvesspssindex0htm

httpssitesgooglecomsiteestadisticaconelspss

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpe-stadisticabioucmesweb_spssindice_spsshtml

httpwwwquimicaurvesquimiogeneralanovacastpdf

httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da

tosyMultivariable14anova1_SPSSpdf

httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800

20AnE1lisis20de20Varianzaspdf

httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-

pearson

httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf

httpwwwuoceduin3emathdocsRegresionLinealpdf

httpeswikipediaorgwikiRegresiC3B3n_lineal

httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES

ION_LINEAL_CON_SPSSpdf

httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN

EAL20SIMPLE20CON20SPSSpdf

httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE

SION_LINEAL_CON_SPSSpdf

httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm

httpeswikipediaorgwikiNivel_de_medida

httphtmlrincondelvagocomregresion-lineal-simplehtml

httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp

lepdf

httpwwwvitutorcomestadisticabi8html

httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf

httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-

Martinez_1pdf

httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml

httpesslidesharenetpatolinkecuacin-de-regresin-lineal

httpeswikipediaorgwikiMC3ADnimos_cuadrados

httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios

httpwwwwordreferencecomdefinicioncorrelaciC3B3n

httpwwwditutorcomestadistica_2correlacion_estadisticahtml

httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson

httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n

httpeswikipediaorgwikiMatriz_de_correlaciC3B3n

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpwwwinfecepiunizares

httpwwwltbioestadisticaumaes

httpwwwuaqmxmatematicasestadisticasxu3html

httpwwwmembers-americastripodcom

httpwwwmsiplceorg

httpwwwbnvcocrsesionnotaaspg

httpwwwaltavistacom

httpwwwauyantepuycom

httpwwwinees

httpwwwudeccl

httpwwwrincondelvagocom

httpwwwmonografiascom

httpwwwfestadisticafguamesindicadoresiprihtml

httpwwwuaqmxmatematicasestadisticaxu3html

httpwwwinegoboiwd0801htmlE

httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm

httpwwwitlpedumx

httpwwweclaevespanovestadisticasna93nnsnann7eshtml

httpw3moritesmmx~cmendozamaestestoohtml

httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml

httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion

httpwwwunleduarfaveseiencuestasindexhtml

httpwwwmonografiascomtrabajos11operaoperashtml

httpwwwmonografiascomtrabajos6hisohisoshtml

httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos

httpwwwmonografiascomtrabajos16sistema-operativosistema-

operativoshtmlTIPPOS

httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-

operativoshtml

httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei

httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml

httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-

operativo

httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software

httpwwwsscccoclinformaticaconceptoshtml

httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr

httpwwwcadcommxhistoria_de_la_computacionhtm

httpwwweswikipediaorgwikiBus_(informC3A1tica)

httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla

httpwwwcavsicompreguntasrespuestasque-es-el-teclado

httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm

Page 3: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,

PRUEBAS PARAMEacuteTRICAS

Porque comparan los grupos a traveacutes de una medida de tendencia central

(paraacutemetro) la media aritmeacutetica Como vemos este valor adquiere una vital

importancia

Mientras que las pruebas que suponen una distribucioacuten de probabilidad

determinada para los datos se denominan pruebas parameacutetricas

Dentro de las pruebas parameacutetricas las maacutes habituales se basan en la

distribucioacuten de probabilidad normal y al estimar los paraacutemetros del modelo se

supone que los datos constituyen una muestra aleatoria de esa distribucioacuten por lo

que la eleccioacuten del estimador y el caacutelculo de la precisioacuten de la estimacioacuten

elementos baacutesicos para construir intervalos de confianza y contrastar hipoacutetesis

dependen del modelo probabiliacutestico supuesto

Cuando un procedimiento estadiacutestico es poco sensible a alteraciones en el

modelo probabiliacutestico supuesto es decir que los resultados obtenidos son

aproximadamente vaacutelidos cuando eacuteste variacutea se dice que es un procedimiento

robusto

Las inferencias en cuanto a las medias son en general robustas por lo que

si el tamantildeo de muestra es grande los intervalos de confianza y contrastes

basados en la t de Student son aproximadamente vaacutelidos con independencia de la

verdadera distribucioacuten de probabilidad de los datos pero si eacutesta distribucioacuten no es

normal los resultados de la estimacioacuten seraacuten poco precisos

iquestEn queacute condiciones la media es realmente un valor representativo de una serie de

datos Como sabemos existen otras medidas de tendencia central que seguacuten la

distribucioacuten de los datos pueden llegar a ser maacutes representativas Cuando los

datos siguen una distribucioacuten normal la media actuacutea como una buena medida

resumen Recordemos algunas de las caracteriacutesticas de esta distribucioacuten

Viene determinada por dos paraacutemetros la media (micro) y la desviacioacuten tiacutepica () Es

acampanada y simeacutetrica alrededor de la media

Recordemos que por ejemplo si se cumplen los supuestos de

normalidad (fig 1)

El valor de la micro plusmn 1 incluiraacute aproximadamente el 683 central de las

observaciones

El valor de la micro plusmn 2 incluiraacute aproximadamente el 953 central de las

observaciones

El valor de la micro plusmn 3 incluiraacute praacutecticamente todas las observaciones el

997

Conocidas la micro y la se puede reconstruir la distribucioacuten de las

observaciones

La igualdad de variancias es el otro gran obstaacuteculo que deberemos salvar

Dos distribuciones pueden tener el mismo valor en el paraacutemetro media mostrando

el primer valor cercano a la media (poca dispersioacuten variancia pequentildea) y la

segunda valores alejados de dicho paraacutemetro (maacutes dispersioacuten gran variancia)

Como vemos estas dos variables siguen diferentes patrones aunque tienen en

comuacuten el mismo valor de la media (fig 2)

iquestPor queacute tienen estas asunciones Las pruebas parameacutetricas asumen que

los datos de las variables a comparar se distribuyen de igual forma pero que entre

ellos existe un desplazamiento fijo es decir para cada valor de una muestra hay

un valor igual pero incrementado en un valor constante (K) al que podriacuteamos

llamar desplazamiento (fig 3) Si este valor constante se acerca al valor 0 no

habriacutea diferencias entre los grupos ya que existiriacutea un solapamiento entre los

valores a comparar Cuanto maacutes se aleje del valor 0

mayores seraacuten las diferencias

Obseacutervese la importancia de asumir que este valor de desplazamiento de

una muestra a la otra es constante Si estamos comparando dos diferentes

tratamientos por ejemplo un placebo y un principio activo en dos muestras que

son homogeacuteneas basalmente este valor K seraacute el efecto que podremos imputar al

principio activo en cada caso la diferencia entre medias representa no el efecto

promedio sino el efecto del tratamiento en cada caso Si por el contrario este

efecto no fuera constante ya no se cumpliriacutean los supuestos de estas pruebas

Fig 1

Fig 2

Fig 3

Dentro de las pruebas parameacutetricas se tienen para muestras grandes y para

muestras pequentildeas Un supuesto que se aplica a ambas es que la muestra que se

toma debe haber sido seleccionada en forma aleatoria o probabiliacutestica En las

pruebas parameacutetricas de muestra pequentildea se requiere el supuesto de que las

muestras fueron extraiacutedas de una poblacioacuten con distribucioacuten normal y cuando se

trata de dos o maacutes muestras tambieacuten se requiere una prueba de igualdad de

varianzas Existen pruebas estadiacutesticas por medio de las cuales se podriacutea

comprobar esto sin embargo suele no daacutersele importancia a esto y se pasa por

alto El anaacutelisis de varianza tambieacuten se basa en el supuesto de normalidad de las

poblaciones y en el de que sus varianzas son iguales

En las pruebas en las que se tienen menos supuestos es en las de muestra

grande las cuales se pueden aplicar sin saber o comprobar si la poblacioacuten o

poblaciones eran normales estas pruebas se dice que son robustas porque no es

necesario que se cumpla dicho supuesto Cuando la prueba que se requiere no es

robusta no es necesario correr el riesgo de estar equivocados en las conclusiones

en ellos En cambio se dispone de muchas pruebas estadiacutesticas no parameacutetricas

que tienen una aplicacioacuten semejante a las parameacutetricas de muestra pequentildea en las

que se tienen menos supuestos

PRUEBAS NO PARAMEacuteTRICAS

Se denominan pruebas no parameacutetricas aquellas que no presuponen una

distribucioacuten de probabilidad para los datos por ello se conocen tambieacuten como de

distribucioacuten libre (distribution free) En la mayor parte de ellas los resultados

estadiacutesticos se derivan uacutenicamente a partir de procedimientos de ordenacioacuten y

recuento por lo que su base loacutegica es de faacutecil comprensioacuten Cuando trabajamos

con muestras pequentildeas (n lt 10) en las que se desconoce si es vaacutelido suponer la

normalidad de los datos conviene utilizar pruebas no parameacutetricas al menos para

corroborar los resultados obtenidos a partir de la utilizacioacuten de la teoriacutea basada en

la normal

Cuando se analizan datos medidos por una variable cuantitativa continua

las pruebas estadiacutesticas de estimacioacuten y contraste frecuentemente empleadas se

basan en suponer que se ha obtenido una muestra aleatoria de una distribucioacuten de

probabilidad de tipo normal o de Gauss Pero en muchas ocasiones esta

suposicioacuten no resulta vaacutelida y en otras la sospecha de que no sea adecuada no

resulta faacutecil de comprobar por tratarse de muestras pequentildeas En estos casos

disponemos de dos posibles mecanismos los datos se pueden transformar de tal

manera que sigan una distribucioacuten normal o bien se puede acudir a pruebas

estadiacutesticas que no se basan en ninguna suposicioacuten en cuanto a la distribucioacuten de

probabilidad a partir de la que fueron obtenidos los datos y por ello se denominan

pruebas no parameacutetricas (distribution free)

La mayoriacutea de las pruebas de hipoacutetesis requieren suposiciones especiacuteficas

acerca de la poblacioacuten o poblaciones que se muestran En muchos casos debemos

suponer que las poblaciones tienen maacutes o menos la forma de distribuciones

normales o que se conocen sus varianzas o se sabe que son iguales o bien que las

muestras son independientes Como hay muchos casos donde no se pueden

cumplir estas suposiciones los estadiacutesticos han generado teacutecnicas alternativas

basadas en suposiciones menos estrictas que se han dado a conocer como

ldquoPruebas no parametricasrdquo

En estos casos se emplea como paraacutemetro de centralizacioacuten la mediana

que es aquel punto para el que el valor de X estaacute el 50 de las veces por debajo y

el 50 por encima

Propiedades

1 No se relacionan con el estudio de un paraacutemetro de la poblacioacuten

Por lo general cuando se hace referencia a pruebas no parameacutetricas se puede estar

hablando tanto de las no parameacutetricas como de las libres de distribucioacuten

(distribution free tests)

Las dos indicaciones maacutes importantes que se deben tener en cuenta para utilizar

una prueba no parameacutetrica son que

1 la distribucioacuten de la poblacioacuten no sea normal

2 la escala de medicioacuten de la variable en cuestioacuten sea categoacuterica

Los meacutetodos no parameacutetricos son menos poderosos que los parameacutetricos Esto

quiere decir que es maacutes difiacutecil rechazar la hipoacutetesis nula con las pruebas no

parameacutetricas

Por esa razoacuten los estadiacutesticos por lo general recurren a los meacutetodos no

parameacutetricos soacutelo cuando los datos no cumplen con los supuestos parameacutetricos

Sin embargo hay problemas de investigacioacuten en los que las variables categoacutericas

son las indicadas y por lo tanto soacutelo un meacutetodo no parameacutetrico es el indicado Los

pasos en las pruebas de hipoacutetesis no parameacutetricas son los mismos de las

parameacutetricas Los cambios por lo general se limitan a cambios en la foacutermula para

obtener el valor observado y en la tabla que se utiliza Pero se habla de hipoacutetesis

nula nivel de significacioacuten error tipo I y tipo II etc

El uso de meacutetodos no parametricos ofrece numerosas ventajas

1 los meacutetodos no parametricos se pueden usar con todo tipos de datos

ndash informacioacuten cualitativa (de escala nominal) informacioacuten en forma de rangos

(escala ordinal) asiacute como informacioacuten medida de un modo mas exacto (escala de

intervalo o de razoacuten)

2 por lo general son faacuteciles de aplicar y raacutepidos de calcular con

tamantildeos pequentildeos de muestra En ocasiones son tan sencillos que basta contar

con la frecuencia con que algunas caracteriacutesticas aparecen en los datos Por lo

tanto a menudo se usan para estudios piloto o preliminares yo en situaciones en

que se desean respuestas raacutepidas

3 hacen menos premisas menos estrictas (mas faacuteciles de cumplir) que

los procedimientos claacutesicos por lo tanto gozan de mayor aplicabilidad y

proporcionan un conjunto de conclusiones mas generales de base mas amplia

4 permiten solucionar problemas que no implican pruebas de

paraacutemetros de poblacioacuten

5 son mas econoacutemicos que los procedimientos claacutesicos ya que el

investigador puede aumentar la potencia y a pesar de ello ahorrar dinero tiempo y

trabajo al recopilar muestras de datos mayores medibles con mas aproximacioacuten

lo que soluciona con mayor rapidez el problema

6 seguacuten el procedimiento seleccionado los meacutetodos no parametricos

pueden ser tan poderosos (o casi tanto) como el procesamiento claacutesico cuando se

cumplen las premisas de este ultimo y quizaacutes sean un poco mas poderosos aun

cuando no se cumplan

Los procedimientos no parametricos tambieacuten ofrecen algunas desventajas

1 no conviene usar meacutetodos no parametricos cuando se pueden

cumplir todas las premisas de los procedimientos claacutesicos y los datos se miden en

una escala bien sea de intervalos de razones A menos de que se empleen

procedimientos claacutesicos en estos casos el investigador no esta aprovechando por

completo los datos Se pierde informacioacuten al convertir datos recopilados (de una

escala de intervalo o de razoacuten) a rangos (escala ordinal) o categoriacuteas (escala

nominal) En particular en esas circunstancias algunas pruebas no parametricas

muy raacutepidas y sencillas tienen mucha menos potencia que los procedimientos

claacutesicos y por lo general se deben evitar

2 seguacuten aumenta el tamantildeo de la muestra en ocasiones el manejo

requerido de datos para los procedimientos no parametricos se hace laborioso a

menos que se disponga de un paquete de computacioacuten adecuado

3 con frecuencia se necesitan tablas especiales de valores

criacuteticos y estas no se obtienen con tanta facilidad como las tablas de los

valores criacuteticos normales t 2X y F Ccedil

Prueba de signos para una sola muestra

Salvo para las pruebas con muestra grande todas las pruebas estaacutendar

concernientes a medias estaacuten basadas en la suposicioacuten de que las poblaciones que

se muestrean tienen aproximadamente la forma de distribuciones normales

Cuando en un caso determinado esta suposicioacuten resulta insostenible la prueba

estaacutendar se puede sustituir por una de varias alternativas no parametricas entre

ellas la ldquoprueba de signosrdquo

La prueba de signos de una sola muestra se aplica cuando se muestrea una

poblacioacuten simeacutetrica continua de manera que la probabilidad de que un valor de la

muestra sea menor que la media o mayor que la media es en ambos casos frac12 Para

probar la hipoacutetesis nula ( O ) contra una hipoacutetesis alternativa apropiada con

base en una muestra aleatoria de tamantildeo n se sustituye cada valor de la muestra

mayor que O por un signo de mas y cada valor de la muestra menor que O por

un signo de menos despueacutes se aprueba la hipoacutetesis nula de que estos signos de

mas y menos son valores de una variable aleatoria que tiene distribucioacuten binomial

con 2

1p (si un valor de la muestra es igual a O simplemente lo rechazamos)

Prueba de suma de rangos

Se puede utilizar cuando se desea probar una hipoacutetesis relacionada a un

paraacutemetro que refleje una tendencia central Cuando no se cumplen las premisas

de la prueba t el procedimiento de Wilcoxon es probable que sea mas potente

para detectar la existencia de diferencias importantes que su contraparte

correspondiente

Para llevar a cabo la prueba de rangos y signos de Wilcoxon se puede

aplicar el siguiente procedimiento de seis pasos

1 para cada partiacutecula en una muestra de n partidas se obtiene un

resultado de diferencia Di

2 despueacutes no se toman en cuenta los signos + y ndash y se obtiene un

grupo de n diferencias absolutas iD

3 se omite de cualquier anaacutelisis adicional cualquier diferencia

absoluta con resultados de 0 con lo cual se obtiene un grupo de n resultados de

diferencias absolutas que no sean cero donde n

4 despueacutes se asignan rangos Ri desde uno hasta n a cada una de las

iD de modo que el resultado de diferencia absoluta mas pequentildeo obtiene una

clasificacioacuten de uno y el mayor de n Por la falta de precisioacuten en el proceso de

medicioacuten si dos o mas iD son iguales a cada una se asigna el ldquorango promediordquo

de los rangos que de lo contrario se les hubieran asignado individualmente si no

hubiera ocurrido la igualdad de los datos

5 ahora se asignan de nuevo el siacutembolo + o el signo ndash a cada uno de

los n rangos de Ri dependiendo de si originalmente Di era positiva o negativa

6 la prueba estadiacutestica de Wilcoxon W se obtiene como la suma de

las clasificaciones +

n

i

iRW1

Para muestras de n 20 se puede utilizar tablas para obtener los valores

criacuteticos de la prueba estadiacutestica W tanto para las pruebas de una cola como de dos

a diversos niveles de significacioacuten Se rechaza la hipoacutetesis nula en una prueba de

dos colas si el valor observado W es igual o excede al valor critico superior o es

igual o inferior al valor critico inferior Se rechaza la hipoacutetesis nula en una prueba

de una cola en direccioacuten positiva si el valor observado W es igual o excede el

valor critico superior Se rechaza la hipoacutetesis nula para una prueba de una cola en

direccioacuten negativa si el valor observado de w es inferior o igual al valor critico

inferior

Para nge20 la prueba estadiacutestica W tiene distribucioacuten aproximadamente

normal y se puede utilizar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis nula

W

WWZ

VARIABLES ALEATORIA Y COMO SE DIVIDEN

Una variable es aleatoria si toma diferentes valores como resultado de un

experimento aleatorio Puede ser discreta o continua Si puede tomar soacutelo un

nuacutemero limitado de valores entonces es una variable aleatoria discreta En el otro

extremo si puede tomar cualquier valor dentro de un intervalo dado entonces se

trata de una variable aleatoria continua

Se puede pensar en una variable aleatoria como un valor o una magnitud

que cambia de una presentacioacuten a otra sin seguir una secuencia predecible Los

valores de una variable aleatoria son los valores numeacutericos correspondientes a

cada posible resultado de un experimento aleatorio

La distribucioacuten de probabilidad de una variable aleatoria proporciona una

probabilidad para cada valor posible y estas probabilidades deben sumar 1

VALOR ESPERADO DE UNA VARIABLE ALEATORIA

El valor esperado es una idea fundamental en el estudio de las distribuciones de

probabilidad

Para obtener el valor esperado de una variable aleatoria discreta se

multiplica cada valor que la variable puede tomar por la probabilidad de

presentacioacuten de ese valor y luego se suman esos productos Es un promedio

pesado de los resultados que se esperan en el futuro El valor esperado pesa cada

resultado posible con respecto a la frecuencia con que se espera se que presente

En consecuencia las presentaciones maacutes comunes tienen asignadas un peso

mayor que las menos comunes

El valor esperado tambieacuten puede ser obtenido a partir de estimaciones

subjetivas En ese caso el valor esperado no es maacutes que la representacioacuten de las

convicciones personales acerca del resultado posible

VARIABLES ALEATORIAS DISCRETAS

Variable que toma un nuacutemero finito o infinito de valores numerables

Sean x1 x2 x3 xn los distintos valores que puede tomar la variable

aleatoria

Y p(x1) p(x2) p(xn) su probabilidad

Los pares de valores (xj p(xj)) constituyen la distribucioacuten de probabilidades de la

variable aleatoria

p(x) se denomina funcioacuten de probabilidad y debe cumplir con las siguientes

propiedades

0 lt p(xj) lt 1 (p(x) es una probabilidad y por lo tanto debe tomar valores

entre 0 y 1)

1)( jxP (la suma de probabilidades repartidas entre todos los valores

de la variable debe ser igual a 1)

De la misma manera que calculamos frecuencias acumuladas podemos acumular

probabilidades obteniendo la funcioacuten de distribucioacuten de probabilidades

Esta funcioacuten representa la probabilidad de que la variable aleatoria sea menor o

igual que un determinado valor

F(xj) = P (X lt xj)

Graacuteficamente la funcioacuten aumenta de a saltos ya que entre dos valores

consecutivos de una variable discreta no puede tomar valores intermedios

VARIABLES ALEATORIAS CONTINUAS

En este caso en lugar de trabajar con la probabilidad de valores

particulares de la variable resulta maacutes apropiado calcular probabilidades

asociadas a intervalos Para distribuir propiedades se usa una funcioacuten que mide

concentracioacuten de probabilidades alrededor de un punto que se denomina

funcioacuten de densidad de probabilidad (fdp) y se denota como f(x)

Una funcioacuten de densidad de probabilidad debe cumplir con las siguientes

propiedades

F(x) gt 0 (la funcioacuten es no negativa para cualquier valor de x f(x) no es

una probabilidad y puede valer maacutes de 1)

el aacuterea bajo la curva de la funcioacuten vale 1)

La funcioacuten de distribucioacuten para una variable aleatoria continua se calcula

F(a) = P(X lt

La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula

P (alt x lt b) = F(b) - F(a)

La probabilidad de que la variable tome un valor particular se puede expresar

como

F(c) - F(c) = 0

DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO

Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia

valores de una variable aleatoria con sus respectivas probabilidades es

decir Probabilidad de x = Funcioacuten de x

Las distribuciones se caracterizan por una foacutermula que determina el tipo de

distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio

muestral

En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una

funcioacuten de la probabilidad que representa los resultados que se van obteniendo en

un experimento aleatorio

Asiacute para un nuacutemero dado x la probabilidad es

A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la

variable X y representa la probabilidad de que la variable tome el valor desde

hasta x

Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de

probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad

Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos

y seraacuten mutuamente excluyentes y su suma es el

suceso por lo que tenemos entonces que

y finalmente

Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos

los valores de la variable aleatoria x conoceremos completamente la distribucioacuten

de probabilidad de la variable

Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten

de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente

Es decir la probabilidad de todo el espacio muestral es 1 tal y como

establece la teoriacutea de la probabilidad y por otra parte

Es decir la probabilidad del suceso nulo es cero

Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de

probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes

praacutectico el uso de la funcioacuten de densidad

En el caso de una variable discreta la distribucioacuten puede describirse

mediante una funcioacuten de probabilidad que para cada valor de x de la variable X

determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de

una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de

distribucioacuten la que para cada valor provee la probabilidad de no ser superado

evidentemente el valor de la funcioacuten de distribucioacuten es igual

a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo

inferior del dominio de la variable hasta x inclusive Lista de los resultados de un

experimento con las probabilidades que se esperariacutean ver asociadas con cada

resultado

Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores

diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12

En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica

Para el caso de 1 solo dado donde todos los valores tienen la misma

probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme

Prueba de aleatoriedad

Con frecuencia se supone que los datos recopilados constituyen una

muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la

utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash

Wolfowitz de corridas de una muestra para aleatoriedadrdquo

Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o

la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos

siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la

partida tiene una propiedad en particular o de la cantidad o magnitud en que se

posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la

sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con

distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente

de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que

la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las

partidas que la preceden o las que la suceden en forma tal que la probabilidad de

su ocurrencia varia de una posicioacuten a otra el proceso no se considera como

aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando

esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en

forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico

Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el

tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico

de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una

prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede

rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la

sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de

una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2

exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por

consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis de aleatoriedad

U

UUZ

donde

U = numero total de corridas

U = valor medio de U 12 21

n

nnU

U = desviacioacuten estaacutendar de U 1

222

2121

nn

nnnnnU

n1 = numero de eacutexitos en la muestra

n2 = numero de fracasos en la muestra

n = tamantildeo de la muestra n = n1 + n2

PRUEBA DE McNEMAR

Suele darse el caso en que se desean comparar las proporciones de los

datos de muestras tomados de poblaciones relacionadas En este caso se quisiera

determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a

alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea

determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y

otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede

utilizar la prueba desarrollada por McNemar

El principal intereacutes es determinar si hay diferencia entre las dos

proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta

que el otro (prueba de una cola)

La prueba estadiacutestica para la prueba de McNemar es

CB

CBZ

PRUEBA U DE MANN ndash WHITNEY

Es una alternativa no parametrica a la prueba t de dos muestras para la

diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula

μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos

la forma de distribuciones normales de hecho la prueba solo requiere que las

poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no

importa si se cumple o no esta suposicioacuten

Estadiacutesticos U1 y U2

111

2112

1 W

nnnnU

222

2122

1 W

nnnnU

PRUEBA DE RACHAS

Son todas las diferencias que tiene el mismo signo y se presentan en una

misma fila Una serie de n diferencias puede tener solamente una racha (toda

positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las

rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de

poblaciones con la misma distribucioacuten de frecuencias Colocamos las

observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces

contamos el numero de rachas item de cada una de las muestras Si hay menos

rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales

rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten

La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de

que las observaciones se han sacado aleatoriamente de una sola poblacioacuten

Para hacer esto se halla la mediana de la muestra y se designa las

observaciones situadas por debajo de la mediana por un signo menos (-) y las

observaciones situadas por encima de la mediana por un signo (+) Si el numero

de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado

rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el

numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10

puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la

tabla normal con

u

uu

z

2

1

12

21

21

NN

NNu

)1()(

2(2

21

2

21

2121212

NNNN

NNNNNNu

DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES

DISTRIBUCIONES DE EJEMPLO Y USO

DISTRIBUCIOacuteN NORMAL O GAUSSIANA

Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que

multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal

Esta distribucioacuten de caracteriza porque los valores se distribuyen formando

una campana de Gauss en torno a un valor central que coincide con el valor

medio de la distribucioacuten

Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a

la izquierda

Esta distribucioacuten viene definida por dos paraacutemetros

X N (m S2)

m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro

de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores

estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores

estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de

ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten

estaacutendar

Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina

normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo

que permiten obtener esos mismos valores donde se recoge la probabilidad

acumulada para cada punto de la curva de esta distribucioacuten

Ademaacutes toda distribucioacuten normal se puede transformar en una normal

tipificada

Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con

media 10 y varianza 4 Transformarla en una normal tipificada

X N (10 4)

Para transformarla en una normal tipificada se crea una nueva variable (Y)

que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica

(que es la raiacutez cuadrada de la varianza)

En el ejemplo la nueva variable seriacutea

Esta nueva variable se distribuye como una normal tipificada

permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor

Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos

indicado de que las probabilidades para cada valor de la curva se encuentran

recogidas en una tabla

MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)

La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten

normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta

distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros

y lo que representamos del modo si su funcioacuten de densidad

es

Observacioacuten

Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y

la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes

adelante65

La forma de la funcioacuten de densidad es la llamada campana de Gauss

Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten

normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1

Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un

uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto

con lo cual en coinciden la media la mediana

y la moda y por uacuteltimo calcular sus puntos de inflexioacuten

El soporte de la distribucioacuten es todo de modo que la mayor parte de la

masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se

encuentra concentrado alrededor de la media y las ramas de la curva se extienden

asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la

media es posible (aunque poco probable)

La forma de la campana de Gauss depende de los paraacutemetros y

indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)

Figura Distribuciones gaussianas con diferentes medias e igual

dispersioacuten

(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor

sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor

de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea

``maacutes aplastado seraacute

Figura Distribuciones gaussianas con igual media pero varianza

diferente

La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes

adelante que es

Como consecuencia la distribucioacuten normal es reproductiva con respecto a

los paraacutemetros y ya que

Observacioacuten

Como se ha mencionado anteriormente la ley de probabilidad gaussiana la

encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza

por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el

de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que

apuntar un hecho negativo para esta ley de probabilidad

La funcioacuten no posee primitiva66

conocida67

Las consecuencias desde el punto de vista praacutectico son importantes ya que

eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de

la normal y nos tenemos que limitar a decir que

sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente

esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho

puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto

se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en

problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde

se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie

limitada de valores xi dados Normalmente F se encuentra tabulada para una

distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten

normal tipificada

En el caso de que tengamos una distribucioacuten diferente se

obtiene Z haciendo el siguiente cambio

De manera general se tiene

Proposicioacuten (Cambio de origen y escala)

Sean Entonces

Este resultado puede ser utilizado del siguiente modo Si y nos

interesa calcular

1 Hacemos el cambio y calculamos

2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de

modo aproximado) Como

tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada

Ejemplo

Supongamos que cierto fenoacutemeno pueda ser representado mediante una

va y queremos calcular la probabilidad de que Xtome un valor

entre 39 y 48 es decir

Comenzamos haciendo el cambio de variable

de modo que

Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que

hemos mencionado anteriormente

Proposicioacuten

Sea Entonces

Demostracioacuten

Por ser la normal una ley de probabilidad se tiene que

es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con

respecto a se obtiene el valor 0

luego

Para demostrar la igualdad entre la y basta con aplicar la misma

teacutecnica pero esta vez derivando con respecto a

Luego

Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en

primer lugar la va tipificada de X

y calculamos

Como por la proposicioacuten 5 deducimos que

CURVA NORMAL ESTANDARIZADA

Una variable numeacuterica puede clasificarse como discreta o continua Las

variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas

con la idea de contar Las variables continuas se pueden asociar con la idea de

medir utilizando fracciones y decimales Cuando la variable es continua el

modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal

El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten

normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran

cantidad de variables continuas

El modelo matemaacutetico

La funcioacuten matemaacutetica que se usa como modelo es

e = 271

π = 314

μx = media de la poblacioacuten

σx = desviacioacuten estaacutendar de la poblacioacuten

x = un valor de la variable continua

Como e y π son constantes la forma de la curva normal depende

solamente de los dos parametros de la distribucioacuten normal la media μx y la

desviacioacuten estaacutendar σx

Las diferentes curvas normales van a variar dependiendo de esos dos

paraacutemetros

En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar

visualmente como una curva en forma de campana El aacuterea debajo de esta curva se

halla por medio del integral de la funcioacuten y corresponde al por ciento o la

proporcioacuten de puntuaciones que se encuentran en el intervalo dado

Propiedades de las distribuciones normales

a Son simeacutetricas y tienen forma de campana

b Al ser simeacutetricas la media la moda y la mediana coinciden

c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea

de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media

d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la

curva se encuentra a tres desviaciones estaacutendar de la media

En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral

de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de

diferentes secciones de la curva o se utiliza la computadora para calcular ese valor

del aacuterea

La distribucioacuten normal estandarizada

Puesto que hay un nuacutemero infinito de combinaciones para los dos

paraacutemetros hay un nuacutemero infinito de curvas normales diferentes

Este problema se ha resuelto praacutecticamente al transformar los valores de

todas las distribuciones normales a los valores de una distribucioacuten normal

estandarizada representada por la curva normal estandarizada (standard normal

curve)

Las puntuaciones estandarizadas se logran restando la media a cada

observacioacuten y dividiendo entre la desviacioacuten estaacutendar

donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar

Propiedades de la distribucioacuten normal estandarizada

μ z = 0

σ z = 1

En muchas ocasiones se quieren comparar puntuaciones que pertenecen a

dos distribuciones normales diferentes La diferencia entre las dos distribuciones

radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo

la comparacioacuten se hace posible si se convierten las puntuaciones de ambas

distribuciones a puntuaciones z que corresponden a la distribucioacuten normal

estandarizada

Percentiles y rangos percentiles de una distribucioacuten normal estandarizada

Si se desea hallar la percentiles o el rango percentil en una distribucioacuten

normal no estandarizada se recurre al procedimiento de convertir las puntuaciones

de la distribucioacuten normal dada a puntuaciones z que corresponden a la

distribucioacuten normal estandarizada

Estos valores en la distribucioacuten normal estandarizada se pueden obtener

por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en

las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el

intervalo dado

Es necesario visualizar siempre el aacuterea debajo de la curva como el por

ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo

dado

Cuando una distribucioacuten de puntuaciones es normal estandarizada la

pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar

en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o

cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten

dada

DISTRIBUCIOacuteN GAMMA

Una variable aleatoria X asociada a un experimento aleatorio tiene una

distribucioacuten GAMMA si se caracteriza por las siguientes propiedades

Algunas alternativas de funciones de densidad se pueden ver en la graacutefica

del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)

respectivamente =1

=1

La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo

III

El modelo Gamma se ha utilizado frecuentemente en variables tales como

ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el

intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson

ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900

ndash Flujos maacuteximos MARKOVIC 1965

ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965

ndash Altura de la precipitacioacuten mensual WHITCOMB 1940

ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia

infin

ndash Ingresos familiares

ndash Edad del hombre al contraer matrimonio por primera vez

ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en

subestaciones a una frecuencia part

Ejemplo

Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos

de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia

promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo

de tiempo se encuentre hasta que ocurre el segundo ciclo

a Dentro de una desviacioacuten con respecto del tiempo promedio

b A maacutes de dos desviaciones por encima de la media

Solucioacuten

X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en

horas

Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)

= 2

Y Nuacutemero de ciclos hora ---------Y~P( =002)

E(Y) = 002 =

X ~ G(2 002)

Ejemplo

En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de

kilovatios por hora puede considerarse como una variable aleatoria con

distribucioacuten GAMMA de paraacutemetros = 3 y

= 05

La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de

KWhora

iquestCuaacutel es la probabilidad de que este abastecimientos sea

a Insuficiente en un diacutea cualquiera

b Se consuman entre 3 y 8 millones de K WHora

c c Encuentre E(x) y V(x)

SOLUCIOacuteN

DISTRIBUCIOacuteN PARETO

En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad

continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores

es

Su funcioacuten de distribucioacuten es

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto

son

El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (

DISTRIBUCIOacuteN T DE STUDENT

Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una

distribucioacuten t con n grados de libertad

Cuando n--gtinfinito a curva t coincide com la normal estandarizada

FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX

MOMENTOS

La distribucioacuten -Student se construye como un cociente entre una normal

y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-

Student con n grados de libertad a la de una va T

donde Este tipo de distribuciones aparece cuando

tenemos n+1 va independientes

y nos interesa la distribucioacuten de

La funcioacuten de densidad de es

Figura Funcioacuten de densidad de una de Student

La distribucioacuten de Student tiene propiedades parecidas a

Es de media cero y simeacutetrica con respecto a la misma

Es algo maacutes dispersa que la normal pero la varianza decrece hasta

1 cuando el nuacutemero de grados de libertad aumenta

Figura Comparacioacuten entre las funciones de densidad de y

Para un nuacutemero alto de grados de libertad se puede aproximar la

distribucioacuten de Student por la normal es decir

Figura Cuando aumentan los grados de libertad la distribucioacuten de

Student se aproxima a la distribucioacuten normal tipificada

Para calcular

DISTRIBUCIOacuteN BETA

Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede

representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un

intervalo de longitud finita Tales como

Proporcioacuten de impurezas en un producto quiacutemico

La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten

La proporcioacuten vendida de un lote durante un tiempo t

La humedad relativa medida en cierto lugar

Porcentaje del costo total destinado a reparacioacuten de maquinaria

Porcentaje de costo adicional destinado a reparacioacuten de maquinaria

La distribucioacuten del tiempo necesario para completar una fase del proyecto

PERT

Evaluacioacuten de programas y teacutecnicas de revisioacuten

Ejemplo

La proporcioacuten de tramos de una autopista que requieren repararse

semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros

= 3 y =2

a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten

b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista

requieren reparacioacuten en un antildeo cualquiera

DISTRIBUCIOacuteN CAUCHY

En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de

Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es

donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene

valor esperado ni varianza

Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V

2 lt 1 el

numero U V tiene la distribucioacuten Cauchy

La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un

grado de libertad

Ejemplo

Sean y dos observaciones independientes de una distribucioacuten

Cauchy con funcioacuten de densidad

Puede demostrarse que si y son tales que entonces la

funcioacuten de verosimilitud de es bimodal

Sean y Supongamos que se desea hacer inferencias sobre el

valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa

Especiacuteficamente interesa encontrar la distribucioacuten final de

Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la

distribucioacuten final de tiene una forma complicada Es conveniente notar sin

embargo que corresponde a la densidad marginal de respecto a la

densidad conjunta

DISTRIBUCIOacuteN BERNOULLI

Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto

suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el

que no lo sea (fracaso) En realidad no se trata maacutes que de una variable

dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello

que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas

obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la

situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este

experimento mediante una va discreta Xque toma los valores X=0 si el suceso no

ocurre y X=1 en caso contrario y que se denota

Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar

una moneda al aire y considerar la va

Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de

probabilidad es

y su funcioacuten de distribucioacuten

Su funcioacuten caracteriacutestica es

Los principales momentos de la X los podemos calcular directamente

o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina

Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)

cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de

intentos

CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE

BERNOULLI

Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la

probabilidad y asegurar que se cumplen las tres condiciones necesarias en

particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del

resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3

requiere que los ensayos o intentos de un proceso de Bernoulli sean

estadiacutesticamente independientes es decir que el resultado de un intento no puede

afectar de ninguacuten modo el resultado de cualquier otro intento

DISTRIBUCIOacuteN EXPONENCIAL

Modelo para variable aleatoria continua que permite representar variables

del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos

Componentes

En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de

probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para

valores x gt 0 es

f(x) = λe - λx

Su funcioacuten de distribucioacuten es

Aqui e significa el nuacutemero e

El valor esperado y la varianza de una variable aleatoria X con

distribucioacuten exponencial son

E[X] = 1 λ

V(X) = 1 λ2

Ejemplo

Ejemplos para la distribucioacuten exponencial son los tiempos dentro

accidentes con probabilidad invariable

La funcioacuten de densidad para λ igual 05 10 y 15

DISTRIBUCIOacuteN MULTINOMIAL

La distribucioacuten multinomial es similar a la distribucioacuten binomial con la

diferencia de que en lugar de dos posibles resultados en cada ensayo

La distribucioacuten multinomial sigue el siguiente modelo

Donde

X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo

que el partido POPO lo hayan votado 3 personas)

n indica el nuacutemero de veces que se ha repetido el suceso (en el

ejemplo 5 veces)

n es factorial de n (en el ejemplo 5 4 3 2 1)

p1 es la probabilidad del suceso X1 (en el ejemplo el 40)

Veamos el ejemplo

Luego

P = 00256

Es decir que la probabilidad de que las 5 personas elegidas hayan votado

de esta manera es tan soacutelo del 256

Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1

Veamos otro ejemplo

En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el

40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4

invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos

Aplicamos el modelo

LuegoP = 00384

Por lo tanto la probabilidad de que el grupo esteacute formado por personas de

estos paiacuteses es tan soacutelo del 384

DISTRIBUCIOacuteN UNIFORME

En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de

probabilidad cuyos valores tienen la misma probabilidad

Caso discreto

Su funcioacuten de probabilidad es en el caso discreto con valores posibles

p(xi) = 1 n

Su funcioacuten de distribucioacuten es en el caso discreto

Su media estadiacutestica es

Caso continuo

Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b

La funcioacuten de densidad en el caso continuo entre a y b es

Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12

Ejemplos

Para un dado perfecto todos los resultados tienen la misma probabilidad 1

6

Calcular variables aleatorias

Las variables aleatorias de probabilidad uniforme pueden calcularse con un

generador de variables aleatorias

DISTRIBUCIOacuteN BINOMIAL

En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad

discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con

probabilidad p de un eacutexito

Su funcioacuten de densidad es

Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)

posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos

((1 - p)n - x

)

El valor esperado de una variable aleatoria de probabilidad binominal es

E[x] = np y su varianza V[x] = np(1 - p)

DISTRIBUCIOacuteN BINOMIAL NEGATIVA

Sobre una sucesioacuten de va de Bernouilli independientes

Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r

eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de

distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo

Su ley de probabilidad se deduce siguiendo el esquema

De nuevo el conjunto de posibles valores de esta va discreta es

Su funcioacuten caracteriacutestica es

y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima

Ejemplo

Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en

operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal

que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda

definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para

intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus

5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones

que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se

necesiten 10 intervenciones

Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por

una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan

4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso

Identificando los paraacutemetros se tiene

Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el

nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy

simple

Y=X+r

Luego

Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente

es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de

que X=10-4=6 Por tanto

La distribucioacuten binomial negativa tambieacuten se puede definir como el

nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas

contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que

DISTRIBUCIOacuteN DE POISSON

Modelo para variable aleatoria discreta que permite calcular la

probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten

discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo

muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos

o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual

a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es

independiente de cuaacutendo se presenta dicho periacuteodo

En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de

probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos

es

Aquiacute e significa el nuacutemero e y x significa el factorial de x

La distribucion de Poisson describe el nuacutemero de sucesos en una unidad

de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un

proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens

en una carrera

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten

Poisson son

E[X] = V[X] = λ

La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos

entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un

conmutador la demanda (necesidades) de los pacientes que requieren servicio en

una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el

nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos

ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una

variable aleatoria discreta que toma valores enteros (0 1 2)

Caacutelculo de la probabilidad de Poisson

La letra X por lo general representa a una variable discreta y puede tomar

valores enteros Utilizamos la letra X para representar a la variable aleatoria y la

letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La

probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson

se calcula con la foacutermula

LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA

DISTRIBUCIOacuteN BINOMIAL

La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la

binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan

cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es

grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan

con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena

aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es

igual o menor que 005 En los casos en que se cumplen estas condiciones

podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media

de la distribucioacuten de Poisson

DISTRIBUCIOacuteN GEOMEacuteTRICA

En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten

probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores

discretos es

P(X = x) = p(1 - p)x - 1

Su funcioacuten de distribucioacuten es

El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media

estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2

Ejemplo

El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es

una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6

DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA

En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de

probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de

masa para valores es

Aqui (a sobre b) es el coeficiente binomial

El valor esperado de una variable aleatoria X de distribucioacuten

hipergeomeacutetrica es

Y su varianza

DISTRIBUCIOacuteN ZETA

En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad

discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos

es

Aqui ζ(s) es la funcioacuten zeta de Rieman con

El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto

DISTRIBUCION CHI CUADRADO

El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una

comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es

diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con

ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno

es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario

estas dos frecuencias acusan una diferencia significativa para por ejemplo un

nivel de significacioacuten del 5

El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la

asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada

por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito

bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor

del famoso libro Statistical Methods for Research Workers (1925) donde se

marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con

Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde

estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y

el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las

pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba

exacta de Fisher

Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico

publicitario presentado a grupos de clientes comparar la rentabilidad de un

proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos

de los turistas por determinados espacios geograacuteficos o por determinados

servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las

frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las

frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o

tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o

de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2

x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos

turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han

ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han

tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula

que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido

en los sitios A y B

Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es

independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo

A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces

alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este

anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos

empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de

las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51

La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten

igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es

2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del

Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del

5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206

podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para

suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B

Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias

observadas empiacutericamente de dos muestras con las frecuencias esperadas o

teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el

Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de

las materias primas perecederas Los resultados son seguacuten atributos cualitativos

los siguientes Primero veremos las frecuencias empiacutericas u observadas

Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten

Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son

131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas

Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y

fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres

columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta

maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x

120 260 = 6046 b2 = 129 x 120 260 = 5954

Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten

igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de

2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de

libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La

diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna

conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten

Es una medida de la discrepancia existente entre las frecuencias

observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso

de frecuencias () debido a que permite determinar las desviaciones entre ellas

ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la

expresioacuten

E

EOX

2

2

Donde

O frecuencia observada

E frecuencia teoacuterica esperada

TEST DE CHI-CUADRADO DE CONTINGENCIA

Un caso particular del test de chi-cuadrado que permite hacer un test sobre

la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-

cuadrado de contingencia Los dos caracteres observados en una misma

poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases

de se denotan las de por Tambieacuten vamos a

denotar

el efectivo conjunto de y es el nuacutemero de individuos para los

cuales toma el valor e el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

Estos valores se representan en una tabla de doble entrada conocida como

tabla de contingencia

Cada fila y cada columna corresponden a una submuestra particular La

fila de iacutendice es la distribucioacuten en las clases de los individuos para

los cuales el caraacutecter toma el valor La columna de iacutendice es la

distribucioacuten en las clases de los individuos para los cuales el caraacutecter

toma el valor Dividiendo las filas y las columnas por su suma se obtienen

frecuencias condicionales para cada una de las distribuciones empiacutericas Para

y las denotaremos por

y

Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y

los perfiles columna Para el modelo probabilista las observaciones provienen de

una muestra

de una ley bidimensional La hipoacutetesis a comprobar

es que los dos marginales de esta ley son independientes Si este es el caso los

perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna

de la de

y

Es equivalente a decir que las frecuencias conjuntas deben estar cerca de

los productos de las frecuencias marginales

Las frecuencias conjuntas por un lado (distribucioacuten observada) y los

productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen

dos distribuciones de probabilidad sobre el conjunto producto

Podemos por tanto calcular la distancia de

chi-cuadrado de una con respecto a la otra

Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la

distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale

Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la

definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado

Por lo dicho anteriormente para suficientemente grande podemos

aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el

nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados

a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las

que han sido estimadas Hay para el caraacutecter y para el caraacutecter

(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley

chi-cuadrado seraacute por tanto

Vamos a presentar un ejemplo de dos caracteres binarios que tienen que

ver con enfermos para los cuales se ha observado si tienen o no una tendencia al

suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y

neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las

tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla

de contingencia observada es

Tendencia Sin tendencia Total

Psicosis 20 180 200

Nneurosis 60 140 200

Total 80 320 400

La distancia de chi-cuadrado de contingencia calculada a partir de esta

tabla es de El valor tomado por el estadiacutegrafo es el cual

debemos comparar con la ley El p-valor es de

Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre

la tendencia al suicidio y la clasificacioacuten de las enfermedades

El test no precisa el sentido de esta dependencia Para describirla hay que

comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre

los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten

PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS

Los investigadores se interesan constantemente en las diferencias entre dos

poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado

civil profesioacuten color de ojos preferencia por una marca etc)

Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de

contingenciardquo

Se puede realizar una prueba para la diferencia entre dos proporciones

sobre la base de muestras independientes usaacutendose como instrumento la prueba

de chi cuadrado

El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es

la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se

podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda

Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la

ecuacioacuten

n

nnE CR

donde

nR nuacutemero total en el rengloacuten

nC nuacutemero total en la columna

n tamantildeo total de la muestra

El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado

entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia

al cuadrado se divide entre la frecuencia esperada de la celda

La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se

rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el

valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados

de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el

tamantildeo de la muestra

CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD

Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a

las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se

puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la

distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado

siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal

Por consiguiente al probar la diferencia entre las dos proporciones la

distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes

Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia

direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten

normal

La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede

ilustrar mediante el siguiente ejemplo

Cuartos de bantildeos modernos

Cocina moderna Caren

cia

existenc

ia

totales

Carencia 72 8 80

Existencia 7 146 153

La hipoacutetesis nula y alternativa seriacutean

YN ppH 0

YN ppH 0

Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de

significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute

Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H

A partir de la informacioacuten del cuadro

10080

8

N

NSN

n

Xp 95420

153

146

Y

YSY

n

Xp

A partir de la expresioacuten

21

21

111

nnpp

pPZ SS

donde

661015380

1468

p

por lo tanto

0813

153

1

80

133906610

95420100

Z

Totales 79 154 223

Dado que 1960813 Z se rechaza la 0H por lo tanto hay

diferencia entre las dos proporciones

Usando la prueba de chi cuadrado y la tabla de contingencia de este

ejemplo se tiene

Las frecuencias teoacutericas se pueden obtener a partir de la siguiente

ecuacioacuten

n

nnE CR

Por lo tanto se tiene

1227233

7980E 8852

233

15480E

8851233

79153E 12101

233

154153E

Chi cuadrado se obtiene a partir de la expresioacuten

E

EOX

2

2

A partir de la tabla se tiene

O E (O ndash E) (O ndash E)2

(O ndash E)2E

7

2

2

712

+4488 20142144 742704

7 5

188

- 4488 20142144 388245

8 5 -4488 20142144 380903

288

1

46

1

0112

+4488 20142144 199191

1711043

10431712 CALCULADOX

Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el

84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo

tanto hay diferencia entre las dos proporciones

Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la

distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos

distribuciones que a un nivel de significancia de 005 el valor de 196 es el

cuadrado de 3 841 es decir 22 ZX

CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA

La afirmacioacuten de que no existen diferencias entre proporciones significa

que las dos variables son independientes Cuando las conclusiones se presentan en

esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo

Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que

no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la

hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos

variables Independientemente de que la prueba de chi cuadrado se considera una

prueba de diferencia entre dos proporciones o una prueba de independencia los

caacutelculos y resultados son exactamente los mismos

CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE

Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o

intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que

ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de

probabilidades

Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que

seguir varios pasos Primero se tiene que establecer la distribucioacuten de

probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada

paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la

media) se deben establecer mediante hipoacutetesis o estimarlos con base a la

informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para

determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o

intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado

para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la

informacioacuten

BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON

La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de

Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la

cantidad de automoacuteviles estacionados en una cochera cubierta siguen una

distribucioacuten de Poisson 0H

En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero

de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una

muestra aleatoria de 233 casas

Numero de automoacuteviles Frecuencia

0 61

1 151

2 21

233

Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados

de la distribucioacuten de frecuencia

No de automoacuteviles Frecuencia observada On

0 61 0

1 151 151

2 21 42

233 193

808280233

193

1

n

On

X

n

i por lo tanto 80X

El valor de la media muestral se utilizara como el estimado de X

Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)

y se obtiene la frecuencia teoacuterica para cada una

Automoacutevil

n

Frecuencia

O

Probabilidad

XP

Frecuencia (E)

XPn

0 61 04493 104687

1 151 03595 87764

2 21 01438 33505

Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de

significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX

El valor calculado de chi cuadrado es

50679

2

2

K

CALCULADO

E

EOX

Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de

automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una

distribucioacuten de Poisson

CORRECCIOacuteN DE YATES

Cuando se aplican a datos discretos los resultados para distribuciones

continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres

comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de

Yates la cual viene dada mediante la expresioacuten

E

EOX CALCULADO

502

2

En general la correccioacuten se hace solamente cuando el numero de grados

de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos

resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en

relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia

esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi

cuadrado corregido y no corregido Si ambos valores conducen a la misma

conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se

presentan dificultades Si conducen a conclusiones diferentes se puede o bien

incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear

meacutetodos de probabilidad exactos

El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente

ejemplo

En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces

Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de

significancia del 005

No de caras Frecuencia Probabilidad Frecuencia (E)

Cara 115 05 100

cruce 85 05 100

2054

100

0510085

100

0510011522

2

CALCULADOX

Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado

con correccioacuten de Yates es

8432 TABULADOX

Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha

PRUEBA EXACTA DE FISHER

Para examinar la igualdad de las varianzas de dos poblaciones

independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de

las varianzas de las dos muestras Suponiendo que la informacioacuten de cada

poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2

2

2

1 SS sigue una

distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso

estadiacutestico RA Fisher

Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de

grados de libertad los grados de libertad en el numerador y en el denominador

la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea

2

2

2

111 21

S

SF nn

donde

n1 = tamantildeo de muestra en el grupo 1

n2 = tamantildeo de muestra en el grupo 2

n1 ndash 1 = grados de libertad en el grupo 1

n2 ndash 1 = grados de libertad en el grupo 2

2

1S varianza de la muestra en el grupo 1

2

2S varianza de la muestra en el grupo 2

Al probar la igualdad de dos varianzas se pueden emplear pruebas de una

cola o de dos colas

El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente

ejemplo

Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas

alta en la planta A que en la planta B Para determinar la variabilidad se puede

establecer una prueba de una cola en la forma siguiente

22 BAOH

22

1 BAH

Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta

A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta

ubicada en la cola superior de la distribucioacuten

Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de

libertad en el numerador y 19 en el denominador a un nivel de significancia de

001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene

71162 AS y 20142 BS por lo tanto

38512014

71162

2

1924 F como 1385 lt

292 no se rechaza la hipoacutetesis nula ( OH )

CONCLUSIOacuteN

La conclusioacuten que los resultados de una medida variable es la causa de

variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten

estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero

no puede reclamar legitimidad

La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en

describir la distribucioacuten de las variables estudiadas y en particular de los datos

numeacutericos Ademaacutes de las medidas descriptivas correspondientes el

comportamiento de estas variables puede explorarse graacuteficamente de un modo

muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro

organizador de las ciencias computarizadas y el modelo que nos dota de un

mejor razonamiento para implementar programas eficientes En este sentido la

combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un

reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en

colegios y universidades

Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de

combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y

evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras

loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre

operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten

juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la

teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones

simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades

que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea

BIBLIOGRAFIacuteA

AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis

Third Edition Texts in Statistical Science Chapman and Hall

BOXG E P HUNTER W G HUNTER JS (1978) Statistics for

Experimenters John Wiley amp Sons

BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores

Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de

Modelos Ed Revertsbquo SA

Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed

Piraacutemide

Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten

(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica

Matemaacutetica I Universidad de Antioquia

Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma

Madrid

Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill

Meacutexico

Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten

yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico

Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw

ndashHill 4ta Edicioacuten Colombia

CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana

Meacutexico

COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas

COX DR (1958) Planning of experiments New York John Wiley amp Sons

DANIEL C Applications of Statistics to Industrial Experimentation Willey

DAVIES OL The Design and Analysis of Industrial Experiments Hafner

(McMillan)

DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias

Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico

SA de CV Meacutexico

De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H

(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico

Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta

Estadiacutestica Editorial Microsoft corporation USA

ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial

Limusa SA Meacutexico

EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis

Arnold

FEDERER W (1965) Experimental design Oxford Publ Co

GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la

Varianza Grupo Editorial Universitario

FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico

McGraw Hill

FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque

ModernoEditorial SA Meacutexico

George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y

Meacutetodosrdquo Ed McGraw-Hill

GILL JL (1978) Design and Analysis of Experiments in the Animal and

Medical Sciences Iowa State University Press

JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression

and Experimental Design Springer-Verlag

Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor

Caracas

GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining

Institute

GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data

Mining Institute

Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial

Bourgeoacuten Caracas

Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la

EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute

Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial

BourgeoacutenCA Caracas ndash Venezuela

HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis

Multivariante 5ordf Edicioacuten Prentice Hall

JOBSON JD (1992) Applied Multivariate Data Analysis Volume II

Categorical and Multivariate Methods Springer-Verlag

KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial

Hispanoamericana Meacutexico

KIRK RE Experimental Design Procedures for the Behavioral Sciencies

BrooksCole Publishing Company

LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e

inferencia Estadiacutestica Editorial Limusa Meacutexico

LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV

Grupo Noriega Editores Meacutexico

LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial

HARLA Meacutexico

LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta

edicioacuten Editorial McGaw-Hill Usa

Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial

Hispanoameacuterica VI edicioacuten Meacutexico

LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire

Multidimensionnelle 3ordf Edition DUNOD

LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e

Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB

Caracas- Venezuela

LORENZEN T J Anderson V L (1993) Design of experiments A No-Name

Approach Marcel Dekker Inc

Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc

(1999) SPSS 90 Manual de Usuario SPSS Chicago

MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis

Academic Press

Enfocados hacia SPSS

Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de

wwwspssparatodoscom 2005

MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten

Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla

Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea

Ediciones Alfaomega SAN Meacutexico

MASON RL Statistical Design and Analysis of Experiments with Applications

to Engineering and Science John Wiley amp Sons New York

MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y

Economiacutea Editorial Iberoamericana Meacutexico

MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in

agriculture and experimental biology Second edition Chapman amp Hall

MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo

Editorial Iberoameacuterica

MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers

John Wiley amp Sons

Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial

Reverte Mejicana Meacutexico

Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da

Edicioacuten Meacutexico

Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc

Graw Hill

PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones

Editorial Limusa Meacutexico

NETER J et al Applied Linear Statistical Models Regression Analysis of

Variance and Experimental Designs Library of Congress Cataloging Publication

Data

OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp

RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo

Editorial Universitario

PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos

Lineales y Series Temporales Vol 1 y 2 Alianza Editorial

Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores

Spain SA Espantildea 2005

PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial

Mir Moscuacute

RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed

McGraw-Hill

Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca

UCV Caracas ndash Venezuela

RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE

Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en

Psicologiacuteardquo p 1

SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons

Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti

Caracas ndash Venezuela

Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores

deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico

Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica

Editorial Harla Meacutexico

STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y

procedimientos Segunda edicioacuten McGraw Hill

SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas

Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1

Ediciones UNESR Caracas

URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante

Coartiacuteculo Plan Nuevo Editorial AC

VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II

Anaacutelisis Multivariante) Mc-Graw Hill

Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows

Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea

2002

WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros

Editorial Interamericana Meacutexico

Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8

Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage

Learning Editores p 364 ISBN 9706861947

Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea

Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea

Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de

CV Meacutexico

Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para

Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico

DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR

httpesmwikipediaorgwikiSPSS

httpwwwbuenastareascomensayosque-es-el-SPSS1465478html

httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-

del-software-estadistico-integral-spss-base-160

httpesanswersyahoocomquestionindexqid=20070727073908aatuamw

httpwwwslidesharenetleticiagpestructura-de-spss-3126476

httpwwwehowenespanolcomprograma-spss-sobre_48697

httpwwwugres~bioestmedicinamanual_spsspdf

httpwwwmonografiascomtrabajos12tutortutorshtml

httpwwwspsscom

wwwspssparatodoscom

httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html

httpwwwspssfreecomcapitulotreshtml

httpwwwuvesRELIEVEemail relieveuves

httpwwwscribdcomdochellipspss-introduccioacuten

httpeswikipediaorgwikiSPSS

httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd

f

httpwwwspsscomaressuccessargentinashtml

httpeswikipediaorgwikiSPSS

httpwww-01ibmcomsoftwareesanalyticsspss

httppsicofcepurvesspssindex0htm

httpssitesgooglecomsiteestadisticaconelspss

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpe-stadisticabioucmesweb_spssindice_spsshtml

httpwwwquimicaurvesquimiogeneralanovacastpdf

httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da

tosyMultivariable14anova1_SPSSpdf

httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800

20AnE1lisis20de20Varianzaspdf

httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-

pearson

httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf

httpwwwuoceduin3emathdocsRegresionLinealpdf

httpeswikipediaorgwikiRegresiC3B3n_lineal

httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES

ION_LINEAL_CON_SPSSpdf

httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN

EAL20SIMPLE20CON20SPSSpdf

httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE

SION_LINEAL_CON_SPSSpdf

httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm

httpeswikipediaorgwikiNivel_de_medida

httphtmlrincondelvagocomregresion-lineal-simplehtml

httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp

lepdf

httpwwwvitutorcomestadisticabi8html

httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf

httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-

Martinez_1pdf

httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml

httpesslidesharenetpatolinkecuacin-de-regresin-lineal

httpeswikipediaorgwikiMC3ADnimos_cuadrados

httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios

httpwwwwordreferencecomdefinicioncorrelaciC3B3n

httpwwwditutorcomestadistica_2correlacion_estadisticahtml

httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson

httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n

httpeswikipediaorgwikiMatriz_de_correlaciC3B3n

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpwwwinfecepiunizares

httpwwwltbioestadisticaumaes

httpwwwuaqmxmatematicasestadisticasxu3html

httpwwwmembers-americastripodcom

httpwwwmsiplceorg

httpwwwbnvcocrsesionnotaaspg

httpwwwaltavistacom

httpwwwauyantepuycom

httpwwwinees

httpwwwudeccl

httpwwwrincondelvagocom

httpwwwmonografiascom

httpwwwfestadisticafguamesindicadoresiprihtml

httpwwwuaqmxmatematicasestadisticaxu3html

httpwwwinegoboiwd0801htmlE

httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm

httpwwwitlpedumx

httpwwweclaevespanovestadisticasna93nnsnann7eshtml

httpw3moritesmmx~cmendozamaestestoohtml

httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml

httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion

httpwwwunleduarfaveseiencuestasindexhtml

httpwwwmonografiascomtrabajos11operaoperashtml

httpwwwmonografiascomtrabajos6hisohisoshtml

httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos

httpwwwmonografiascomtrabajos16sistema-operativosistema-

operativoshtmlTIPPOS

httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-

operativoshtml

httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei

httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml

httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-

operativo

httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software

httpwwwsscccoclinformaticaconceptoshtml

httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr

httpwwwcadcommxhistoria_de_la_computacionhtm

httpwwweswikipediaorgwikiBus_(informC3A1tica)

httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla

httpwwwcavsicompreguntasrespuestasque-es-el-teclado

httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm

Page 4: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,

datos siguen una distribucioacuten normal la media actuacutea como una buena medida

resumen Recordemos algunas de las caracteriacutesticas de esta distribucioacuten

Viene determinada por dos paraacutemetros la media (micro) y la desviacioacuten tiacutepica () Es

acampanada y simeacutetrica alrededor de la media

Recordemos que por ejemplo si se cumplen los supuestos de

normalidad (fig 1)

El valor de la micro plusmn 1 incluiraacute aproximadamente el 683 central de las

observaciones

El valor de la micro plusmn 2 incluiraacute aproximadamente el 953 central de las

observaciones

El valor de la micro plusmn 3 incluiraacute praacutecticamente todas las observaciones el

997

Conocidas la micro y la se puede reconstruir la distribucioacuten de las

observaciones

La igualdad de variancias es el otro gran obstaacuteculo que deberemos salvar

Dos distribuciones pueden tener el mismo valor en el paraacutemetro media mostrando

el primer valor cercano a la media (poca dispersioacuten variancia pequentildea) y la

segunda valores alejados de dicho paraacutemetro (maacutes dispersioacuten gran variancia)

Como vemos estas dos variables siguen diferentes patrones aunque tienen en

comuacuten el mismo valor de la media (fig 2)

iquestPor queacute tienen estas asunciones Las pruebas parameacutetricas asumen que

los datos de las variables a comparar se distribuyen de igual forma pero que entre

ellos existe un desplazamiento fijo es decir para cada valor de una muestra hay

un valor igual pero incrementado en un valor constante (K) al que podriacuteamos

llamar desplazamiento (fig 3) Si este valor constante se acerca al valor 0 no

habriacutea diferencias entre los grupos ya que existiriacutea un solapamiento entre los

valores a comparar Cuanto maacutes se aleje del valor 0

mayores seraacuten las diferencias

Obseacutervese la importancia de asumir que este valor de desplazamiento de

una muestra a la otra es constante Si estamos comparando dos diferentes

tratamientos por ejemplo un placebo y un principio activo en dos muestras que

son homogeacuteneas basalmente este valor K seraacute el efecto que podremos imputar al

principio activo en cada caso la diferencia entre medias representa no el efecto

promedio sino el efecto del tratamiento en cada caso Si por el contrario este

efecto no fuera constante ya no se cumpliriacutean los supuestos de estas pruebas

Fig 1

Fig 2

Fig 3

Dentro de las pruebas parameacutetricas se tienen para muestras grandes y para

muestras pequentildeas Un supuesto que se aplica a ambas es que la muestra que se

toma debe haber sido seleccionada en forma aleatoria o probabiliacutestica En las

pruebas parameacutetricas de muestra pequentildea se requiere el supuesto de que las

muestras fueron extraiacutedas de una poblacioacuten con distribucioacuten normal y cuando se

trata de dos o maacutes muestras tambieacuten se requiere una prueba de igualdad de

varianzas Existen pruebas estadiacutesticas por medio de las cuales se podriacutea

comprobar esto sin embargo suele no daacutersele importancia a esto y se pasa por

alto El anaacutelisis de varianza tambieacuten se basa en el supuesto de normalidad de las

poblaciones y en el de que sus varianzas son iguales

En las pruebas en las que se tienen menos supuestos es en las de muestra

grande las cuales se pueden aplicar sin saber o comprobar si la poblacioacuten o

poblaciones eran normales estas pruebas se dice que son robustas porque no es

necesario que se cumpla dicho supuesto Cuando la prueba que se requiere no es

robusta no es necesario correr el riesgo de estar equivocados en las conclusiones

en ellos En cambio se dispone de muchas pruebas estadiacutesticas no parameacutetricas

que tienen una aplicacioacuten semejante a las parameacutetricas de muestra pequentildea en las

que se tienen menos supuestos

PRUEBAS NO PARAMEacuteTRICAS

Se denominan pruebas no parameacutetricas aquellas que no presuponen una

distribucioacuten de probabilidad para los datos por ello se conocen tambieacuten como de

distribucioacuten libre (distribution free) En la mayor parte de ellas los resultados

estadiacutesticos se derivan uacutenicamente a partir de procedimientos de ordenacioacuten y

recuento por lo que su base loacutegica es de faacutecil comprensioacuten Cuando trabajamos

con muestras pequentildeas (n lt 10) en las que se desconoce si es vaacutelido suponer la

normalidad de los datos conviene utilizar pruebas no parameacutetricas al menos para

corroborar los resultados obtenidos a partir de la utilizacioacuten de la teoriacutea basada en

la normal

Cuando se analizan datos medidos por una variable cuantitativa continua

las pruebas estadiacutesticas de estimacioacuten y contraste frecuentemente empleadas se

basan en suponer que se ha obtenido una muestra aleatoria de una distribucioacuten de

probabilidad de tipo normal o de Gauss Pero en muchas ocasiones esta

suposicioacuten no resulta vaacutelida y en otras la sospecha de que no sea adecuada no

resulta faacutecil de comprobar por tratarse de muestras pequentildeas En estos casos

disponemos de dos posibles mecanismos los datos se pueden transformar de tal

manera que sigan una distribucioacuten normal o bien se puede acudir a pruebas

estadiacutesticas que no se basan en ninguna suposicioacuten en cuanto a la distribucioacuten de

probabilidad a partir de la que fueron obtenidos los datos y por ello se denominan

pruebas no parameacutetricas (distribution free)

La mayoriacutea de las pruebas de hipoacutetesis requieren suposiciones especiacuteficas

acerca de la poblacioacuten o poblaciones que se muestran En muchos casos debemos

suponer que las poblaciones tienen maacutes o menos la forma de distribuciones

normales o que se conocen sus varianzas o se sabe que son iguales o bien que las

muestras son independientes Como hay muchos casos donde no se pueden

cumplir estas suposiciones los estadiacutesticos han generado teacutecnicas alternativas

basadas en suposiciones menos estrictas que se han dado a conocer como

ldquoPruebas no parametricasrdquo

En estos casos se emplea como paraacutemetro de centralizacioacuten la mediana

que es aquel punto para el que el valor de X estaacute el 50 de las veces por debajo y

el 50 por encima

Propiedades

1 No se relacionan con el estudio de un paraacutemetro de la poblacioacuten

Por lo general cuando se hace referencia a pruebas no parameacutetricas se puede estar

hablando tanto de las no parameacutetricas como de las libres de distribucioacuten

(distribution free tests)

Las dos indicaciones maacutes importantes que se deben tener en cuenta para utilizar

una prueba no parameacutetrica son que

1 la distribucioacuten de la poblacioacuten no sea normal

2 la escala de medicioacuten de la variable en cuestioacuten sea categoacuterica

Los meacutetodos no parameacutetricos son menos poderosos que los parameacutetricos Esto

quiere decir que es maacutes difiacutecil rechazar la hipoacutetesis nula con las pruebas no

parameacutetricas

Por esa razoacuten los estadiacutesticos por lo general recurren a los meacutetodos no

parameacutetricos soacutelo cuando los datos no cumplen con los supuestos parameacutetricos

Sin embargo hay problemas de investigacioacuten en los que las variables categoacutericas

son las indicadas y por lo tanto soacutelo un meacutetodo no parameacutetrico es el indicado Los

pasos en las pruebas de hipoacutetesis no parameacutetricas son los mismos de las

parameacutetricas Los cambios por lo general se limitan a cambios en la foacutermula para

obtener el valor observado y en la tabla que se utiliza Pero se habla de hipoacutetesis

nula nivel de significacioacuten error tipo I y tipo II etc

El uso de meacutetodos no parametricos ofrece numerosas ventajas

1 los meacutetodos no parametricos se pueden usar con todo tipos de datos

ndash informacioacuten cualitativa (de escala nominal) informacioacuten en forma de rangos

(escala ordinal) asiacute como informacioacuten medida de un modo mas exacto (escala de

intervalo o de razoacuten)

2 por lo general son faacuteciles de aplicar y raacutepidos de calcular con

tamantildeos pequentildeos de muestra En ocasiones son tan sencillos que basta contar

con la frecuencia con que algunas caracteriacutesticas aparecen en los datos Por lo

tanto a menudo se usan para estudios piloto o preliminares yo en situaciones en

que se desean respuestas raacutepidas

3 hacen menos premisas menos estrictas (mas faacuteciles de cumplir) que

los procedimientos claacutesicos por lo tanto gozan de mayor aplicabilidad y

proporcionan un conjunto de conclusiones mas generales de base mas amplia

4 permiten solucionar problemas que no implican pruebas de

paraacutemetros de poblacioacuten

5 son mas econoacutemicos que los procedimientos claacutesicos ya que el

investigador puede aumentar la potencia y a pesar de ello ahorrar dinero tiempo y

trabajo al recopilar muestras de datos mayores medibles con mas aproximacioacuten

lo que soluciona con mayor rapidez el problema

6 seguacuten el procedimiento seleccionado los meacutetodos no parametricos

pueden ser tan poderosos (o casi tanto) como el procesamiento claacutesico cuando se

cumplen las premisas de este ultimo y quizaacutes sean un poco mas poderosos aun

cuando no se cumplan

Los procedimientos no parametricos tambieacuten ofrecen algunas desventajas

1 no conviene usar meacutetodos no parametricos cuando se pueden

cumplir todas las premisas de los procedimientos claacutesicos y los datos se miden en

una escala bien sea de intervalos de razones A menos de que se empleen

procedimientos claacutesicos en estos casos el investigador no esta aprovechando por

completo los datos Se pierde informacioacuten al convertir datos recopilados (de una

escala de intervalo o de razoacuten) a rangos (escala ordinal) o categoriacuteas (escala

nominal) En particular en esas circunstancias algunas pruebas no parametricas

muy raacutepidas y sencillas tienen mucha menos potencia que los procedimientos

claacutesicos y por lo general se deben evitar

2 seguacuten aumenta el tamantildeo de la muestra en ocasiones el manejo

requerido de datos para los procedimientos no parametricos se hace laborioso a

menos que se disponga de un paquete de computacioacuten adecuado

3 con frecuencia se necesitan tablas especiales de valores

criacuteticos y estas no se obtienen con tanta facilidad como las tablas de los

valores criacuteticos normales t 2X y F Ccedil

Prueba de signos para una sola muestra

Salvo para las pruebas con muestra grande todas las pruebas estaacutendar

concernientes a medias estaacuten basadas en la suposicioacuten de que las poblaciones que

se muestrean tienen aproximadamente la forma de distribuciones normales

Cuando en un caso determinado esta suposicioacuten resulta insostenible la prueba

estaacutendar se puede sustituir por una de varias alternativas no parametricas entre

ellas la ldquoprueba de signosrdquo

La prueba de signos de una sola muestra se aplica cuando se muestrea una

poblacioacuten simeacutetrica continua de manera que la probabilidad de que un valor de la

muestra sea menor que la media o mayor que la media es en ambos casos frac12 Para

probar la hipoacutetesis nula ( O ) contra una hipoacutetesis alternativa apropiada con

base en una muestra aleatoria de tamantildeo n se sustituye cada valor de la muestra

mayor que O por un signo de mas y cada valor de la muestra menor que O por

un signo de menos despueacutes se aprueba la hipoacutetesis nula de que estos signos de

mas y menos son valores de una variable aleatoria que tiene distribucioacuten binomial

con 2

1p (si un valor de la muestra es igual a O simplemente lo rechazamos)

Prueba de suma de rangos

Se puede utilizar cuando se desea probar una hipoacutetesis relacionada a un

paraacutemetro que refleje una tendencia central Cuando no se cumplen las premisas

de la prueba t el procedimiento de Wilcoxon es probable que sea mas potente

para detectar la existencia de diferencias importantes que su contraparte

correspondiente

Para llevar a cabo la prueba de rangos y signos de Wilcoxon se puede

aplicar el siguiente procedimiento de seis pasos

1 para cada partiacutecula en una muestra de n partidas se obtiene un

resultado de diferencia Di

2 despueacutes no se toman en cuenta los signos + y ndash y se obtiene un

grupo de n diferencias absolutas iD

3 se omite de cualquier anaacutelisis adicional cualquier diferencia

absoluta con resultados de 0 con lo cual se obtiene un grupo de n resultados de

diferencias absolutas que no sean cero donde n

4 despueacutes se asignan rangos Ri desde uno hasta n a cada una de las

iD de modo que el resultado de diferencia absoluta mas pequentildeo obtiene una

clasificacioacuten de uno y el mayor de n Por la falta de precisioacuten en el proceso de

medicioacuten si dos o mas iD son iguales a cada una se asigna el ldquorango promediordquo

de los rangos que de lo contrario se les hubieran asignado individualmente si no

hubiera ocurrido la igualdad de los datos

5 ahora se asignan de nuevo el siacutembolo + o el signo ndash a cada uno de

los n rangos de Ri dependiendo de si originalmente Di era positiva o negativa

6 la prueba estadiacutestica de Wilcoxon W se obtiene como la suma de

las clasificaciones +

n

i

iRW1

Para muestras de n 20 se puede utilizar tablas para obtener los valores

criacuteticos de la prueba estadiacutestica W tanto para las pruebas de una cola como de dos

a diversos niveles de significacioacuten Se rechaza la hipoacutetesis nula en una prueba de

dos colas si el valor observado W es igual o excede al valor critico superior o es

igual o inferior al valor critico inferior Se rechaza la hipoacutetesis nula en una prueba

de una cola en direccioacuten positiva si el valor observado W es igual o excede el

valor critico superior Se rechaza la hipoacutetesis nula para una prueba de una cola en

direccioacuten negativa si el valor observado de w es inferior o igual al valor critico

inferior

Para nge20 la prueba estadiacutestica W tiene distribucioacuten aproximadamente

normal y se puede utilizar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis nula

W

WWZ

VARIABLES ALEATORIA Y COMO SE DIVIDEN

Una variable es aleatoria si toma diferentes valores como resultado de un

experimento aleatorio Puede ser discreta o continua Si puede tomar soacutelo un

nuacutemero limitado de valores entonces es una variable aleatoria discreta En el otro

extremo si puede tomar cualquier valor dentro de un intervalo dado entonces se

trata de una variable aleatoria continua

Se puede pensar en una variable aleatoria como un valor o una magnitud

que cambia de una presentacioacuten a otra sin seguir una secuencia predecible Los

valores de una variable aleatoria son los valores numeacutericos correspondientes a

cada posible resultado de un experimento aleatorio

La distribucioacuten de probabilidad de una variable aleatoria proporciona una

probabilidad para cada valor posible y estas probabilidades deben sumar 1

VALOR ESPERADO DE UNA VARIABLE ALEATORIA

El valor esperado es una idea fundamental en el estudio de las distribuciones de

probabilidad

Para obtener el valor esperado de una variable aleatoria discreta se

multiplica cada valor que la variable puede tomar por la probabilidad de

presentacioacuten de ese valor y luego se suman esos productos Es un promedio

pesado de los resultados que se esperan en el futuro El valor esperado pesa cada

resultado posible con respecto a la frecuencia con que se espera se que presente

En consecuencia las presentaciones maacutes comunes tienen asignadas un peso

mayor que las menos comunes

El valor esperado tambieacuten puede ser obtenido a partir de estimaciones

subjetivas En ese caso el valor esperado no es maacutes que la representacioacuten de las

convicciones personales acerca del resultado posible

VARIABLES ALEATORIAS DISCRETAS

Variable que toma un nuacutemero finito o infinito de valores numerables

Sean x1 x2 x3 xn los distintos valores que puede tomar la variable

aleatoria

Y p(x1) p(x2) p(xn) su probabilidad

Los pares de valores (xj p(xj)) constituyen la distribucioacuten de probabilidades de la

variable aleatoria

p(x) se denomina funcioacuten de probabilidad y debe cumplir con las siguientes

propiedades

0 lt p(xj) lt 1 (p(x) es una probabilidad y por lo tanto debe tomar valores

entre 0 y 1)

1)( jxP (la suma de probabilidades repartidas entre todos los valores

de la variable debe ser igual a 1)

De la misma manera que calculamos frecuencias acumuladas podemos acumular

probabilidades obteniendo la funcioacuten de distribucioacuten de probabilidades

Esta funcioacuten representa la probabilidad de que la variable aleatoria sea menor o

igual que un determinado valor

F(xj) = P (X lt xj)

Graacuteficamente la funcioacuten aumenta de a saltos ya que entre dos valores

consecutivos de una variable discreta no puede tomar valores intermedios

VARIABLES ALEATORIAS CONTINUAS

En este caso en lugar de trabajar con la probabilidad de valores

particulares de la variable resulta maacutes apropiado calcular probabilidades

asociadas a intervalos Para distribuir propiedades se usa una funcioacuten que mide

concentracioacuten de probabilidades alrededor de un punto que se denomina

funcioacuten de densidad de probabilidad (fdp) y se denota como f(x)

Una funcioacuten de densidad de probabilidad debe cumplir con las siguientes

propiedades

F(x) gt 0 (la funcioacuten es no negativa para cualquier valor de x f(x) no es

una probabilidad y puede valer maacutes de 1)

el aacuterea bajo la curva de la funcioacuten vale 1)

La funcioacuten de distribucioacuten para una variable aleatoria continua se calcula

F(a) = P(X lt

La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula

P (alt x lt b) = F(b) - F(a)

La probabilidad de que la variable tome un valor particular se puede expresar

como

F(c) - F(c) = 0

DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO

Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia

valores de una variable aleatoria con sus respectivas probabilidades es

decir Probabilidad de x = Funcioacuten de x

Las distribuciones se caracterizan por una foacutermula que determina el tipo de

distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio

muestral

En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una

funcioacuten de la probabilidad que representa los resultados que se van obteniendo en

un experimento aleatorio

Asiacute para un nuacutemero dado x la probabilidad es

A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la

variable X y representa la probabilidad de que la variable tome el valor desde

hasta x

Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de

probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad

Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos

y seraacuten mutuamente excluyentes y su suma es el

suceso por lo que tenemos entonces que

y finalmente

Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos

los valores de la variable aleatoria x conoceremos completamente la distribucioacuten

de probabilidad de la variable

Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten

de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente

Es decir la probabilidad de todo el espacio muestral es 1 tal y como

establece la teoriacutea de la probabilidad y por otra parte

Es decir la probabilidad del suceso nulo es cero

Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de

probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes

praacutectico el uso de la funcioacuten de densidad

En el caso de una variable discreta la distribucioacuten puede describirse

mediante una funcioacuten de probabilidad que para cada valor de x de la variable X

determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de

una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de

distribucioacuten la que para cada valor provee la probabilidad de no ser superado

evidentemente el valor de la funcioacuten de distribucioacuten es igual

a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo

inferior del dominio de la variable hasta x inclusive Lista de los resultados de un

experimento con las probabilidades que se esperariacutean ver asociadas con cada

resultado

Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores

diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12

En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica

Para el caso de 1 solo dado donde todos los valores tienen la misma

probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme

Prueba de aleatoriedad

Con frecuencia se supone que los datos recopilados constituyen una

muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la

utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash

Wolfowitz de corridas de una muestra para aleatoriedadrdquo

Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o

la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos

siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la

partida tiene una propiedad en particular o de la cantidad o magnitud en que se

posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la

sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con

distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente

de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que

la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las

partidas que la preceden o las que la suceden en forma tal que la probabilidad de

su ocurrencia varia de una posicioacuten a otra el proceso no se considera como

aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando

esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en

forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico

Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el

tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico

de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una

prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede

rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la

sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de

una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2

exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por

consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis de aleatoriedad

U

UUZ

donde

U = numero total de corridas

U = valor medio de U 12 21

n

nnU

U = desviacioacuten estaacutendar de U 1

222

2121

nn

nnnnnU

n1 = numero de eacutexitos en la muestra

n2 = numero de fracasos en la muestra

n = tamantildeo de la muestra n = n1 + n2

PRUEBA DE McNEMAR

Suele darse el caso en que se desean comparar las proporciones de los

datos de muestras tomados de poblaciones relacionadas En este caso se quisiera

determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a

alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea

determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y

otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede

utilizar la prueba desarrollada por McNemar

El principal intereacutes es determinar si hay diferencia entre las dos

proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta

que el otro (prueba de una cola)

La prueba estadiacutestica para la prueba de McNemar es

CB

CBZ

PRUEBA U DE MANN ndash WHITNEY

Es una alternativa no parametrica a la prueba t de dos muestras para la

diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula

μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos

la forma de distribuciones normales de hecho la prueba solo requiere que las

poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no

importa si se cumple o no esta suposicioacuten

Estadiacutesticos U1 y U2

111

2112

1 W

nnnnU

222

2122

1 W

nnnnU

PRUEBA DE RACHAS

Son todas las diferencias que tiene el mismo signo y se presentan en una

misma fila Una serie de n diferencias puede tener solamente una racha (toda

positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las

rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de

poblaciones con la misma distribucioacuten de frecuencias Colocamos las

observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces

contamos el numero de rachas item de cada una de las muestras Si hay menos

rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales

rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten

La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de

que las observaciones se han sacado aleatoriamente de una sola poblacioacuten

Para hacer esto se halla la mediana de la muestra y se designa las

observaciones situadas por debajo de la mediana por un signo menos (-) y las

observaciones situadas por encima de la mediana por un signo (+) Si el numero

de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado

rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el

numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10

puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la

tabla normal con

u

uu

z

2

1

12

21

21

NN

NNu

)1()(

2(2

21

2

21

2121212

NNNN

NNNNNNu

DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES

DISTRIBUCIONES DE EJEMPLO Y USO

DISTRIBUCIOacuteN NORMAL O GAUSSIANA

Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que

multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal

Esta distribucioacuten de caracteriza porque los valores se distribuyen formando

una campana de Gauss en torno a un valor central que coincide con el valor

medio de la distribucioacuten

Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a

la izquierda

Esta distribucioacuten viene definida por dos paraacutemetros

X N (m S2)

m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro

de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores

estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores

estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de

ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten

estaacutendar

Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina

normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo

que permiten obtener esos mismos valores donde se recoge la probabilidad

acumulada para cada punto de la curva de esta distribucioacuten

Ademaacutes toda distribucioacuten normal se puede transformar en una normal

tipificada

Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con

media 10 y varianza 4 Transformarla en una normal tipificada

X N (10 4)

Para transformarla en una normal tipificada se crea una nueva variable (Y)

que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica

(que es la raiacutez cuadrada de la varianza)

En el ejemplo la nueva variable seriacutea

Esta nueva variable se distribuye como una normal tipificada

permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor

Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos

indicado de que las probabilidades para cada valor de la curva se encuentran

recogidas en una tabla

MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)

La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten

normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta

distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros

y lo que representamos del modo si su funcioacuten de densidad

es

Observacioacuten

Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y

la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes

adelante65

La forma de la funcioacuten de densidad es la llamada campana de Gauss

Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten

normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1

Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un

uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto

con lo cual en coinciden la media la mediana

y la moda y por uacuteltimo calcular sus puntos de inflexioacuten

El soporte de la distribucioacuten es todo de modo que la mayor parte de la

masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se

encuentra concentrado alrededor de la media y las ramas de la curva se extienden

asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la

media es posible (aunque poco probable)

La forma de la campana de Gauss depende de los paraacutemetros y

indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)

Figura Distribuciones gaussianas con diferentes medias e igual

dispersioacuten

(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor

sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor

de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea

``maacutes aplastado seraacute

Figura Distribuciones gaussianas con igual media pero varianza

diferente

La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes

adelante que es

Como consecuencia la distribucioacuten normal es reproductiva con respecto a

los paraacutemetros y ya que

Observacioacuten

Como se ha mencionado anteriormente la ley de probabilidad gaussiana la

encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza

por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el

de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que

apuntar un hecho negativo para esta ley de probabilidad

La funcioacuten no posee primitiva66

conocida67

Las consecuencias desde el punto de vista praacutectico son importantes ya que

eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de

la normal y nos tenemos que limitar a decir que

sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente

esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho

puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto

se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en

problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde

se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie

limitada de valores xi dados Normalmente F se encuentra tabulada para una

distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten

normal tipificada

En el caso de que tengamos una distribucioacuten diferente se

obtiene Z haciendo el siguiente cambio

De manera general se tiene

Proposicioacuten (Cambio de origen y escala)

Sean Entonces

Este resultado puede ser utilizado del siguiente modo Si y nos

interesa calcular

1 Hacemos el cambio y calculamos

2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de

modo aproximado) Como

tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada

Ejemplo

Supongamos que cierto fenoacutemeno pueda ser representado mediante una

va y queremos calcular la probabilidad de que Xtome un valor

entre 39 y 48 es decir

Comenzamos haciendo el cambio de variable

de modo que

Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que

hemos mencionado anteriormente

Proposicioacuten

Sea Entonces

Demostracioacuten

Por ser la normal una ley de probabilidad se tiene que

es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con

respecto a se obtiene el valor 0

luego

Para demostrar la igualdad entre la y basta con aplicar la misma

teacutecnica pero esta vez derivando con respecto a

Luego

Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en

primer lugar la va tipificada de X

y calculamos

Como por la proposicioacuten 5 deducimos que

CURVA NORMAL ESTANDARIZADA

Una variable numeacuterica puede clasificarse como discreta o continua Las

variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas

con la idea de contar Las variables continuas se pueden asociar con la idea de

medir utilizando fracciones y decimales Cuando la variable es continua el

modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal

El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten

normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran

cantidad de variables continuas

El modelo matemaacutetico

La funcioacuten matemaacutetica que se usa como modelo es

e = 271

π = 314

μx = media de la poblacioacuten

σx = desviacioacuten estaacutendar de la poblacioacuten

x = un valor de la variable continua

Como e y π son constantes la forma de la curva normal depende

solamente de los dos parametros de la distribucioacuten normal la media μx y la

desviacioacuten estaacutendar σx

Las diferentes curvas normales van a variar dependiendo de esos dos

paraacutemetros

En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar

visualmente como una curva en forma de campana El aacuterea debajo de esta curva se

halla por medio del integral de la funcioacuten y corresponde al por ciento o la

proporcioacuten de puntuaciones que se encuentran en el intervalo dado

Propiedades de las distribuciones normales

a Son simeacutetricas y tienen forma de campana

b Al ser simeacutetricas la media la moda y la mediana coinciden

c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea

de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media

d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la

curva se encuentra a tres desviaciones estaacutendar de la media

En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral

de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de

diferentes secciones de la curva o se utiliza la computadora para calcular ese valor

del aacuterea

La distribucioacuten normal estandarizada

Puesto que hay un nuacutemero infinito de combinaciones para los dos

paraacutemetros hay un nuacutemero infinito de curvas normales diferentes

Este problema se ha resuelto praacutecticamente al transformar los valores de

todas las distribuciones normales a los valores de una distribucioacuten normal

estandarizada representada por la curva normal estandarizada (standard normal

curve)

Las puntuaciones estandarizadas se logran restando la media a cada

observacioacuten y dividiendo entre la desviacioacuten estaacutendar

donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar

Propiedades de la distribucioacuten normal estandarizada

μ z = 0

σ z = 1

En muchas ocasiones se quieren comparar puntuaciones que pertenecen a

dos distribuciones normales diferentes La diferencia entre las dos distribuciones

radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo

la comparacioacuten se hace posible si se convierten las puntuaciones de ambas

distribuciones a puntuaciones z que corresponden a la distribucioacuten normal

estandarizada

Percentiles y rangos percentiles de una distribucioacuten normal estandarizada

Si se desea hallar la percentiles o el rango percentil en una distribucioacuten

normal no estandarizada se recurre al procedimiento de convertir las puntuaciones

de la distribucioacuten normal dada a puntuaciones z que corresponden a la

distribucioacuten normal estandarizada

Estos valores en la distribucioacuten normal estandarizada se pueden obtener

por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en

las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el

intervalo dado

Es necesario visualizar siempre el aacuterea debajo de la curva como el por

ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo

dado

Cuando una distribucioacuten de puntuaciones es normal estandarizada la

pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar

en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o

cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten

dada

DISTRIBUCIOacuteN GAMMA

Una variable aleatoria X asociada a un experimento aleatorio tiene una

distribucioacuten GAMMA si se caracteriza por las siguientes propiedades

Algunas alternativas de funciones de densidad se pueden ver en la graacutefica

del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)

respectivamente =1

=1

La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo

III

El modelo Gamma se ha utilizado frecuentemente en variables tales como

ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el

intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson

ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900

ndash Flujos maacuteximos MARKOVIC 1965

ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965

ndash Altura de la precipitacioacuten mensual WHITCOMB 1940

ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia

infin

ndash Ingresos familiares

ndash Edad del hombre al contraer matrimonio por primera vez

ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en

subestaciones a una frecuencia part

Ejemplo

Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos

de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia

promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo

de tiempo se encuentre hasta que ocurre el segundo ciclo

a Dentro de una desviacioacuten con respecto del tiempo promedio

b A maacutes de dos desviaciones por encima de la media

Solucioacuten

X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en

horas

Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)

= 2

Y Nuacutemero de ciclos hora ---------Y~P( =002)

E(Y) = 002 =

X ~ G(2 002)

Ejemplo

En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de

kilovatios por hora puede considerarse como una variable aleatoria con

distribucioacuten GAMMA de paraacutemetros = 3 y

= 05

La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de

KWhora

iquestCuaacutel es la probabilidad de que este abastecimientos sea

a Insuficiente en un diacutea cualquiera

b Se consuman entre 3 y 8 millones de K WHora

c c Encuentre E(x) y V(x)

SOLUCIOacuteN

DISTRIBUCIOacuteN PARETO

En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad

continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores

es

Su funcioacuten de distribucioacuten es

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto

son

El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (

DISTRIBUCIOacuteN T DE STUDENT

Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una

distribucioacuten t con n grados de libertad

Cuando n--gtinfinito a curva t coincide com la normal estandarizada

FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX

MOMENTOS

La distribucioacuten -Student se construye como un cociente entre una normal

y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-

Student con n grados de libertad a la de una va T

donde Este tipo de distribuciones aparece cuando

tenemos n+1 va independientes

y nos interesa la distribucioacuten de

La funcioacuten de densidad de es

Figura Funcioacuten de densidad de una de Student

La distribucioacuten de Student tiene propiedades parecidas a

Es de media cero y simeacutetrica con respecto a la misma

Es algo maacutes dispersa que la normal pero la varianza decrece hasta

1 cuando el nuacutemero de grados de libertad aumenta

Figura Comparacioacuten entre las funciones de densidad de y

Para un nuacutemero alto de grados de libertad se puede aproximar la

distribucioacuten de Student por la normal es decir

Figura Cuando aumentan los grados de libertad la distribucioacuten de

Student se aproxima a la distribucioacuten normal tipificada

Para calcular

DISTRIBUCIOacuteN BETA

Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede

representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un

intervalo de longitud finita Tales como

Proporcioacuten de impurezas en un producto quiacutemico

La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten

La proporcioacuten vendida de un lote durante un tiempo t

La humedad relativa medida en cierto lugar

Porcentaje del costo total destinado a reparacioacuten de maquinaria

Porcentaje de costo adicional destinado a reparacioacuten de maquinaria

La distribucioacuten del tiempo necesario para completar una fase del proyecto

PERT

Evaluacioacuten de programas y teacutecnicas de revisioacuten

Ejemplo

La proporcioacuten de tramos de una autopista que requieren repararse

semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros

= 3 y =2

a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten

b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista

requieren reparacioacuten en un antildeo cualquiera

DISTRIBUCIOacuteN CAUCHY

En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de

Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es

donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene

valor esperado ni varianza

Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V

2 lt 1 el

numero U V tiene la distribucioacuten Cauchy

La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un

grado de libertad

Ejemplo

Sean y dos observaciones independientes de una distribucioacuten

Cauchy con funcioacuten de densidad

Puede demostrarse que si y son tales que entonces la

funcioacuten de verosimilitud de es bimodal

Sean y Supongamos que se desea hacer inferencias sobre el

valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa

Especiacuteficamente interesa encontrar la distribucioacuten final de

Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la

distribucioacuten final de tiene una forma complicada Es conveniente notar sin

embargo que corresponde a la densidad marginal de respecto a la

densidad conjunta

DISTRIBUCIOacuteN BERNOULLI

Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto

suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el

que no lo sea (fracaso) En realidad no se trata maacutes que de una variable

dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello

que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas

obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la

situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este

experimento mediante una va discreta Xque toma los valores X=0 si el suceso no

ocurre y X=1 en caso contrario y que se denota

Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar

una moneda al aire y considerar la va

Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de

probabilidad es

y su funcioacuten de distribucioacuten

Su funcioacuten caracteriacutestica es

Los principales momentos de la X los podemos calcular directamente

o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina

Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)

cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de

intentos

CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE

BERNOULLI

Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la

probabilidad y asegurar que se cumplen las tres condiciones necesarias en

particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del

resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3

requiere que los ensayos o intentos de un proceso de Bernoulli sean

estadiacutesticamente independientes es decir que el resultado de un intento no puede

afectar de ninguacuten modo el resultado de cualquier otro intento

DISTRIBUCIOacuteN EXPONENCIAL

Modelo para variable aleatoria continua que permite representar variables

del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos

Componentes

En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de

probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para

valores x gt 0 es

f(x) = λe - λx

Su funcioacuten de distribucioacuten es

Aqui e significa el nuacutemero e

El valor esperado y la varianza de una variable aleatoria X con

distribucioacuten exponencial son

E[X] = 1 λ

V(X) = 1 λ2

Ejemplo

Ejemplos para la distribucioacuten exponencial son los tiempos dentro

accidentes con probabilidad invariable

La funcioacuten de densidad para λ igual 05 10 y 15

DISTRIBUCIOacuteN MULTINOMIAL

La distribucioacuten multinomial es similar a la distribucioacuten binomial con la

diferencia de que en lugar de dos posibles resultados en cada ensayo

La distribucioacuten multinomial sigue el siguiente modelo

Donde

X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo

que el partido POPO lo hayan votado 3 personas)

n indica el nuacutemero de veces que se ha repetido el suceso (en el

ejemplo 5 veces)

n es factorial de n (en el ejemplo 5 4 3 2 1)

p1 es la probabilidad del suceso X1 (en el ejemplo el 40)

Veamos el ejemplo

Luego

P = 00256

Es decir que la probabilidad de que las 5 personas elegidas hayan votado

de esta manera es tan soacutelo del 256

Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1

Veamos otro ejemplo

En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el

40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4

invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos

Aplicamos el modelo

LuegoP = 00384

Por lo tanto la probabilidad de que el grupo esteacute formado por personas de

estos paiacuteses es tan soacutelo del 384

DISTRIBUCIOacuteN UNIFORME

En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de

probabilidad cuyos valores tienen la misma probabilidad

Caso discreto

Su funcioacuten de probabilidad es en el caso discreto con valores posibles

p(xi) = 1 n

Su funcioacuten de distribucioacuten es en el caso discreto

Su media estadiacutestica es

Caso continuo

Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b

La funcioacuten de densidad en el caso continuo entre a y b es

Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12

Ejemplos

Para un dado perfecto todos los resultados tienen la misma probabilidad 1

6

Calcular variables aleatorias

Las variables aleatorias de probabilidad uniforme pueden calcularse con un

generador de variables aleatorias

DISTRIBUCIOacuteN BINOMIAL

En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad

discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con

probabilidad p de un eacutexito

Su funcioacuten de densidad es

Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)

posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos

((1 - p)n - x

)

El valor esperado de una variable aleatoria de probabilidad binominal es

E[x] = np y su varianza V[x] = np(1 - p)

DISTRIBUCIOacuteN BINOMIAL NEGATIVA

Sobre una sucesioacuten de va de Bernouilli independientes

Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r

eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de

distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo

Su ley de probabilidad se deduce siguiendo el esquema

De nuevo el conjunto de posibles valores de esta va discreta es

Su funcioacuten caracteriacutestica es

y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima

Ejemplo

Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en

operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal

que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda

definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para

intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus

5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones

que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se

necesiten 10 intervenciones

Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por

una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan

4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso

Identificando los paraacutemetros se tiene

Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el

nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy

simple

Y=X+r

Luego

Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente

es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de

que X=10-4=6 Por tanto

La distribucioacuten binomial negativa tambieacuten se puede definir como el

nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas

contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que

DISTRIBUCIOacuteN DE POISSON

Modelo para variable aleatoria discreta que permite calcular la

probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten

discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo

muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos

o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual

a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es

independiente de cuaacutendo se presenta dicho periacuteodo

En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de

probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos

es

Aquiacute e significa el nuacutemero e y x significa el factorial de x

La distribucion de Poisson describe el nuacutemero de sucesos en una unidad

de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un

proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens

en una carrera

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten

Poisson son

E[X] = V[X] = λ

La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos

entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un

conmutador la demanda (necesidades) de los pacientes que requieren servicio en

una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el

nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos

ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una

variable aleatoria discreta que toma valores enteros (0 1 2)

Caacutelculo de la probabilidad de Poisson

La letra X por lo general representa a una variable discreta y puede tomar

valores enteros Utilizamos la letra X para representar a la variable aleatoria y la

letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La

probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson

se calcula con la foacutermula

LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA

DISTRIBUCIOacuteN BINOMIAL

La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la

binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan

cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es

grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan

con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena

aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es

igual o menor que 005 En los casos en que se cumplen estas condiciones

podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media

de la distribucioacuten de Poisson

DISTRIBUCIOacuteN GEOMEacuteTRICA

En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten

probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores

discretos es

P(X = x) = p(1 - p)x - 1

Su funcioacuten de distribucioacuten es

El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media

estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2

Ejemplo

El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es

una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6

DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA

En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de

probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de

masa para valores es

Aqui (a sobre b) es el coeficiente binomial

El valor esperado de una variable aleatoria X de distribucioacuten

hipergeomeacutetrica es

Y su varianza

DISTRIBUCIOacuteN ZETA

En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad

discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos

es

Aqui ζ(s) es la funcioacuten zeta de Rieman con

El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto

DISTRIBUCION CHI CUADRADO

El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una

comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es

diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con

ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno

es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario

estas dos frecuencias acusan una diferencia significativa para por ejemplo un

nivel de significacioacuten del 5

El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la

asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada

por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito

bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor

del famoso libro Statistical Methods for Research Workers (1925) donde se

marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con

Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde

estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y

el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las

pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba

exacta de Fisher

Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico

publicitario presentado a grupos de clientes comparar la rentabilidad de un

proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos

de los turistas por determinados espacios geograacuteficos o por determinados

servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las

frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las

frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o

tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o

de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2

x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos

turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han

ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han

tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula

que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido

en los sitios A y B

Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es

independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo

A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces

alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este

anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos

empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de

las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51

La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten

igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es

2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del

Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del

5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206

podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para

suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B

Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias

observadas empiacutericamente de dos muestras con las frecuencias esperadas o

teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el

Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de

las materias primas perecederas Los resultados son seguacuten atributos cualitativos

los siguientes Primero veremos las frecuencias empiacutericas u observadas

Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten

Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son

131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas

Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y

fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres

columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta

maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x

120 260 = 6046 b2 = 129 x 120 260 = 5954

Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten

igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de

2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de

libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La

diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna

conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten

Es una medida de la discrepancia existente entre las frecuencias

observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso

de frecuencias () debido a que permite determinar las desviaciones entre ellas

ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la

expresioacuten

E

EOX

2

2

Donde

O frecuencia observada

E frecuencia teoacuterica esperada

TEST DE CHI-CUADRADO DE CONTINGENCIA

Un caso particular del test de chi-cuadrado que permite hacer un test sobre

la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-

cuadrado de contingencia Los dos caracteres observados en una misma

poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases

de se denotan las de por Tambieacuten vamos a

denotar

el efectivo conjunto de y es el nuacutemero de individuos para los

cuales toma el valor e el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

Estos valores se representan en una tabla de doble entrada conocida como

tabla de contingencia

Cada fila y cada columna corresponden a una submuestra particular La

fila de iacutendice es la distribucioacuten en las clases de los individuos para

los cuales el caraacutecter toma el valor La columna de iacutendice es la

distribucioacuten en las clases de los individuos para los cuales el caraacutecter

toma el valor Dividiendo las filas y las columnas por su suma se obtienen

frecuencias condicionales para cada una de las distribuciones empiacutericas Para

y las denotaremos por

y

Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y

los perfiles columna Para el modelo probabilista las observaciones provienen de

una muestra

de una ley bidimensional La hipoacutetesis a comprobar

es que los dos marginales de esta ley son independientes Si este es el caso los

perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna

de la de

y

Es equivalente a decir que las frecuencias conjuntas deben estar cerca de

los productos de las frecuencias marginales

Las frecuencias conjuntas por un lado (distribucioacuten observada) y los

productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen

dos distribuciones de probabilidad sobre el conjunto producto

Podemos por tanto calcular la distancia de

chi-cuadrado de una con respecto a la otra

Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la

distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale

Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la

definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado

Por lo dicho anteriormente para suficientemente grande podemos

aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el

nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados

a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las

que han sido estimadas Hay para el caraacutecter y para el caraacutecter

(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley

chi-cuadrado seraacute por tanto

Vamos a presentar un ejemplo de dos caracteres binarios que tienen que

ver con enfermos para los cuales se ha observado si tienen o no una tendencia al

suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y

neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las

tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla

de contingencia observada es

Tendencia Sin tendencia Total

Psicosis 20 180 200

Nneurosis 60 140 200

Total 80 320 400

La distancia de chi-cuadrado de contingencia calculada a partir de esta

tabla es de El valor tomado por el estadiacutegrafo es el cual

debemos comparar con la ley El p-valor es de

Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre

la tendencia al suicidio y la clasificacioacuten de las enfermedades

El test no precisa el sentido de esta dependencia Para describirla hay que

comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre

los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten

PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS

Los investigadores se interesan constantemente en las diferencias entre dos

poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado

civil profesioacuten color de ojos preferencia por una marca etc)

Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de

contingenciardquo

Se puede realizar una prueba para la diferencia entre dos proporciones

sobre la base de muestras independientes usaacutendose como instrumento la prueba

de chi cuadrado

El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es

la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se

podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda

Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la

ecuacioacuten

n

nnE CR

donde

nR nuacutemero total en el rengloacuten

nC nuacutemero total en la columna

n tamantildeo total de la muestra

El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado

entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia

al cuadrado se divide entre la frecuencia esperada de la celda

La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se

rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el

valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados

de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el

tamantildeo de la muestra

CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD

Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a

las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se

puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la

distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado

siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal

Por consiguiente al probar la diferencia entre las dos proporciones la

distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes

Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia

direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten

normal

La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede

ilustrar mediante el siguiente ejemplo

Cuartos de bantildeos modernos

Cocina moderna Caren

cia

existenc

ia

totales

Carencia 72 8 80

Existencia 7 146 153

La hipoacutetesis nula y alternativa seriacutean

YN ppH 0

YN ppH 0

Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de

significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute

Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H

A partir de la informacioacuten del cuadro

10080

8

N

NSN

n

Xp 95420

153

146

Y

YSY

n

Xp

A partir de la expresioacuten

21

21

111

nnpp

pPZ SS

donde

661015380

1468

p

por lo tanto

0813

153

1

80

133906610

95420100

Z

Totales 79 154 223

Dado que 1960813 Z se rechaza la 0H por lo tanto hay

diferencia entre las dos proporciones

Usando la prueba de chi cuadrado y la tabla de contingencia de este

ejemplo se tiene

Las frecuencias teoacutericas se pueden obtener a partir de la siguiente

ecuacioacuten

n

nnE CR

Por lo tanto se tiene

1227233

7980E 8852

233

15480E

8851233

79153E 12101

233

154153E

Chi cuadrado se obtiene a partir de la expresioacuten

E

EOX

2

2

A partir de la tabla se tiene

O E (O ndash E) (O ndash E)2

(O ndash E)2E

7

2

2

712

+4488 20142144 742704

7 5

188

- 4488 20142144 388245

8 5 -4488 20142144 380903

288

1

46

1

0112

+4488 20142144 199191

1711043

10431712 CALCULADOX

Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el

84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo

tanto hay diferencia entre las dos proporciones

Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la

distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos

distribuciones que a un nivel de significancia de 005 el valor de 196 es el

cuadrado de 3 841 es decir 22 ZX

CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA

La afirmacioacuten de que no existen diferencias entre proporciones significa

que las dos variables son independientes Cuando las conclusiones se presentan en

esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo

Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que

no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la

hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos

variables Independientemente de que la prueba de chi cuadrado se considera una

prueba de diferencia entre dos proporciones o una prueba de independencia los

caacutelculos y resultados son exactamente los mismos

CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE

Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o

intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que

ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de

probabilidades

Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que

seguir varios pasos Primero se tiene que establecer la distribucioacuten de

probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada

paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la

media) se deben establecer mediante hipoacutetesis o estimarlos con base a la

informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para

determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o

intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado

para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la

informacioacuten

BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON

La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de

Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la

cantidad de automoacuteviles estacionados en una cochera cubierta siguen una

distribucioacuten de Poisson 0H

En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero

de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una

muestra aleatoria de 233 casas

Numero de automoacuteviles Frecuencia

0 61

1 151

2 21

233

Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados

de la distribucioacuten de frecuencia

No de automoacuteviles Frecuencia observada On

0 61 0

1 151 151

2 21 42

233 193

808280233

193

1

n

On

X

n

i por lo tanto 80X

El valor de la media muestral se utilizara como el estimado de X

Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)

y se obtiene la frecuencia teoacuterica para cada una

Automoacutevil

n

Frecuencia

O

Probabilidad

XP

Frecuencia (E)

XPn

0 61 04493 104687

1 151 03595 87764

2 21 01438 33505

Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de

significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX

El valor calculado de chi cuadrado es

50679

2

2

K

CALCULADO

E

EOX

Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de

automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una

distribucioacuten de Poisson

CORRECCIOacuteN DE YATES

Cuando se aplican a datos discretos los resultados para distribuciones

continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres

comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de

Yates la cual viene dada mediante la expresioacuten

E

EOX CALCULADO

502

2

En general la correccioacuten se hace solamente cuando el numero de grados

de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos

resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en

relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia

esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi

cuadrado corregido y no corregido Si ambos valores conducen a la misma

conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se

presentan dificultades Si conducen a conclusiones diferentes se puede o bien

incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear

meacutetodos de probabilidad exactos

El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente

ejemplo

En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces

Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de

significancia del 005

No de caras Frecuencia Probabilidad Frecuencia (E)

Cara 115 05 100

cruce 85 05 100

2054

100

0510085

100

0510011522

2

CALCULADOX

Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado

con correccioacuten de Yates es

8432 TABULADOX

Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha

PRUEBA EXACTA DE FISHER

Para examinar la igualdad de las varianzas de dos poblaciones

independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de

las varianzas de las dos muestras Suponiendo que la informacioacuten de cada

poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2

2

2

1 SS sigue una

distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso

estadiacutestico RA Fisher

Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de

grados de libertad los grados de libertad en el numerador y en el denominador

la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea

2

2

2

111 21

S

SF nn

donde

n1 = tamantildeo de muestra en el grupo 1

n2 = tamantildeo de muestra en el grupo 2

n1 ndash 1 = grados de libertad en el grupo 1

n2 ndash 1 = grados de libertad en el grupo 2

2

1S varianza de la muestra en el grupo 1

2

2S varianza de la muestra en el grupo 2

Al probar la igualdad de dos varianzas se pueden emplear pruebas de una

cola o de dos colas

El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente

ejemplo

Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas

alta en la planta A que en la planta B Para determinar la variabilidad se puede

establecer una prueba de una cola en la forma siguiente

22 BAOH

22

1 BAH

Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta

A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta

ubicada en la cola superior de la distribucioacuten

Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de

libertad en el numerador y 19 en el denominador a un nivel de significancia de

001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene

71162 AS y 20142 BS por lo tanto

38512014

71162

2

1924 F como 1385 lt

292 no se rechaza la hipoacutetesis nula ( OH )

CONCLUSIOacuteN

La conclusioacuten que los resultados de una medida variable es la causa de

variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten

estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero

no puede reclamar legitimidad

La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en

describir la distribucioacuten de las variables estudiadas y en particular de los datos

numeacutericos Ademaacutes de las medidas descriptivas correspondientes el

comportamiento de estas variables puede explorarse graacuteficamente de un modo

muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro

organizador de las ciencias computarizadas y el modelo que nos dota de un

mejor razonamiento para implementar programas eficientes En este sentido la

combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un

reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en

colegios y universidades

Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de

combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y

evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras

loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre

operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten

juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la

teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones

simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades

que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea

BIBLIOGRAFIacuteA

AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis

Third Edition Texts in Statistical Science Chapman and Hall

BOXG E P HUNTER W G HUNTER JS (1978) Statistics for

Experimenters John Wiley amp Sons

BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores

Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de

Modelos Ed Revertsbquo SA

Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed

Piraacutemide

Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten

(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica

Matemaacutetica I Universidad de Antioquia

Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma

Madrid

Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill

Meacutexico

Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten

yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico

Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw

ndashHill 4ta Edicioacuten Colombia

CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana

Meacutexico

COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas

COX DR (1958) Planning of experiments New York John Wiley amp Sons

DANIEL C Applications of Statistics to Industrial Experimentation Willey

DAVIES OL The Design and Analysis of Industrial Experiments Hafner

(McMillan)

DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias

Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico

SA de CV Meacutexico

De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H

(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico

Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta

Estadiacutestica Editorial Microsoft corporation USA

ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial

Limusa SA Meacutexico

EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis

Arnold

FEDERER W (1965) Experimental design Oxford Publ Co

GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la

Varianza Grupo Editorial Universitario

FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico

McGraw Hill

FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque

ModernoEditorial SA Meacutexico

George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y

Meacutetodosrdquo Ed McGraw-Hill

GILL JL (1978) Design and Analysis of Experiments in the Animal and

Medical Sciences Iowa State University Press

JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression

and Experimental Design Springer-Verlag

Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor

Caracas

GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining

Institute

GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data

Mining Institute

Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial

Bourgeoacuten Caracas

Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la

EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute

Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial

BourgeoacutenCA Caracas ndash Venezuela

HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis

Multivariante 5ordf Edicioacuten Prentice Hall

JOBSON JD (1992) Applied Multivariate Data Analysis Volume II

Categorical and Multivariate Methods Springer-Verlag

KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial

Hispanoamericana Meacutexico

KIRK RE Experimental Design Procedures for the Behavioral Sciencies

BrooksCole Publishing Company

LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e

inferencia Estadiacutestica Editorial Limusa Meacutexico

LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV

Grupo Noriega Editores Meacutexico

LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial

HARLA Meacutexico

LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta

edicioacuten Editorial McGaw-Hill Usa

Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial

Hispanoameacuterica VI edicioacuten Meacutexico

LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire

Multidimensionnelle 3ordf Edition DUNOD

LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e

Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB

Caracas- Venezuela

LORENZEN T J Anderson V L (1993) Design of experiments A No-Name

Approach Marcel Dekker Inc

Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc

(1999) SPSS 90 Manual de Usuario SPSS Chicago

MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis

Academic Press

Enfocados hacia SPSS

Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de

wwwspssparatodoscom 2005

MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten

Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla

Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea

Ediciones Alfaomega SAN Meacutexico

MASON RL Statistical Design and Analysis of Experiments with Applications

to Engineering and Science John Wiley amp Sons New York

MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y

Economiacutea Editorial Iberoamericana Meacutexico

MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in

agriculture and experimental biology Second edition Chapman amp Hall

MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo

Editorial Iberoameacuterica

MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers

John Wiley amp Sons

Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial

Reverte Mejicana Meacutexico

Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da

Edicioacuten Meacutexico

Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc

Graw Hill

PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones

Editorial Limusa Meacutexico

NETER J et al Applied Linear Statistical Models Regression Analysis of

Variance and Experimental Designs Library of Congress Cataloging Publication

Data

OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp

RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo

Editorial Universitario

PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos

Lineales y Series Temporales Vol 1 y 2 Alianza Editorial

Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores

Spain SA Espantildea 2005

PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial

Mir Moscuacute

RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed

McGraw-Hill

Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca

UCV Caracas ndash Venezuela

RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE

Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en

Psicologiacuteardquo p 1

SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons

Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti

Caracas ndash Venezuela

Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores

deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico

Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica

Editorial Harla Meacutexico

STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y

procedimientos Segunda edicioacuten McGraw Hill

SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas

Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1

Ediciones UNESR Caracas

URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante

Coartiacuteculo Plan Nuevo Editorial AC

VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II

Anaacutelisis Multivariante) Mc-Graw Hill

Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows

Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea

2002

WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros

Editorial Interamericana Meacutexico

Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8

Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage

Learning Editores p 364 ISBN 9706861947

Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea

Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea

Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de

CV Meacutexico

Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para

Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico

DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR

httpesmwikipediaorgwikiSPSS

httpwwwbuenastareascomensayosque-es-el-SPSS1465478html

httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-

del-software-estadistico-integral-spss-base-160

httpesanswersyahoocomquestionindexqid=20070727073908aatuamw

httpwwwslidesharenetleticiagpestructura-de-spss-3126476

httpwwwehowenespanolcomprograma-spss-sobre_48697

httpwwwugres~bioestmedicinamanual_spsspdf

httpwwwmonografiascomtrabajos12tutortutorshtml

httpwwwspsscom

wwwspssparatodoscom

httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html

httpwwwspssfreecomcapitulotreshtml

httpwwwuvesRELIEVEemail relieveuves

httpwwwscribdcomdochellipspss-introduccioacuten

httpeswikipediaorgwikiSPSS

httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd

f

httpwwwspsscomaressuccessargentinashtml

httpeswikipediaorgwikiSPSS

httpwww-01ibmcomsoftwareesanalyticsspss

httppsicofcepurvesspssindex0htm

httpssitesgooglecomsiteestadisticaconelspss

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpe-stadisticabioucmesweb_spssindice_spsshtml

httpwwwquimicaurvesquimiogeneralanovacastpdf

httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da

tosyMultivariable14anova1_SPSSpdf

httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800

20AnE1lisis20de20Varianzaspdf

httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-

pearson

httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf

httpwwwuoceduin3emathdocsRegresionLinealpdf

httpeswikipediaorgwikiRegresiC3B3n_lineal

httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES

ION_LINEAL_CON_SPSSpdf

httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN

EAL20SIMPLE20CON20SPSSpdf

httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE

SION_LINEAL_CON_SPSSpdf

httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm

httpeswikipediaorgwikiNivel_de_medida

httphtmlrincondelvagocomregresion-lineal-simplehtml

httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp

lepdf

httpwwwvitutorcomestadisticabi8html

httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf

httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-

Martinez_1pdf

httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml

httpesslidesharenetpatolinkecuacin-de-regresin-lineal

httpeswikipediaorgwikiMC3ADnimos_cuadrados

httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios

httpwwwwordreferencecomdefinicioncorrelaciC3B3n

httpwwwditutorcomestadistica_2correlacion_estadisticahtml

httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson

httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n

httpeswikipediaorgwikiMatriz_de_correlaciC3B3n

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpwwwinfecepiunizares

httpwwwltbioestadisticaumaes

httpwwwuaqmxmatematicasestadisticasxu3html

httpwwwmembers-americastripodcom

httpwwwmsiplceorg

httpwwwbnvcocrsesionnotaaspg

httpwwwaltavistacom

httpwwwauyantepuycom

httpwwwinees

httpwwwudeccl

httpwwwrincondelvagocom

httpwwwmonografiascom

httpwwwfestadisticafguamesindicadoresiprihtml

httpwwwuaqmxmatematicasestadisticaxu3html

httpwwwinegoboiwd0801htmlE

httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm

httpwwwitlpedumx

httpwwweclaevespanovestadisticasna93nnsnann7eshtml

httpw3moritesmmx~cmendozamaestestoohtml

httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml

httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion

httpwwwunleduarfaveseiencuestasindexhtml

httpwwwmonografiascomtrabajos11operaoperashtml

httpwwwmonografiascomtrabajos6hisohisoshtml

httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos

httpwwwmonografiascomtrabajos16sistema-operativosistema-

operativoshtmlTIPPOS

httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-

operativoshtml

httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei

httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml

httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-

operativo

httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software

httpwwwsscccoclinformaticaconceptoshtml

httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr

httpwwwcadcommxhistoria_de_la_computacionhtm

httpwwweswikipediaorgwikiBus_(informC3A1tica)

httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla

httpwwwcavsicompreguntasrespuestasque-es-el-teclado

httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm

Page 5: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,

Obseacutervese la importancia de asumir que este valor de desplazamiento de

una muestra a la otra es constante Si estamos comparando dos diferentes

tratamientos por ejemplo un placebo y un principio activo en dos muestras que

son homogeacuteneas basalmente este valor K seraacute el efecto que podremos imputar al

principio activo en cada caso la diferencia entre medias representa no el efecto

promedio sino el efecto del tratamiento en cada caso Si por el contrario este

efecto no fuera constante ya no se cumpliriacutean los supuestos de estas pruebas

Fig 1

Fig 2

Fig 3

Dentro de las pruebas parameacutetricas se tienen para muestras grandes y para

muestras pequentildeas Un supuesto que se aplica a ambas es que la muestra que se

toma debe haber sido seleccionada en forma aleatoria o probabiliacutestica En las

pruebas parameacutetricas de muestra pequentildea se requiere el supuesto de que las

muestras fueron extraiacutedas de una poblacioacuten con distribucioacuten normal y cuando se

trata de dos o maacutes muestras tambieacuten se requiere una prueba de igualdad de

varianzas Existen pruebas estadiacutesticas por medio de las cuales se podriacutea

comprobar esto sin embargo suele no daacutersele importancia a esto y se pasa por

alto El anaacutelisis de varianza tambieacuten se basa en el supuesto de normalidad de las

poblaciones y en el de que sus varianzas son iguales

En las pruebas en las que se tienen menos supuestos es en las de muestra

grande las cuales se pueden aplicar sin saber o comprobar si la poblacioacuten o

poblaciones eran normales estas pruebas se dice que son robustas porque no es

necesario que se cumpla dicho supuesto Cuando la prueba que se requiere no es

robusta no es necesario correr el riesgo de estar equivocados en las conclusiones

en ellos En cambio se dispone de muchas pruebas estadiacutesticas no parameacutetricas

que tienen una aplicacioacuten semejante a las parameacutetricas de muestra pequentildea en las

que se tienen menos supuestos

PRUEBAS NO PARAMEacuteTRICAS

Se denominan pruebas no parameacutetricas aquellas que no presuponen una

distribucioacuten de probabilidad para los datos por ello se conocen tambieacuten como de

distribucioacuten libre (distribution free) En la mayor parte de ellas los resultados

estadiacutesticos se derivan uacutenicamente a partir de procedimientos de ordenacioacuten y

recuento por lo que su base loacutegica es de faacutecil comprensioacuten Cuando trabajamos

con muestras pequentildeas (n lt 10) en las que se desconoce si es vaacutelido suponer la

normalidad de los datos conviene utilizar pruebas no parameacutetricas al menos para

corroborar los resultados obtenidos a partir de la utilizacioacuten de la teoriacutea basada en

la normal

Cuando se analizan datos medidos por una variable cuantitativa continua

las pruebas estadiacutesticas de estimacioacuten y contraste frecuentemente empleadas se

basan en suponer que se ha obtenido una muestra aleatoria de una distribucioacuten de

probabilidad de tipo normal o de Gauss Pero en muchas ocasiones esta

suposicioacuten no resulta vaacutelida y en otras la sospecha de que no sea adecuada no

resulta faacutecil de comprobar por tratarse de muestras pequentildeas En estos casos

disponemos de dos posibles mecanismos los datos se pueden transformar de tal

manera que sigan una distribucioacuten normal o bien se puede acudir a pruebas

estadiacutesticas que no se basan en ninguna suposicioacuten en cuanto a la distribucioacuten de

probabilidad a partir de la que fueron obtenidos los datos y por ello se denominan

pruebas no parameacutetricas (distribution free)

La mayoriacutea de las pruebas de hipoacutetesis requieren suposiciones especiacuteficas

acerca de la poblacioacuten o poblaciones que se muestran En muchos casos debemos

suponer que las poblaciones tienen maacutes o menos la forma de distribuciones

normales o que se conocen sus varianzas o se sabe que son iguales o bien que las

muestras son independientes Como hay muchos casos donde no se pueden

cumplir estas suposiciones los estadiacutesticos han generado teacutecnicas alternativas

basadas en suposiciones menos estrictas que se han dado a conocer como

ldquoPruebas no parametricasrdquo

En estos casos se emplea como paraacutemetro de centralizacioacuten la mediana

que es aquel punto para el que el valor de X estaacute el 50 de las veces por debajo y

el 50 por encima

Propiedades

1 No se relacionan con el estudio de un paraacutemetro de la poblacioacuten

Por lo general cuando se hace referencia a pruebas no parameacutetricas se puede estar

hablando tanto de las no parameacutetricas como de las libres de distribucioacuten

(distribution free tests)

Las dos indicaciones maacutes importantes que se deben tener en cuenta para utilizar

una prueba no parameacutetrica son que

1 la distribucioacuten de la poblacioacuten no sea normal

2 la escala de medicioacuten de la variable en cuestioacuten sea categoacuterica

Los meacutetodos no parameacutetricos son menos poderosos que los parameacutetricos Esto

quiere decir que es maacutes difiacutecil rechazar la hipoacutetesis nula con las pruebas no

parameacutetricas

Por esa razoacuten los estadiacutesticos por lo general recurren a los meacutetodos no

parameacutetricos soacutelo cuando los datos no cumplen con los supuestos parameacutetricos

Sin embargo hay problemas de investigacioacuten en los que las variables categoacutericas

son las indicadas y por lo tanto soacutelo un meacutetodo no parameacutetrico es el indicado Los

pasos en las pruebas de hipoacutetesis no parameacutetricas son los mismos de las

parameacutetricas Los cambios por lo general se limitan a cambios en la foacutermula para

obtener el valor observado y en la tabla que se utiliza Pero se habla de hipoacutetesis

nula nivel de significacioacuten error tipo I y tipo II etc

El uso de meacutetodos no parametricos ofrece numerosas ventajas

1 los meacutetodos no parametricos se pueden usar con todo tipos de datos

ndash informacioacuten cualitativa (de escala nominal) informacioacuten en forma de rangos

(escala ordinal) asiacute como informacioacuten medida de un modo mas exacto (escala de

intervalo o de razoacuten)

2 por lo general son faacuteciles de aplicar y raacutepidos de calcular con

tamantildeos pequentildeos de muestra En ocasiones son tan sencillos que basta contar

con la frecuencia con que algunas caracteriacutesticas aparecen en los datos Por lo

tanto a menudo se usan para estudios piloto o preliminares yo en situaciones en

que se desean respuestas raacutepidas

3 hacen menos premisas menos estrictas (mas faacuteciles de cumplir) que

los procedimientos claacutesicos por lo tanto gozan de mayor aplicabilidad y

proporcionan un conjunto de conclusiones mas generales de base mas amplia

4 permiten solucionar problemas que no implican pruebas de

paraacutemetros de poblacioacuten

5 son mas econoacutemicos que los procedimientos claacutesicos ya que el

investigador puede aumentar la potencia y a pesar de ello ahorrar dinero tiempo y

trabajo al recopilar muestras de datos mayores medibles con mas aproximacioacuten

lo que soluciona con mayor rapidez el problema

6 seguacuten el procedimiento seleccionado los meacutetodos no parametricos

pueden ser tan poderosos (o casi tanto) como el procesamiento claacutesico cuando se

cumplen las premisas de este ultimo y quizaacutes sean un poco mas poderosos aun

cuando no se cumplan

Los procedimientos no parametricos tambieacuten ofrecen algunas desventajas

1 no conviene usar meacutetodos no parametricos cuando se pueden

cumplir todas las premisas de los procedimientos claacutesicos y los datos se miden en

una escala bien sea de intervalos de razones A menos de que se empleen

procedimientos claacutesicos en estos casos el investigador no esta aprovechando por

completo los datos Se pierde informacioacuten al convertir datos recopilados (de una

escala de intervalo o de razoacuten) a rangos (escala ordinal) o categoriacuteas (escala

nominal) En particular en esas circunstancias algunas pruebas no parametricas

muy raacutepidas y sencillas tienen mucha menos potencia que los procedimientos

claacutesicos y por lo general se deben evitar

2 seguacuten aumenta el tamantildeo de la muestra en ocasiones el manejo

requerido de datos para los procedimientos no parametricos se hace laborioso a

menos que se disponga de un paquete de computacioacuten adecuado

3 con frecuencia se necesitan tablas especiales de valores

criacuteticos y estas no se obtienen con tanta facilidad como las tablas de los

valores criacuteticos normales t 2X y F Ccedil

Prueba de signos para una sola muestra

Salvo para las pruebas con muestra grande todas las pruebas estaacutendar

concernientes a medias estaacuten basadas en la suposicioacuten de que las poblaciones que

se muestrean tienen aproximadamente la forma de distribuciones normales

Cuando en un caso determinado esta suposicioacuten resulta insostenible la prueba

estaacutendar se puede sustituir por una de varias alternativas no parametricas entre

ellas la ldquoprueba de signosrdquo

La prueba de signos de una sola muestra se aplica cuando se muestrea una

poblacioacuten simeacutetrica continua de manera que la probabilidad de que un valor de la

muestra sea menor que la media o mayor que la media es en ambos casos frac12 Para

probar la hipoacutetesis nula ( O ) contra una hipoacutetesis alternativa apropiada con

base en una muestra aleatoria de tamantildeo n se sustituye cada valor de la muestra

mayor que O por un signo de mas y cada valor de la muestra menor que O por

un signo de menos despueacutes se aprueba la hipoacutetesis nula de que estos signos de

mas y menos son valores de una variable aleatoria que tiene distribucioacuten binomial

con 2

1p (si un valor de la muestra es igual a O simplemente lo rechazamos)

Prueba de suma de rangos

Se puede utilizar cuando se desea probar una hipoacutetesis relacionada a un

paraacutemetro que refleje una tendencia central Cuando no se cumplen las premisas

de la prueba t el procedimiento de Wilcoxon es probable que sea mas potente

para detectar la existencia de diferencias importantes que su contraparte

correspondiente

Para llevar a cabo la prueba de rangos y signos de Wilcoxon se puede

aplicar el siguiente procedimiento de seis pasos

1 para cada partiacutecula en una muestra de n partidas se obtiene un

resultado de diferencia Di

2 despueacutes no se toman en cuenta los signos + y ndash y se obtiene un

grupo de n diferencias absolutas iD

3 se omite de cualquier anaacutelisis adicional cualquier diferencia

absoluta con resultados de 0 con lo cual se obtiene un grupo de n resultados de

diferencias absolutas que no sean cero donde n

4 despueacutes se asignan rangos Ri desde uno hasta n a cada una de las

iD de modo que el resultado de diferencia absoluta mas pequentildeo obtiene una

clasificacioacuten de uno y el mayor de n Por la falta de precisioacuten en el proceso de

medicioacuten si dos o mas iD son iguales a cada una se asigna el ldquorango promediordquo

de los rangos que de lo contrario se les hubieran asignado individualmente si no

hubiera ocurrido la igualdad de los datos

5 ahora se asignan de nuevo el siacutembolo + o el signo ndash a cada uno de

los n rangos de Ri dependiendo de si originalmente Di era positiva o negativa

6 la prueba estadiacutestica de Wilcoxon W se obtiene como la suma de

las clasificaciones +

n

i

iRW1

Para muestras de n 20 se puede utilizar tablas para obtener los valores

criacuteticos de la prueba estadiacutestica W tanto para las pruebas de una cola como de dos

a diversos niveles de significacioacuten Se rechaza la hipoacutetesis nula en una prueba de

dos colas si el valor observado W es igual o excede al valor critico superior o es

igual o inferior al valor critico inferior Se rechaza la hipoacutetesis nula en una prueba

de una cola en direccioacuten positiva si el valor observado W es igual o excede el

valor critico superior Se rechaza la hipoacutetesis nula para una prueba de una cola en

direccioacuten negativa si el valor observado de w es inferior o igual al valor critico

inferior

Para nge20 la prueba estadiacutestica W tiene distribucioacuten aproximadamente

normal y se puede utilizar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis nula

W

WWZ

VARIABLES ALEATORIA Y COMO SE DIVIDEN

Una variable es aleatoria si toma diferentes valores como resultado de un

experimento aleatorio Puede ser discreta o continua Si puede tomar soacutelo un

nuacutemero limitado de valores entonces es una variable aleatoria discreta En el otro

extremo si puede tomar cualquier valor dentro de un intervalo dado entonces se

trata de una variable aleatoria continua

Se puede pensar en una variable aleatoria como un valor o una magnitud

que cambia de una presentacioacuten a otra sin seguir una secuencia predecible Los

valores de una variable aleatoria son los valores numeacutericos correspondientes a

cada posible resultado de un experimento aleatorio

La distribucioacuten de probabilidad de una variable aleatoria proporciona una

probabilidad para cada valor posible y estas probabilidades deben sumar 1

VALOR ESPERADO DE UNA VARIABLE ALEATORIA

El valor esperado es una idea fundamental en el estudio de las distribuciones de

probabilidad

Para obtener el valor esperado de una variable aleatoria discreta se

multiplica cada valor que la variable puede tomar por la probabilidad de

presentacioacuten de ese valor y luego se suman esos productos Es un promedio

pesado de los resultados que se esperan en el futuro El valor esperado pesa cada

resultado posible con respecto a la frecuencia con que se espera se que presente

En consecuencia las presentaciones maacutes comunes tienen asignadas un peso

mayor que las menos comunes

El valor esperado tambieacuten puede ser obtenido a partir de estimaciones

subjetivas En ese caso el valor esperado no es maacutes que la representacioacuten de las

convicciones personales acerca del resultado posible

VARIABLES ALEATORIAS DISCRETAS

Variable que toma un nuacutemero finito o infinito de valores numerables

Sean x1 x2 x3 xn los distintos valores que puede tomar la variable

aleatoria

Y p(x1) p(x2) p(xn) su probabilidad

Los pares de valores (xj p(xj)) constituyen la distribucioacuten de probabilidades de la

variable aleatoria

p(x) se denomina funcioacuten de probabilidad y debe cumplir con las siguientes

propiedades

0 lt p(xj) lt 1 (p(x) es una probabilidad y por lo tanto debe tomar valores

entre 0 y 1)

1)( jxP (la suma de probabilidades repartidas entre todos los valores

de la variable debe ser igual a 1)

De la misma manera que calculamos frecuencias acumuladas podemos acumular

probabilidades obteniendo la funcioacuten de distribucioacuten de probabilidades

Esta funcioacuten representa la probabilidad de que la variable aleatoria sea menor o

igual que un determinado valor

F(xj) = P (X lt xj)

Graacuteficamente la funcioacuten aumenta de a saltos ya que entre dos valores

consecutivos de una variable discreta no puede tomar valores intermedios

VARIABLES ALEATORIAS CONTINUAS

En este caso en lugar de trabajar con la probabilidad de valores

particulares de la variable resulta maacutes apropiado calcular probabilidades

asociadas a intervalos Para distribuir propiedades se usa una funcioacuten que mide

concentracioacuten de probabilidades alrededor de un punto que se denomina

funcioacuten de densidad de probabilidad (fdp) y se denota como f(x)

Una funcioacuten de densidad de probabilidad debe cumplir con las siguientes

propiedades

F(x) gt 0 (la funcioacuten es no negativa para cualquier valor de x f(x) no es

una probabilidad y puede valer maacutes de 1)

el aacuterea bajo la curva de la funcioacuten vale 1)

La funcioacuten de distribucioacuten para una variable aleatoria continua se calcula

F(a) = P(X lt

La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula

P (alt x lt b) = F(b) - F(a)

La probabilidad de que la variable tome un valor particular se puede expresar

como

F(c) - F(c) = 0

DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO

Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia

valores de una variable aleatoria con sus respectivas probabilidades es

decir Probabilidad de x = Funcioacuten de x

Las distribuciones se caracterizan por una foacutermula que determina el tipo de

distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio

muestral

En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una

funcioacuten de la probabilidad que representa los resultados que se van obteniendo en

un experimento aleatorio

Asiacute para un nuacutemero dado x la probabilidad es

A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la

variable X y representa la probabilidad de que la variable tome el valor desde

hasta x

Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de

probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad

Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos

y seraacuten mutuamente excluyentes y su suma es el

suceso por lo que tenemos entonces que

y finalmente

Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos

los valores de la variable aleatoria x conoceremos completamente la distribucioacuten

de probabilidad de la variable

Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten

de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente

Es decir la probabilidad de todo el espacio muestral es 1 tal y como

establece la teoriacutea de la probabilidad y por otra parte

Es decir la probabilidad del suceso nulo es cero

Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de

probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes

praacutectico el uso de la funcioacuten de densidad

En el caso de una variable discreta la distribucioacuten puede describirse

mediante una funcioacuten de probabilidad que para cada valor de x de la variable X

determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de

una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de

distribucioacuten la que para cada valor provee la probabilidad de no ser superado

evidentemente el valor de la funcioacuten de distribucioacuten es igual

a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo

inferior del dominio de la variable hasta x inclusive Lista de los resultados de un

experimento con las probabilidades que se esperariacutean ver asociadas con cada

resultado

Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores

diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12

En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica

Para el caso de 1 solo dado donde todos los valores tienen la misma

probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme

Prueba de aleatoriedad

Con frecuencia se supone que los datos recopilados constituyen una

muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la

utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash

Wolfowitz de corridas de una muestra para aleatoriedadrdquo

Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o

la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos

siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la

partida tiene una propiedad en particular o de la cantidad o magnitud en que se

posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la

sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con

distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente

de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que

la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las

partidas que la preceden o las que la suceden en forma tal que la probabilidad de

su ocurrencia varia de una posicioacuten a otra el proceso no se considera como

aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando

esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en

forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico

Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el

tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico

de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una

prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede

rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la

sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de

una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2

exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por

consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis de aleatoriedad

U

UUZ

donde

U = numero total de corridas

U = valor medio de U 12 21

n

nnU

U = desviacioacuten estaacutendar de U 1

222

2121

nn

nnnnnU

n1 = numero de eacutexitos en la muestra

n2 = numero de fracasos en la muestra

n = tamantildeo de la muestra n = n1 + n2

PRUEBA DE McNEMAR

Suele darse el caso en que se desean comparar las proporciones de los

datos de muestras tomados de poblaciones relacionadas En este caso se quisiera

determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a

alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea

determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y

otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede

utilizar la prueba desarrollada por McNemar

El principal intereacutes es determinar si hay diferencia entre las dos

proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta

que el otro (prueba de una cola)

La prueba estadiacutestica para la prueba de McNemar es

CB

CBZ

PRUEBA U DE MANN ndash WHITNEY

Es una alternativa no parametrica a la prueba t de dos muestras para la

diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula

μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos

la forma de distribuciones normales de hecho la prueba solo requiere que las

poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no

importa si se cumple o no esta suposicioacuten

Estadiacutesticos U1 y U2

111

2112

1 W

nnnnU

222

2122

1 W

nnnnU

PRUEBA DE RACHAS

Son todas las diferencias que tiene el mismo signo y se presentan en una

misma fila Una serie de n diferencias puede tener solamente una racha (toda

positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las

rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de

poblaciones con la misma distribucioacuten de frecuencias Colocamos las

observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces

contamos el numero de rachas item de cada una de las muestras Si hay menos

rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales

rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten

La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de

que las observaciones se han sacado aleatoriamente de una sola poblacioacuten

Para hacer esto se halla la mediana de la muestra y se designa las

observaciones situadas por debajo de la mediana por un signo menos (-) y las

observaciones situadas por encima de la mediana por un signo (+) Si el numero

de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado

rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el

numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10

puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la

tabla normal con

u

uu

z

2

1

12

21

21

NN

NNu

)1()(

2(2

21

2

21

2121212

NNNN

NNNNNNu

DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES

DISTRIBUCIONES DE EJEMPLO Y USO

DISTRIBUCIOacuteN NORMAL O GAUSSIANA

Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que

multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal

Esta distribucioacuten de caracteriza porque los valores se distribuyen formando

una campana de Gauss en torno a un valor central que coincide con el valor

medio de la distribucioacuten

Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a

la izquierda

Esta distribucioacuten viene definida por dos paraacutemetros

X N (m S2)

m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro

de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores

estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores

estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de

ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten

estaacutendar

Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina

normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo

que permiten obtener esos mismos valores donde se recoge la probabilidad

acumulada para cada punto de la curva de esta distribucioacuten

Ademaacutes toda distribucioacuten normal se puede transformar en una normal

tipificada

Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con

media 10 y varianza 4 Transformarla en una normal tipificada

X N (10 4)

Para transformarla en una normal tipificada se crea una nueva variable (Y)

que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica

(que es la raiacutez cuadrada de la varianza)

En el ejemplo la nueva variable seriacutea

Esta nueva variable se distribuye como una normal tipificada

permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor

Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos

indicado de que las probabilidades para cada valor de la curva se encuentran

recogidas en una tabla

MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)

La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten

normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta

distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros

y lo que representamos del modo si su funcioacuten de densidad

es

Observacioacuten

Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y

la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes

adelante65

La forma de la funcioacuten de densidad es la llamada campana de Gauss

Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten

normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1

Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un

uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto

con lo cual en coinciden la media la mediana

y la moda y por uacuteltimo calcular sus puntos de inflexioacuten

El soporte de la distribucioacuten es todo de modo que la mayor parte de la

masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se

encuentra concentrado alrededor de la media y las ramas de la curva se extienden

asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la

media es posible (aunque poco probable)

La forma de la campana de Gauss depende de los paraacutemetros y

indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)

Figura Distribuciones gaussianas con diferentes medias e igual

dispersioacuten

(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor

sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor

de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea

``maacutes aplastado seraacute

Figura Distribuciones gaussianas con igual media pero varianza

diferente

La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes

adelante que es

Como consecuencia la distribucioacuten normal es reproductiva con respecto a

los paraacutemetros y ya que

Observacioacuten

Como se ha mencionado anteriormente la ley de probabilidad gaussiana la

encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza

por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el

de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que

apuntar un hecho negativo para esta ley de probabilidad

La funcioacuten no posee primitiva66

conocida67

Las consecuencias desde el punto de vista praacutectico son importantes ya que

eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de

la normal y nos tenemos que limitar a decir que

sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente

esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho

puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto

se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en

problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde

se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie

limitada de valores xi dados Normalmente F se encuentra tabulada para una

distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten

normal tipificada

En el caso de que tengamos una distribucioacuten diferente se

obtiene Z haciendo el siguiente cambio

De manera general se tiene

Proposicioacuten (Cambio de origen y escala)

Sean Entonces

Este resultado puede ser utilizado del siguiente modo Si y nos

interesa calcular

1 Hacemos el cambio y calculamos

2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de

modo aproximado) Como

tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada

Ejemplo

Supongamos que cierto fenoacutemeno pueda ser representado mediante una

va y queremos calcular la probabilidad de que Xtome un valor

entre 39 y 48 es decir

Comenzamos haciendo el cambio de variable

de modo que

Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que

hemos mencionado anteriormente

Proposicioacuten

Sea Entonces

Demostracioacuten

Por ser la normal una ley de probabilidad se tiene que

es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con

respecto a se obtiene el valor 0

luego

Para demostrar la igualdad entre la y basta con aplicar la misma

teacutecnica pero esta vez derivando con respecto a

Luego

Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en

primer lugar la va tipificada de X

y calculamos

Como por la proposicioacuten 5 deducimos que

CURVA NORMAL ESTANDARIZADA

Una variable numeacuterica puede clasificarse como discreta o continua Las

variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas

con la idea de contar Las variables continuas se pueden asociar con la idea de

medir utilizando fracciones y decimales Cuando la variable es continua el

modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal

El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten

normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran

cantidad de variables continuas

El modelo matemaacutetico

La funcioacuten matemaacutetica que se usa como modelo es

e = 271

π = 314

μx = media de la poblacioacuten

σx = desviacioacuten estaacutendar de la poblacioacuten

x = un valor de la variable continua

Como e y π son constantes la forma de la curva normal depende

solamente de los dos parametros de la distribucioacuten normal la media μx y la

desviacioacuten estaacutendar σx

Las diferentes curvas normales van a variar dependiendo de esos dos

paraacutemetros

En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar

visualmente como una curva en forma de campana El aacuterea debajo de esta curva se

halla por medio del integral de la funcioacuten y corresponde al por ciento o la

proporcioacuten de puntuaciones que se encuentran en el intervalo dado

Propiedades de las distribuciones normales

a Son simeacutetricas y tienen forma de campana

b Al ser simeacutetricas la media la moda y la mediana coinciden

c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea

de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media

d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la

curva se encuentra a tres desviaciones estaacutendar de la media

En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral

de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de

diferentes secciones de la curva o se utiliza la computadora para calcular ese valor

del aacuterea

La distribucioacuten normal estandarizada

Puesto que hay un nuacutemero infinito de combinaciones para los dos

paraacutemetros hay un nuacutemero infinito de curvas normales diferentes

Este problema se ha resuelto praacutecticamente al transformar los valores de

todas las distribuciones normales a los valores de una distribucioacuten normal

estandarizada representada por la curva normal estandarizada (standard normal

curve)

Las puntuaciones estandarizadas se logran restando la media a cada

observacioacuten y dividiendo entre la desviacioacuten estaacutendar

donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar

Propiedades de la distribucioacuten normal estandarizada

μ z = 0

σ z = 1

En muchas ocasiones se quieren comparar puntuaciones que pertenecen a

dos distribuciones normales diferentes La diferencia entre las dos distribuciones

radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo

la comparacioacuten se hace posible si se convierten las puntuaciones de ambas

distribuciones a puntuaciones z que corresponden a la distribucioacuten normal

estandarizada

Percentiles y rangos percentiles de una distribucioacuten normal estandarizada

Si se desea hallar la percentiles o el rango percentil en una distribucioacuten

normal no estandarizada se recurre al procedimiento de convertir las puntuaciones

de la distribucioacuten normal dada a puntuaciones z que corresponden a la

distribucioacuten normal estandarizada

Estos valores en la distribucioacuten normal estandarizada se pueden obtener

por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en

las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el

intervalo dado

Es necesario visualizar siempre el aacuterea debajo de la curva como el por

ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo

dado

Cuando una distribucioacuten de puntuaciones es normal estandarizada la

pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar

en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o

cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten

dada

DISTRIBUCIOacuteN GAMMA

Una variable aleatoria X asociada a un experimento aleatorio tiene una

distribucioacuten GAMMA si se caracteriza por las siguientes propiedades

Algunas alternativas de funciones de densidad se pueden ver en la graacutefica

del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)

respectivamente =1

=1

La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo

III

El modelo Gamma se ha utilizado frecuentemente en variables tales como

ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el

intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson

ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900

ndash Flujos maacuteximos MARKOVIC 1965

ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965

ndash Altura de la precipitacioacuten mensual WHITCOMB 1940

ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia

infin

ndash Ingresos familiares

ndash Edad del hombre al contraer matrimonio por primera vez

ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en

subestaciones a una frecuencia part

Ejemplo

Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos

de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia

promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo

de tiempo se encuentre hasta que ocurre el segundo ciclo

a Dentro de una desviacioacuten con respecto del tiempo promedio

b A maacutes de dos desviaciones por encima de la media

Solucioacuten

X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en

horas

Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)

= 2

Y Nuacutemero de ciclos hora ---------Y~P( =002)

E(Y) = 002 =

X ~ G(2 002)

Ejemplo

En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de

kilovatios por hora puede considerarse como una variable aleatoria con

distribucioacuten GAMMA de paraacutemetros = 3 y

= 05

La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de

KWhora

iquestCuaacutel es la probabilidad de que este abastecimientos sea

a Insuficiente en un diacutea cualquiera

b Se consuman entre 3 y 8 millones de K WHora

c c Encuentre E(x) y V(x)

SOLUCIOacuteN

DISTRIBUCIOacuteN PARETO

En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad

continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores

es

Su funcioacuten de distribucioacuten es

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto

son

El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (

DISTRIBUCIOacuteN T DE STUDENT

Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una

distribucioacuten t con n grados de libertad

Cuando n--gtinfinito a curva t coincide com la normal estandarizada

FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX

MOMENTOS

La distribucioacuten -Student se construye como un cociente entre una normal

y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-

Student con n grados de libertad a la de una va T

donde Este tipo de distribuciones aparece cuando

tenemos n+1 va independientes

y nos interesa la distribucioacuten de

La funcioacuten de densidad de es

Figura Funcioacuten de densidad de una de Student

La distribucioacuten de Student tiene propiedades parecidas a

Es de media cero y simeacutetrica con respecto a la misma

Es algo maacutes dispersa que la normal pero la varianza decrece hasta

1 cuando el nuacutemero de grados de libertad aumenta

Figura Comparacioacuten entre las funciones de densidad de y

Para un nuacutemero alto de grados de libertad se puede aproximar la

distribucioacuten de Student por la normal es decir

Figura Cuando aumentan los grados de libertad la distribucioacuten de

Student se aproxima a la distribucioacuten normal tipificada

Para calcular

DISTRIBUCIOacuteN BETA

Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede

representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un

intervalo de longitud finita Tales como

Proporcioacuten de impurezas en un producto quiacutemico

La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten

La proporcioacuten vendida de un lote durante un tiempo t

La humedad relativa medida en cierto lugar

Porcentaje del costo total destinado a reparacioacuten de maquinaria

Porcentaje de costo adicional destinado a reparacioacuten de maquinaria

La distribucioacuten del tiempo necesario para completar una fase del proyecto

PERT

Evaluacioacuten de programas y teacutecnicas de revisioacuten

Ejemplo

La proporcioacuten de tramos de una autopista que requieren repararse

semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros

= 3 y =2

a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten

b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista

requieren reparacioacuten en un antildeo cualquiera

DISTRIBUCIOacuteN CAUCHY

En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de

Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es

donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene

valor esperado ni varianza

Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V

2 lt 1 el

numero U V tiene la distribucioacuten Cauchy

La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un

grado de libertad

Ejemplo

Sean y dos observaciones independientes de una distribucioacuten

Cauchy con funcioacuten de densidad

Puede demostrarse que si y son tales que entonces la

funcioacuten de verosimilitud de es bimodal

Sean y Supongamos que se desea hacer inferencias sobre el

valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa

Especiacuteficamente interesa encontrar la distribucioacuten final de

Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la

distribucioacuten final de tiene una forma complicada Es conveniente notar sin

embargo que corresponde a la densidad marginal de respecto a la

densidad conjunta

DISTRIBUCIOacuteN BERNOULLI

Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto

suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el

que no lo sea (fracaso) En realidad no se trata maacutes que de una variable

dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello

que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas

obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la

situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este

experimento mediante una va discreta Xque toma los valores X=0 si el suceso no

ocurre y X=1 en caso contrario y que se denota

Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar

una moneda al aire y considerar la va

Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de

probabilidad es

y su funcioacuten de distribucioacuten

Su funcioacuten caracteriacutestica es

Los principales momentos de la X los podemos calcular directamente

o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina

Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)

cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de

intentos

CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE

BERNOULLI

Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la

probabilidad y asegurar que se cumplen las tres condiciones necesarias en

particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del

resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3

requiere que los ensayos o intentos de un proceso de Bernoulli sean

estadiacutesticamente independientes es decir que el resultado de un intento no puede

afectar de ninguacuten modo el resultado de cualquier otro intento

DISTRIBUCIOacuteN EXPONENCIAL

Modelo para variable aleatoria continua que permite representar variables

del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos

Componentes

En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de

probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para

valores x gt 0 es

f(x) = λe - λx

Su funcioacuten de distribucioacuten es

Aqui e significa el nuacutemero e

El valor esperado y la varianza de una variable aleatoria X con

distribucioacuten exponencial son

E[X] = 1 λ

V(X) = 1 λ2

Ejemplo

Ejemplos para la distribucioacuten exponencial son los tiempos dentro

accidentes con probabilidad invariable

La funcioacuten de densidad para λ igual 05 10 y 15

DISTRIBUCIOacuteN MULTINOMIAL

La distribucioacuten multinomial es similar a la distribucioacuten binomial con la

diferencia de que en lugar de dos posibles resultados en cada ensayo

La distribucioacuten multinomial sigue el siguiente modelo

Donde

X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo

que el partido POPO lo hayan votado 3 personas)

n indica el nuacutemero de veces que se ha repetido el suceso (en el

ejemplo 5 veces)

n es factorial de n (en el ejemplo 5 4 3 2 1)

p1 es la probabilidad del suceso X1 (en el ejemplo el 40)

Veamos el ejemplo

Luego

P = 00256

Es decir que la probabilidad de que las 5 personas elegidas hayan votado

de esta manera es tan soacutelo del 256

Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1

Veamos otro ejemplo

En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el

40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4

invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos

Aplicamos el modelo

LuegoP = 00384

Por lo tanto la probabilidad de que el grupo esteacute formado por personas de

estos paiacuteses es tan soacutelo del 384

DISTRIBUCIOacuteN UNIFORME

En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de

probabilidad cuyos valores tienen la misma probabilidad

Caso discreto

Su funcioacuten de probabilidad es en el caso discreto con valores posibles

p(xi) = 1 n

Su funcioacuten de distribucioacuten es en el caso discreto

Su media estadiacutestica es

Caso continuo

Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b

La funcioacuten de densidad en el caso continuo entre a y b es

Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12

Ejemplos

Para un dado perfecto todos los resultados tienen la misma probabilidad 1

6

Calcular variables aleatorias

Las variables aleatorias de probabilidad uniforme pueden calcularse con un

generador de variables aleatorias

DISTRIBUCIOacuteN BINOMIAL

En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad

discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con

probabilidad p de un eacutexito

Su funcioacuten de densidad es

Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)

posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos

((1 - p)n - x

)

El valor esperado de una variable aleatoria de probabilidad binominal es

E[x] = np y su varianza V[x] = np(1 - p)

DISTRIBUCIOacuteN BINOMIAL NEGATIVA

Sobre una sucesioacuten de va de Bernouilli independientes

Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r

eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de

distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo

Su ley de probabilidad se deduce siguiendo el esquema

De nuevo el conjunto de posibles valores de esta va discreta es

Su funcioacuten caracteriacutestica es

y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima

Ejemplo

Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en

operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal

que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda

definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para

intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus

5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones

que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se

necesiten 10 intervenciones

Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por

una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan

4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso

Identificando los paraacutemetros se tiene

Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el

nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy

simple

Y=X+r

Luego

Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente

es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de

que X=10-4=6 Por tanto

La distribucioacuten binomial negativa tambieacuten se puede definir como el

nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas

contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que

DISTRIBUCIOacuteN DE POISSON

Modelo para variable aleatoria discreta que permite calcular la

probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten

discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo

muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos

o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual

a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es

independiente de cuaacutendo se presenta dicho periacuteodo

En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de

probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos

es

Aquiacute e significa el nuacutemero e y x significa el factorial de x

La distribucion de Poisson describe el nuacutemero de sucesos en una unidad

de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un

proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens

en una carrera

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten

Poisson son

E[X] = V[X] = λ

La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos

entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un

conmutador la demanda (necesidades) de los pacientes que requieren servicio en

una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el

nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos

ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una

variable aleatoria discreta que toma valores enteros (0 1 2)

Caacutelculo de la probabilidad de Poisson

La letra X por lo general representa a una variable discreta y puede tomar

valores enteros Utilizamos la letra X para representar a la variable aleatoria y la

letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La

probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson

se calcula con la foacutermula

LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA

DISTRIBUCIOacuteN BINOMIAL

La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la

binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan

cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es

grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan

con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena

aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es

igual o menor que 005 En los casos en que se cumplen estas condiciones

podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media

de la distribucioacuten de Poisson

DISTRIBUCIOacuteN GEOMEacuteTRICA

En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten

probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores

discretos es

P(X = x) = p(1 - p)x - 1

Su funcioacuten de distribucioacuten es

El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media

estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2

Ejemplo

El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es

una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6

DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA

En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de

probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de

masa para valores es

Aqui (a sobre b) es el coeficiente binomial

El valor esperado de una variable aleatoria X de distribucioacuten

hipergeomeacutetrica es

Y su varianza

DISTRIBUCIOacuteN ZETA

En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad

discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos

es

Aqui ζ(s) es la funcioacuten zeta de Rieman con

El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto

DISTRIBUCION CHI CUADRADO

El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una

comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es

diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con

ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno

es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario

estas dos frecuencias acusan una diferencia significativa para por ejemplo un

nivel de significacioacuten del 5

El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la

asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada

por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito

bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor

del famoso libro Statistical Methods for Research Workers (1925) donde se

marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con

Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde

estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y

el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las

pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba

exacta de Fisher

Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico

publicitario presentado a grupos de clientes comparar la rentabilidad de un

proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos

de los turistas por determinados espacios geograacuteficos o por determinados

servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las

frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las

frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o

tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o

de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2

x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos

turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han

ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han

tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula

que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido

en los sitios A y B

Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es

independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo

A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces

alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este

anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos

empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de

las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51

La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten

igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es

2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del

Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del

5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206

podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para

suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B

Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias

observadas empiacutericamente de dos muestras con las frecuencias esperadas o

teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el

Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de

las materias primas perecederas Los resultados son seguacuten atributos cualitativos

los siguientes Primero veremos las frecuencias empiacutericas u observadas

Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten

Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son

131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas

Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y

fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres

columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta

maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x

120 260 = 6046 b2 = 129 x 120 260 = 5954

Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten

igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de

2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de

libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La

diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna

conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten

Es una medida de la discrepancia existente entre las frecuencias

observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso

de frecuencias () debido a que permite determinar las desviaciones entre ellas

ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la

expresioacuten

E

EOX

2

2

Donde

O frecuencia observada

E frecuencia teoacuterica esperada

TEST DE CHI-CUADRADO DE CONTINGENCIA

Un caso particular del test de chi-cuadrado que permite hacer un test sobre

la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-

cuadrado de contingencia Los dos caracteres observados en una misma

poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases

de se denotan las de por Tambieacuten vamos a

denotar

el efectivo conjunto de y es el nuacutemero de individuos para los

cuales toma el valor e el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

Estos valores se representan en una tabla de doble entrada conocida como

tabla de contingencia

Cada fila y cada columna corresponden a una submuestra particular La

fila de iacutendice es la distribucioacuten en las clases de los individuos para

los cuales el caraacutecter toma el valor La columna de iacutendice es la

distribucioacuten en las clases de los individuos para los cuales el caraacutecter

toma el valor Dividiendo las filas y las columnas por su suma se obtienen

frecuencias condicionales para cada una de las distribuciones empiacutericas Para

y las denotaremos por

y

Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y

los perfiles columna Para el modelo probabilista las observaciones provienen de

una muestra

de una ley bidimensional La hipoacutetesis a comprobar

es que los dos marginales de esta ley son independientes Si este es el caso los

perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna

de la de

y

Es equivalente a decir que las frecuencias conjuntas deben estar cerca de

los productos de las frecuencias marginales

Las frecuencias conjuntas por un lado (distribucioacuten observada) y los

productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen

dos distribuciones de probabilidad sobre el conjunto producto

Podemos por tanto calcular la distancia de

chi-cuadrado de una con respecto a la otra

Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la

distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale

Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la

definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado

Por lo dicho anteriormente para suficientemente grande podemos

aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el

nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados

a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las

que han sido estimadas Hay para el caraacutecter y para el caraacutecter

(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley

chi-cuadrado seraacute por tanto

Vamos a presentar un ejemplo de dos caracteres binarios que tienen que

ver con enfermos para los cuales se ha observado si tienen o no una tendencia al

suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y

neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las

tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla

de contingencia observada es

Tendencia Sin tendencia Total

Psicosis 20 180 200

Nneurosis 60 140 200

Total 80 320 400

La distancia de chi-cuadrado de contingencia calculada a partir de esta

tabla es de El valor tomado por el estadiacutegrafo es el cual

debemos comparar con la ley El p-valor es de

Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre

la tendencia al suicidio y la clasificacioacuten de las enfermedades

El test no precisa el sentido de esta dependencia Para describirla hay que

comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre

los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten

PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS

Los investigadores se interesan constantemente en las diferencias entre dos

poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado

civil profesioacuten color de ojos preferencia por una marca etc)

Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de

contingenciardquo

Se puede realizar una prueba para la diferencia entre dos proporciones

sobre la base de muestras independientes usaacutendose como instrumento la prueba

de chi cuadrado

El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es

la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se

podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda

Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la

ecuacioacuten

n

nnE CR

donde

nR nuacutemero total en el rengloacuten

nC nuacutemero total en la columna

n tamantildeo total de la muestra

El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado

entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia

al cuadrado se divide entre la frecuencia esperada de la celda

La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se

rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el

valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados

de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el

tamantildeo de la muestra

CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD

Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a

las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se

puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la

distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado

siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal

Por consiguiente al probar la diferencia entre las dos proporciones la

distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes

Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia

direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten

normal

La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede

ilustrar mediante el siguiente ejemplo

Cuartos de bantildeos modernos

Cocina moderna Caren

cia

existenc

ia

totales

Carencia 72 8 80

Existencia 7 146 153

La hipoacutetesis nula y alternativa seriacutean

YN ppH 0

YN ppH 0

Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de

significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute

Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H

A partir de la informacioacuten del cuadro

10080

8

N

NSN

n

Xp 95420

153

146

Y

YSY

n

Xp

A partir de la expresioacuten

21

21

111

nnpp

pPZ SS

donde

661015380

1468

p

por lo tanto

0813

153

1

80

133906610

95420100

Z

Totales 79 154 223

Dado que 1960813 Z se rechaza la 0H por lo tanto hay

diferencia entre las dos proporciones

Usando la prueba de chi cuadrado y la tabla de contingencia de este

ejemplo se tiene

Las frecuencias teoacutericas se pueden obtener a partir de la siguiente

ecuacioacuten

n

nnE CR

Por lo tanto se tiene

1227233

7980E 8852

233

15480E

8851233

79153E 12101

233

154153E

Chi cuadrado se obtiene a partir de la expresioacuten

E

EOX

2

2

A partir de la tabla se tiene

O E (O ndash E) (O ndash E)2

(O ndash E)2E

7

2

2

712

+4488 20142144 742704

7 5

188

- 4488 20142144 388245

8 5 -4488 20142144 380903

288

1

46

1

0112

+4488 20142144 199191

1711043

10431712 CALCULADOX

Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el

84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo

tanto hay diferencia entre las dos proporciones

Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la

distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos

distribuciones que a un nivel de significancia de 005 el valor de 196 es el

cuadrado de 3 841 es decir 22 ZX

CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA

La afirmacioacuten de que no existen diferencias entre proporciones significa

que las dos variables son independientes Cuando las conclusiones se presentan en

esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo

Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que

no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la

hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos

variables Independientemente de que la prueba de chi cuadrado se considera una

prueba de diferencia entre dos proporciones o una prueba de independencia los

caacutelculos y resultados son exactamente los mismos

CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE

Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o

intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que

ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de

probabilidades

Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que

seguir varios pasos Primero se tiene que establecer la distribucioacuten de

probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada

paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la

media) se deben establecer mediante hipoacutetesis o estimarlos con base a la

informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para

determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o

intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado

para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la

informacioacuten

BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON

La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de

Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la

cantidad de automoacuteviles estacionados en una cochera cubierta siguen una

distribucioacuten de Poisson 0H

En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero

de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una

muestra aleatoria de 233 casas

Numero de automoacuteviles Frecuencia

0 61

1 151

2 21

233

Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados

de la distribucioacuten de frecuencia

No de automoacuteviles Frecuencia observada On

0 61 0

1 151 151

2 21 42

233 193

808280233

193

1

n

On

X

n

i por lo tanto 80X

El valor de la media muestral se utilizara como el estimado de X

Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)

y se obtiene la frecuencia teoacuterica para cada una

Automoacutevil

n

Frecuencia

O

Probabilidad

XP

Frecuencia (E)

XPn

0 61 04493 104687

1 151 03595 87764

2 21 01438 33505

Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de

significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX

El valor calculado de chi cuadrado es

50679

2

2

K

CALCULADO

E

EOX

Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de

automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una

distribucioacuten de Poisson

CORRECCIOacuteN DE YATES

Cuando se aplican a datos discretos los resultados para distribuciones

continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres

comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de

Yates la cual viene dada mediante la expresioacuten

E

EOX CALCULADO

502

2

En general la correccioacuten se hace solamente cuando el numero de grados

de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos

resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en

relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia

esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi

cuadrado corregido y no corregido Si ambos valores conducen a la misma

conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se

presentan dificultades Si conducen a conclusiones diferentes se puede o bien

incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear

meacutetodos de probabilidad exactos

El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente

ejemplo

En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces

Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de

significancia del 005

No de caras Frecuencia Probabilidad Frecuencia (E)

Cara 115 05 100

cruce 85 05 100

2054

100

0510085

100

0510011522

2

CALCULADOX

Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado

con correccioacuten de Yates es

8432 TABULADOX

Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha

PRUEBA EXACTA DE FISHER

Para examinar la igualdad de las varianzas de dos poblaciones

independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de

las varianzas de las dos muestras Suponiendo que la informacioacuten de cada

poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2

2

2

1 SS sigue una

distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso

estadiacutestico RA Fisher

Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de

grados de libertad los grados de libertad en el numerador y en el denominador

la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea

2

2

2

111 21

S

SF nn

donde

n1 = tamantildeo de muestra en el grupo 1

n2 = tamantildeo de muestra en el grupo 2

n1 ndash 1 = grados de libertad en el grupo 1

n2 ndash 1 = grados de libertad en el grupo 2

2

1S varianza de la muestra en el grupo 1

2

2S varianza de la muestra en el grupo 2

Al probar la igualdad de dos varianzas se pueden emplear pruebas de una

cola o de dos colas

El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente

ejemplo

Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas

alta en la planta A que en la planta B Para determinar la variabilidad se puede

establecer una prueba de una cola en la forma siguiente

22 BAOH

22

1 BAH

Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta

A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta

ubicada en la cola superior de la distribucioacuten

Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de

libertad en el numerador y 19 en el denominador a un nivel de significancia de

001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene

71162 AS y 20142 BS por lo tanto

38512014

71162

2

1924 F como 1385 lt

292 no se rechaza la hipoacutetesis nula ( OH )

CONCLUSIOacuteN

La conclusioacuten que los resultados de una medida variable es la causa de

variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten

estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero

no puede reclamar legitimidad

La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en

describir la distribucioacuten de las variables estudiadas y en particular de los datos

numeacutericos Ademaacutes de las medidas descriptivas correspondientes el

comportamiento de estas variables puede explorarse graacuteficamente de un modo

muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro

organizador de las ciencias computarizadas y el modelo que nos dota de un

mejor razonamiento para implementar programas eficientes En este sentido la

combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un

reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en

colegios y universidades

Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de

combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y

evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras

loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre

operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten

juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la

teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones

simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades

que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea

BIBLIOGRAFIacuteA

AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis

Third Edition Texts in Statistical Science Chapman and Hall

BOXG E P HUNTER W G HUNTER JS (1978) Statistics for

Experimenters John Wiley amp Sons

BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores

Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de

Modelos Ed Revertsbquo SA

Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed

Piraacutemide

Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten

(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica

Matemaacutetica I Universidad de Antioquia

Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma

Madrid

Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill

Meacutexico

Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten

yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico

Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw

ndashHill 4ta Edicioacuten Colombia

CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana

Meacutexico

COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas

COX DR (1958) Planning of experiments New York John Wiley amp Sons

DANIEL C Applications of Statistics to Industrial Experimentation Willey

DAVIES OL The Design and Analysis of Industrial Experiments Hafner

(McMillan)

DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias

Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico

SA de CV Meacutexico

De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H

(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico

Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta

Estadiacutestica Editorial Microsoft corporation USA

ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial

Limusa SA Meacutexico

EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis

Arnold

FEDERER W (1965) Experimental design Oxford Publ Co

GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la

Varianza Grupo Editorial Universitario

FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico

McGraw Hill

FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque

ModernoEditorial SA Meacutexico

George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y

Meacutetodosrdquo Ed McGraw-Hill

GILL JL (1978) Design and Analysis of Experiments in the Animal and

Medical Sciences Iowa State University Press

JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression

and Experimental Design Springer-Verlag

Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor

Caracas

GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining

Institute

GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data

Mining Institute

Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial

Bourgeoacuten Caracas

Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la

EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute

Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial

BourgeoacutenCA Caracas ndash Venezuela

HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis

Multivariante 5ordf Edicioacuten Prentice Hall

JOBSON JD (1992) Applied Multivariate Data Analysis Volume II

Categorical and Multivariate Methods Springer-Verlag

KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial

Hispanoamericana Meacutexico

KIRK RE Experimental Design Procedures for the Behavioral Sciencies

BrooksCole Publishing Company

LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e

inferencia Estadiacutestica Editorial Limusa Meacutexico

LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV

Grupo Noriega Editores Meacutexico

LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial

HARLA Meacutexico

LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta

edicioacuten Editorial McGaw-Hill Usa

Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial

Hispanoameacuterica VI edicioacuten Meacutexico

LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire

Multidimensionnelle 3ordf Edition DUNOD

LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e

Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB

Caracas- Venezuela

LORENZEN T J Anderson V L (1993) Design of experiments A No-Name

Approach Marcel Dekker Inc

Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc

(1999) SPSS 90 Manual de Usuario SPSS Chicago

MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis

Academic Press

Enfocados hacia SPSS

Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de

wwwspssparatodoscom 2005

MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten

Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla

Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea

Ediciones Alfaomega SAN Meacutexico

MASON RL Statistical Design and Analysis of Experiments with Applications

to Engineering and Science John Wiley amp Sons New York

MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y

Economiacutea Editorial Iberoamericana Meacutexico

MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in

agriculture and experimental biology Second edition Chapman amp Hall

MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo

Editorial Iberoameacuterica

MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers

John Wiley amp Sons

Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial

Reverte Mejicana Meacutexico

Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da

Edicioacuten Meacutexico

Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc

Graw Hill

PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones

Editorial Limusa Meacutexico

NETER J et al Applied Linear Statistical Models Regression Analysis of

Variance and Experimental Designs Library of Congress Cataloging Publication

Data

OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp

RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo

Editorial Universitario

PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos

Lineales y Series Temporales Vol 1 y 2 Alianza Editorial

Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores

Spain SA Espantildea 2005

PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial

Mir Moscuacute

RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed

McGraw-Hill

Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca

UCV Caracas ndash Venezuela

RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE

Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en

Psicologiacuteardquo p 1

SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons

Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti

Caracas ndash Venezuela

Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores

deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico

Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica

Editorial Harla Meacutexico

STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y

procedimientos Segunda edicioacuten McGraw Hill

SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas

Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1

Ediciones UNESR Caracas

URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante

Coartiacuteculo Plan Nuevo Editorial AC

VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II

Anaacutelisis Multivariante) Mc-Graw Hill

Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows

Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea

2002

WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros

Editorial Interamericana Meacutexico

Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8

Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage

Learning Editores p 364 ISBN 9706861947

Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea

Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea

Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de

CV Meacutexico

Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para

Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico

DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR

httpesmwikipediaorgwikiSPSS

httpwwwbuenastareascomensayosque-es-el-SPSS1465478html

httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-

del-software-estadistico-integral-spss-base-160

httpesanswersyahoocomquestionindexqid=20070727073908aatuamw

httpwwwslidesharenetleticiagpestructura-de-spss-3126476

httpwwwehowenespanolcomprograma-spss-sobre_48697

httpwwwugres~bioestmedicinamanual_spsspdf

httpwwwmonografiascomtrabajos12tutortutorshtml

httpwwwspsscom

wwwspssparatodoscom

httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html

httpwwwspssfreecomcapitulotreshtml

httpwwwuvesRELIEVEemail relieveuves

httpwwwscribdcomdochellipspss-introduccioacuten

httpeswikipediaorgwikiSPSS

httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd

f

httpwwwspsscomaressuccessargentinashtml

httpeswikipediaorgwikiSPSS

httpwww-01ibmcomsoftwareesanalyticsspss

httppsicofcepurvesspssindex0htm

httpssitesgooglecomsiteestadisticaconelspss

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpe-stadisticabioucmesweb_spssindice_spsshtml

httpwwwquimicaurvesquimiogeneralanovacastpdf

httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da

tosyMultivariable14anova1_SPSSpdf

httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800

20AnE1lisis20de20Varianzaspdf

httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-

pearson

httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf

httpwwwuoceduin3emathdocsRegresionLinealpdf

httpeswikipediaorgwikiRegresiC3B3n_lineal

httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES

ION_LINEAL_CON_SPSSpdf

httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN

EAL20SIMPLE20CON20SPSSpdf

httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE

SION_LINEAL_CON_SPSSpdf

httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm

httpeswikipediaorgwikiNivel_de_medida

httphtmlrincondelvagocomregresion-lineal-simplehtml

httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp

lepdf

httpwwwvitutorcomestadisticabi8html

httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf

httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-

Martinez_1pdf

httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml

httpesslidesharenetpatolinkecuacin-de-regresin-lineal

httpeswikipediaorgwikiMC3ADnimos_cuadrados

httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios

httpwwwwordreferencecomdefinicioncorrelaciC3B3n

httpwwwditutorcomestadistica_2correlacion_estadisticahtml

httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson

httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n

httpeswikipediaorgwikiMatriz_de_correlaciC3B3n

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpwwwinfecepiunizares

httpwwwltbioestadisticaumaes

httpwwwuaqmxmatematicasestadisticasxu3html

httpwwwmembers-americastripodcom

httpwwwmsiplceorg

httpwwwbnvcocrsesionnotaaspg

httpwwwaltavistacom

httpwwwauyantepuycom

httpwwwinees

httpwwwudeccl

httpwwwrincondelvagocom

httpwwwmonografiascom

httpwwwfestadisticafguamesindicadoresiprihtml

httpwwwuaqmxmatematicasestadisticaxu3html

httpwwwinegoboiwd0801htmlE

httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm

httpwwwitlpedumx

httpwwweclaevespanovestadisticasna93nnsnann7eshtml

httpw3moritesmmx~cmendozamaestestoohtml

httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml

httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion

httpwwwunleduarfaveseiencuestasindexhtml

httpwwwmonografiascomtrabajos11operaoperashtml

httpwwwmonografiascomtrabajos6hisohisoshtml

httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos

httpwwwmonografiascomtrabajos16sistema-operativosistema-

operativoshtmlTIPPOS

httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-

operativoshtml

httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei

httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml

httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-

operativo

httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software

httpwwwsscccoclinformaticaconceptoshtml

httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr

httpwwwcadcommxhistoria_de_la_computacionhtm

httpwwweswikipediaorgwikiBus_(informC3A1tica)

httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla

httpwwwcavsicompreguntasrespuestasque-es-el-teclado

httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm

Page 6: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,

Fig 3

Dentro de las pruebas parameacutetricas se tienen para muestras grandes y para

muestras pequentildeas Un supuesto que se aplica a ambas es que la muestra que se

toma debe haber sido seleccionada en forma aleatoria o probabiliacutestica En las

pruebas parameacutetricas de muestra pequentildea se requiere el supuesto de que las

muestras fueron extraiacutedas de una poblacioacuten con distribucioacuten normal y cuando se

trata de dos o maacutes muestras tambieacuten se requiere una prueba de igualdad de

varianzas Existen pruebas estadiacutesticas por medio de las cuales se podriacutea

comprobar esto sin embargo suele no daacutersele importancia a esto y se pasa por

alto El anaacutelisis de varianza tambieacuten se basa en el supuesto de normalidad de las

poblaciones y en el de que sus varianzas son iguales

En las pruebas en las que se tienen menos supuestos es en las de muestra

grande las cuales se pueden aplicar sin saber o comprobar si la poblacioacuten o

poblaciones eran normales estas pruebas se dice que son robustas porque no es

necesario que se cumpla dicho supuesto Cuando la prueba que se requiere no es

robusta no es necesario correr el riesgo de estar equivocados en las conclusiones

en ellos En cambio se dispone de muchas pruebas estadiacutesticas no parameacutetricas

que tienen una aplicacioacuten semejante a las parameacutetricas de muestra pequentildea en las

que se tienen menos supuestos

PRUEBAS NO PARAMEacuteTRICAS

Se denominan pruebas no parameacutetricas aquellas que no presuponen una

distribucioacuten de probabilidad para los datos por ello se conocen tambieacuten como de

distribucioacuten libre (distribution free) En la mayor parte de ellas los resultados

estadiacutesticos se derivan uacutenicamente a partir de procedimientos de ordenacioacuten y

recuento por lo que su base loacutegica es de faacutecil comprensioacuten Cuando trabajamos

con muestras pequentildeas (n lt 10) en las que se desconoce si es vaacutelido suponer la

normalidad de los datos conviene utilizar pruebas no parameacutetricas al menos para

corroborar los resultados obtenidos a partir de la utilizacioacuten de la teoriacutea basada en

la normal

Cuando se analizan datos medidos por una variable cuantitativa continua

las pruebas estadiacutesticas de estimacioacuten y contraste frecuentemente empleadas se

basan en suponer que se ha obtenido una muestra aleatoria de una distribucioacuten de

probabilidad de tipo normal o de Gauss Pero en muchas ocasiones esta

suposicioacuten no resulta vaacutelida y en otras la sospecha de que no sea adecuada no

resulta faacutecil de comprobar por tratarse de muestras pequentildeas En estos casos

disponemos de dos posibles mecanismos los datos se pueden transformar de tal

manera que sigan una distribucioacuten normal o bien se puede acudir a pruebas

estadiacutesticas que no se basan en ninguna suposicioacuten en cuanto a la distribucioacuten de

probabilidad a partir de la que fueron obtenidos los datos y por ello se denominan

pruebas no parameacutetricas (distribution free)

La mayoriacutea de las pruebas de hipoacutetesis requieren suposiciones especiacuteficas

acerca de la poblacioacuten o poblaciones que se muestran En muchos casos debemos

suponer que las poblaciones tienen maacutes o menos la forma de distribuciones

normales o que se conocen sus varianzas o se sabe que son iguales o bien que las

muestras son independientes Como hay muchos casos donde no se pueden

cumplir estas suposiciones los estadiacutesticos han generado teacutecnicas alternativas

basadas en suposiciones menos estrictas que se han dado a conocer como

ldquoPruebas no parametricasrdquo

En estos casos se emplea como paraacutemetro de centralizacioacuten la mediana

que es aquel punto para el que el valor de X estaacute el 50 de las veces por debajo y

el 50 por encima

Propiedades

1 No se relacionan con el estudio de un paraacutemetro de la poblacioacuten

Por lo general cuando se hace referencia a pruebas no parameacutetricas se puede estar

hablando tanto de las no parameacutetricas como de las libres de distribucioacuten

(distribution free tests)

Las dos indicaciones maacutes importantes que se deben tener en cuenta para utilizar

una prueba no parameacutetrica son que

1 la distribucioacuten de la poblacioacuten no sea normal

2 la escala de medicioacuten de la variable en cuestioacuten sea categoacuterica

Los meacutetodos no parameacutetricos son menos poderosos que los parameacutetricos Esto

quiere decir que es maacutes difiacutecil rechazar la hipoacutetesis nula con las pruebas no

parameacutetricas

Por esa razoacuten los estadiacutesticos por lo general recurren a los meacutetodos no

parameacutetricos soacutelo cuando los datos no cumplen con los supuestos parameacutetricos

Sin embargo hay problemas de investigacioacuten en los que las variables categoacutericas

son las indicadas y por lo tanto soacutelo un meacutetodo no parameacutetrico es el indicado Los

pasos en las pruebas de hipoacutetesis no parameacutetricas son los mismos de las

parameacutetricas Los cambios por lo general se limitan a cambios en la foacutermula para

obtener el valor observado y en la tabla que se utiliza Pero se habla de hipoacutetesis

nula nivel de significacioacuten error tipo I y tipo II etc

El uso de meacutetodos no parametricos ofrece numerosas ventajas

1 los meacutetodos no parametricos se pueden usar con todo tipos de datos

ndash informacioacuten cualitativa (de escala nominal) informacioacuten en forma de rangos

(escala ordinal) asiacute como informacioacuten medida de un modo mas exacto (escala de

intervalo o de razoacuten)

2 por lo general son faacuteciles de aplicar y raacutepidos de calcular con

tamantildeos pequentildeos de muestra En ocasiones son tan sencillos que basta contar

con la frecuencia con que algunas caracteriacutesticas aparecen en los datos Por lo

tanto a menudo se usan para estudios piloto o preliminares yo en situaciones en

que se desean respuestas raacutepidas

3 hacen menos premisas menos estrictas (mas faacuteciles de cumplir) que

los procedimientos claacutesicos por lo tanto gozan de mayor aplicabilidad y

proporcionan un conjunto de conclusiones mas generales de base mas amplia

4 permiten solucionar problemas que no implican pruebas de

paraacutemetros de poblacioacuten

5 son mas econoacutemicos que los procedimientos claacutesicos ya que el

investigador puede aumentar la potencia y a pesar de ello ahorrar dinero tiempo y

trabajo al recopilar muestras de datos mayores medibles con mas aproximacioacuten

lo que soluciona con mayor rapidez el problema

6 seguacuten el procedimiento seleccionado los meacutetodos no parametricos

pueden ser tan poderosos (o casi tanto) como el procesamiento claacutesico cuando se

cumplen las premisas de este ultimo y quizaacutes sean un poco mas poderosos aun

cuando no se cumplan

Los procedimientos no parametricos tambieacuten ofrecen algunas desventajas

1 no conviene usar meacutetodos no parametricos cuando se pueden

cumplir todas las premisas de los procedimientos claacutesicos y los datos se miden en

una escala bien sea de intervalos de razones A menos de que se empleen

procedimientos claacutesicos en estos casos el investigador no esta aprovechando por

completo los datos Se pierde informacioacuten al convertir datos recopilados (de una

escala de intervalo o de razoacuten) a rangos (escala ordinal) o categoriacuteas (escala

nominal) En particular en esas circunstancias algunas pruebas no parametricas

muy raacutepidas y sencillas tienen mucha menos potencia que los procedimientos

claacutesicos y por lo general se deben evitar

2 seguacuten aumenta el tamantildeo de la muestra en ocasiones el manejo

requerido de datos para los procedimientos no parametricos se hace laborioso a

menos que se disponga de un paquete de computacioacuten adecuado

3 con frecuencia se necesitan tablas especiales de valores

criacuteticos y estas no se obtienen con tanta facilidad como las tablas de los

valores criacuteticos normales t 2X y F Ccedil

Prueba de signos para una sola muestra

Salvo para las pruebas con muestra grande todas las pruebas estaacutendar

concernientes a medias estaacuten basadas en la suposicioacuten de que las poblaciones que

se muestrean tienen aproximadamente la forma de distribuciones normales

Cuando en un caso determinado esta suposicioacuten resulta insostenible la prueba

estaacutendar se puede sustituir por una de varias alternativas no parametricas entre

ellas la ldquoprueba de signosrdquo

La prueba de signos de una sola muestra se aplica cuando se muestrea una

poblacioacuten simeacutetrica continua de manera que la probabilidad de que un valor de la

muestra sea menor que la media o mayor que la media es en ambos casos frac12 Para

probar la hipoacutetesis nula ( O ) contra una hipoacutetesis alternativa apropiada con

base en una muestra aleatoria de tamantildeo n se sustituye cada valor de la muestra

mayor que O por un signo de mas y cada valor de la muestra menor que O por

un signo de menos despueacutes se aprueba la hipoacutetesis nula de que estos signos de

mas y menos son valores de una variable aleatoria que tiene distribucioacuten binomial

con 2

1p (si un valor de la muestra es igual a O simplemente lo rechazamos)

Prueba de suma de rangos

Se puede utilizar cuando se desea probar una hipoacutetesis relacionada a un

paraacutemetro que refleje una tendencia central Cuando no se cumplen las premisas

de la prueba t el procedimiento de Wilcoxon es probable que sea mas potente

para detectar la existencia de diferencias importantes que su contraparte

correspondiente

Para llevar a cabo la prueba de rangos y signos de Wilcoxon se puede

aplicar el siguiente procedimiento de seis pasos

1 para cada partiacutecula en una muestra de n partidas se obtiene un

resultado de diferencia Di

2 despueacutes no se toman en cuenta los signos + y ndash y se obtiene un

grupo de n diferencias absolutas iD

3 se omite de cualquier anaacutelisis adicional cualquier diferencia

absoluta con resultados de 0 con lo cual se obtiene un grupo de n resultados de

diferencias absolutas que no sean cero donde n

4 despueacutes se asignan rangos Ri desde uno hasta n a cada una de las

iD de modo que el resultado de diferencia absoluta mas pequentildeo obtiene una

clasificacioacuten de uno y el mayor de n Por la falta de precisioacuten en el proceso de

medicioacuten si dos o mas iD son iguales a cada una se asigna el ldquorango promediordquo

de los rangos que de lo contrario se les hubieran asignado individualmente si no

hubiera ocurrido la igualdad de los datos

5 ahora se asignan de nuevo el siacutembolo + o el signo ndash a cada uno de

los n rangos de Ri dependiendo de si originalmente Di era positiva o negativa

6 la prueba estadiacutestica de Wilcoxon W se obtiene como la suma de

las clasificaciones +

n

i

iRW1

Para muestras de n 20 se puede utilizar tablas para obtener los valores

criacuteticos de la prueba estadiacutestica W tanto para las pruebas de una cola como de dos

a diversos niveles de significacioacuten Se rechaza la hipoacutetesis nula en una prueba de

dos colas si el valor observado W es igual o excede al valor critico superior o es

igual o inferior al valor critico inferior Se rechaza la hipoacutetesis nula en una prueba

de una cola en direccioacuten positiva si el valor observado W es igual o excede el

valor critico superior Se rechaza la hipoacutetesis nula para una prueba de una cola en

direccioacuten negativa si el valor observado de w es inferior o igual al valor critico

inferior

Para nge20 la prueba estadiacutestica W tiene distribucioacuten aproximadamente

normal y se puede utilizar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis nula

W

WWZ

VARIABLES ALEATORIA Y COMO SE DIVIDEN

Una variable es aleatoria si toma diferentes valores como resultado de un

experimento aleatorio Puede ser discreta o continua Si puede tomar soacutelo un

nuacutemero limitado de valores entonces es una variable aleatoria discreta En el otro

extremo si puede tomar cualquier valor dentro de un intervalo dado entonces se

trata de una variable aleatoria continua

Se puede pensar en una variable aleatoria como un valor o una magnitud

que cambia de una presentacioacuten a otra sin seguir una secuencia predecible Los

valores de una variable aleatoria son los valores numeacutericos correspondientes a

cada posible resultado de un experimento aleatorio

La distribucioacuten de probabilidad de una variable aleatoria proporciona una

probabilidad para cada valor posible y estas probabilidades deben sumar 1

VALOR ESPERADO DE UNA VARIABLE ALEATORIA

El valor esperado es una idea fundamental en el estudio de las distribuciones de

probabilidad

Para obtener el valor esperado de una variable aleatoria discreta se

multiplica cada valor que la variable puede tomar por la probabilidad de

presentacioacuten de ese valor y luego se suman esos productos Es un promedio

pesado de los resultados que se esperan en el futuro El valor esperado pesa cada

resultado posible con respecto a la frecuencia con que se espera se que presente

En consecuencia las presentaciones maacutes comunes tienen asignadas un peso

mayor que las menos comunes

El valor esperado tambieacuten puede ser obtenido a partir de estimaciones

subjetivas En ese caso el valor esperado no es maacutes que la representacioacuten de las

convicciones personales acerca del resultado posible

VARIABLES ALEATORIAS DISCRETAS

Variable que toma un nuacutemero finito o infinito de valores numerables

Sean x1 x2 x3 xn los distintos valores que puede tomar la variable

aleatoria

Y p(x1) p(x2) p(xn) su probabilidad

Los pares de valores (xj p(xj)) constituyen la distribucioacuten de probabilidades de la

variable aleatoria

p(x) se denomina funcioacuten de probabilidad y debe cumplir con las siguientes

propiedades

0 lt p(xj) lt 1 (p(x) es una probabilidad y por lo tanto debe tomar valores

entre 0 y 1)

1)( jxP (la suma de probabilidades repartidas entre todos los valores

de la variable debe ser igual a 1)

De la misma manera que calculamos frecuencias acumuladas podemos acumular

probabilidades obteniendo la funcioacuten de distribucioacuten de probabilidades

Esta funcioacuten representa la probabilidad de que la variable aleatoria sea menor o

igual que un determinado valor

F(xj) = P (X lt xj)

Graacuteficamente la funcioacuten aumenta de a saltos ya que entre dos valores

consecutivos de una variable discreta no puede tomar valores intermedios

VARIABLES ALEATORIAS CONTINUAS

En este caso en lugar de trabajar con la probabilidad de valores

particulares de la variable resulta maacutes apropiado calcular probabilidades

asociadas a intervalos Para distribuir propiedades se usa una funcioacuten que mide

concentracioacuten de probabilidades alrededor de un punto que se denomina

funcioacuten de densidad de probabilidad (fdp) y se denota como f(x)

Una funcioacuten de densidad de probabilidad debe cumplir con las siguientes

propiedades

F(x) gt 0 (la funcioacuten es no negativa para cualquier valor de x f(x) no es

una probabilidad y puede valer maacutes de 1)

el aacuterea bajo la curva de la funcioacuten vale 1)

La funcioacuten de distribucioacuten para una variable aleatoria continua se calcula

F(a) = P(X lt

La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula

P (alt x lt b) = F(b) - F(a)

La probabilidad de que la variable tome un valor particular se puede expresar

como

F(c) - F(c) = 0

DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO

Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia

valores de una variable aleatoria con sus respectivas probabilidades es

decir Probabilidad de x = Funcioacuten de x

Las distribuciones se caracterizan por una foacutermula que determina el tipo de

distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio

muestral

En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una

funcioacuten de la probabilidad que representa los resultados que se van obteniendo en

un experimento aleatorio

Asiacute para un nuacutemero dado x la probabilidad es

A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la

variable X y representa la probabilidad de que la variable tome el valor desde

hasta x

Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de

probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad

Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos

y seraacuten mutuamente excluyentes y su suma es el

suceso por lo que tenemos entonces que

y finalmente

Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos

los valores de la variable aleatoria x conoceremos completamente la distribucioacuten

de probabilidad de la variable

Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten

de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente

Es decir la probabilidad de todo el espacio muestral es 1 tal y como

establece la teoriacutea de la probabilidad y por otra parte

Es decir la probabilidad del suceso nulo es cero

Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de

probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes

praacutectico el uso de la funcioacuten de densidad

En el caso de una variable discreta la distribucioacuten puede describirse

mediante una funcioacuten de probabilidad que para cada valor de x de la variable X

determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de

una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de

distribucioacuten la que para cada valor provee la probabilidad de no ser superado

evidentemente el valor de la funcioacuten de distribucioacuten es igual

a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo

inferior del dominio de la variable hasta x inclusive Lista de los resultados de un

experimento con las probabilidades que se esperariacutean ver asociadas con cada

resultado

Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores

diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12

En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica

Para el caso de 1 solo dado donde todos los valores tienen la misma

probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme

Prueba de aleatoriedad

Con frecuencia se supone que los datos recopilados constituyen una

muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la

utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash

Wolfowitz de corridas de una muestra para aleatoriedadrdquo

Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o

la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos

siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la

partida tiene una propiedad en particular o de la cantidad o magnitud en que se

posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la

sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con

distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente

de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que

la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las

partidas que la preceden o las que la suceden en forma tal que la probabilidad de

su ocurrencia varia de una posicioacuten a otra el proceso no se considera como

aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando

esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en

forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico

Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el

tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico

de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una

prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede

rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la

sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de

una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2

exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por

consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis de aleatoriedad

U

UUZ

donde

U = numero total de corridas

U = valor medio de U 12 21

n

nnU

U = desviacioacuten estaacutendar de U 1

222

2121

nn

nnnnnU

n1 = numero de eacutexitos en la muestra

n2 = numero de fracasos en la muestra

n = tamantildeo de la muestra n = n1 + n2

PRUEBA DE McNEMAR

Suele darse el caso en que se desean comparar las proporciones de los

datos de muestras tomados de poblaciones relacionadas En este caso se quisiera

determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a

alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea

determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y

otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede

utilizar la prueba desarrollada por McNemar

El principal intereacutes es determinar si hay diferencia entre las dos

proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta

que el otro (prueba de una cola)

La prueba estadiacutestica para la prueba de McNemar es

CB

CBZ

PRUEBA U DE MANN ndash WHITNEY

Es una alternativa no parametrica a la prueba t de dos muestras para la

diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula

μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos

la forma de distribuciones normales de hecho la prueba solo requiere que las

poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no

importa si se cumple o no esta suposicioacuten

Estadiacutesticos U1 y U2

111

2112

1 W

nnnnU

222

2122

1 W

nnnnU

PRUEBA DE RACHAS

Son todas las diferencias que tiene el mismo signo y se presentan en una

misma fila Una serie de n diferencias puede tener solamente una racha (toda

positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las

rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de

poblaciones con la misma distribucioacuten de frecuencias Colocamos las

observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces

contamos el numero de rachas item de cada una de las muestras Si hay menos

rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales

rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten

La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de

que las observaciones se han sacado aleatoriamente de una sola poblacioacuten

Para hacer esto se halla la mediana de la muestra y se designa las

observaciones situadas por debajo de la mediana por un signo menos (-) y las

observaciones situadas por encima de la mediana por un signo (+) Si el numero

de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado

rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el

numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10

puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la

tabla normal con

u

uu

z

2

1

12

21

21

NN

NNu

)1()(

2(2

21

2

21

2121212

NNNN

NNNNNNu

DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES

DISTRIBUCIONES DE EJEMPLO Y USO

DISTRIBUCIOacuteN NORMAL O GAUSSIANA

Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que

multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal

Esta distribucioacuten de caracteriza porque los valores se distribuyen formando

una campana de Gauss en torno a un valor central que coincide con el valor

medio de la distribucioacuten

Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a

la izquierda

Esta distribucioacuten viene definida por dos paraacutemetros

X N (m S2)

m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro

de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores

estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores

estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de

ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten

estaacutendar

Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina

normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo

que permiten obtener esos mismos valores donde se recoge la probabilidad

acumulada para cada punto de la curva de esta distribucioacuten

Ademaacutes toda distribucioacuten normal se puede transformar en una normal

tipificada

Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con

media 10 y varianza 4 Transformarla en una normal tipificada

X N (10 4)

Para transformarla en una normal tipificada se crea una nueva variable (Y)

que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica

(que es la raiacutez cuadrada de la varianza)

En el ejemplo la nueva variable seriacutea

Esta nueva variable se distribuye como una normal tipificada

permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor

Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos

indicado de que las probabilidades para cada valor de la curva se encuentran

recogidas en una tabla

MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)

La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten

normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta

distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros

y lo que representamos del modo si su funcioacuten de densidad

es

Observacioacuten

Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y

la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes

adelante65

La forma de la funcioacuten de densidad es la llamada campana de Gauss

Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten

normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1

Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un

uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto

con lo cual en coinciden la media la mediana

y la moda y por uacuteltimo calcular sus puntos de inflexioacuten

El soporte de la distribucioacuten es todo de modo que la mayor parte de la

masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se

encuentra concentrado alrededor de la media y las ramas de la curva se extienden

asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la

media es posible (aunque poco probable)

La forma de la campana de Gauss depende de los paraacutemetros y

indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)

Figura Distribuciones gaussianas con diferentes medias e igual

dispersioacuten

(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor

sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor

de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea

``maacutes aplastado seraacute

Figura Distribuciones gaussianas con igual media pero varianza

diferente

La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes

adelante que es

Como consecuencia la distribucioacuten normal es reproductiva con respecto a

los paraacutemetros y ya que

Observacioacuten

Como se ha mencionado anteriormente la ley de probabilidad gaussiana la

encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza

por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el

de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que

apuntar un hecho negativo para esta ley de probabilidad

La funcioacuten no posee primitiva66

conocida67

Las consecuencias desde el punto de vista praacutectico son importantes ya que

eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de

la normal y nos tenemos que limitar a decir que

sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente

esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho

puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto

se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en

problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde

se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie

limitada de valores xi dados Normalmente F se encuentra tabulada para una

distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten

normal tipificada

En el caso de que tengamos una distribucioacuten diferente se

obtiene Z haciendo el siguiente cambio

De manera general se tiene

Proposicioacuten (Cambio de origen y escala)

Sean Entonces

Este resultado puede ser utilizado del siguiente modo Si y nos

interesa calcular

1 Hacemos el cambio y calculamos

2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de

modo aproximado) Como

tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada

Ejemplo

Supongamos que cierto fenoacutemeno pueda ser representado mediante una

va y queremos calcular la probabilidad de que Xtome un valor

entre 39 y 48 es decir

Comenzamos haciendo el cambio de variable

de modo que

Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que

hemos mencionado anteriormente

Proposicioacuten

Sea Entonces

Demostracioacuten

Por ser la normal una ley de probabilidad se tiene que

es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con

respecto a se obtiene el valor 0

luego

Para demostrar la igualdad entre la y basta con aplicar la misma

teacutecnica pero esta vez derivando con respecto a

Luego

Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en

primer lugar la va tipificada de X

y calculamos

Como por la proposicioacuten 5 deducimos que

CURVA NORMAL ESTANDARIZADA

Una variable numeacuterica puede clasificarse como discreta o continua Las

variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas

con la idea de contar Las variables continuas se pueden asociar con la idea de

medir utilizando fracciones y decimales Cuando la variable es continua el

modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal

El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten

normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran

cantidad de variables continuas

El modelo matemaacutetico

La funcioacuten matemaacutetica que se usa como modelo es

e = 271

π = 314

μx = media de la poblacioacuten

σx = desviacioacuten estaacutendar de la poblacioacuten

x = un valor de la variable continua

Como e y π son constantes la forma de la curva normal depende

solamente de los dos parametros de la distribucioacuten normal la media μx y la

desviacioacuten estaacutendar σx

Las diferentes curvas normales van a variar dependiendo de esos dos

paraacutemetros

En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar

visualmente como una curva en forma de campana El aacuterea debajo de esta curva se

halla por medio del integral de la funcioacuten y corresponde al por ciento o la

proporcioacuten de puntuaciones que se encuentran en el intervalo dado

Propiedades de las distribuciones normales

a Son simeacutetricas y tienen forma de campana

b Al ser simeacutetricas la media la moda y la mediana coinciden

c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea

de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media

d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la

curva se encuentra a tres desviaciones estaacutendar de la media

En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral

de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de

diferentes secciones de la curva o se utiliza la computadora para calcular ese valor

del aacuterea

La distribucioacuten normal estandarizada

Puesto que hay un nuacutemero infinito de combinaciones para los dos

paraacutemetros hay un nuacutemero infinito de curvas normales diferentes

Este problema se ha resuelto praacutecticamente al transformar los valores de

todas las distribuciones normales a los valores de una distribucioacuten normal

estandarizada representada por la curva normal estandarizada (standard normal

curve)

Las puntuaciones estandarizadas se logran restando la media a cada

observacioacuten y dividiendo entre la desviacioacuten estaacutendar

donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar

Propiedades de la distribucioacuten normal estandarizada

μ z = 0

σ z = 1

En muchas ocasiones se quieren comparar puntuaciones que pertenecen a

dos distribuciones normales diferentes La diferencia entre las dos distribuciones

radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo

la comparacioacuten se hace posible si se convierten las puntuaciones de ambas

distribuciones a puntuaciones z que corresponden a la distribucioacuten normal

estandarizada

Percentiles y rangos percentiles de una distribucioacuten normal estandarizada

Si se desea hallar la percentiles o el rango percentil en una distribucioacuten

normal no estandarizada se recurre al procedimiento de convertir las puntuaciones

de la distribucioacuten normal dada a puntuaciones z que corresponden a la

distribucioacuten normal estandarizada

Estos valores en la distribucioacuten normal estandarizada se pueden obtener

por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en

las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el

intervalo dado

Es necesario visualizar siempre el aacuterea debajo de la curva como el por

ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo

dado

Cuando una distribucioacuten de puntuaciones es normal estandarizada la

pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar

en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o

cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten

dada

DISTRIBUCIOacuteN GAMMA

Una variable aleatoria X asociada a un experimento aleatorio tiene una

distribucioacuten GAMMA si se caracteriza por las siguientes propiedades

Algunas alternativas de funciones de densidad se pueden ver en la graacutefica

del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)

respectivamente =1

=1

La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo

III

El modelo Gamma se ha utilizado frecuentemente en variables tales como

ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el

intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson

ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900

ndash Flujos maacuteximos MARKOVIC 1965

ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965

ndash Altura de la precipitacioacuten mensual WHITCOMB 1940

ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia

infin

ndash Ingresos familiares

ndash Edad del hombre al contraer matrimonio por primera vez

ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en

subestaciones a una frecuencia part

Ejemplo

Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos

de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia

promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo

de tiempo se encuentre hasta que ocurre el segundo ciclo

a Dentro de una desviacioacuten con respecto del tiempo promedio

b A maacutes de dos desviaciones por encima de la media

Solucioacuten

X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en

horas

Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)

= 2

Y Nuacutemero de ciclos hora ---------Y~P( =002)

E(Y) = 002 =

X ~ G(2 002)

Ejemplo

En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de

kilovatios por hora puede considerarse como una variable aleatoria con

distribucioacuten GAMMA de paraacutemetros = 3 y

= 05

La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de

KWhora

iquestCuaacutel es la probabilidad de que este abastecimientos sea

a Insuficiente en un diacutea cualquiera

b Se consuman entre 3 y 8 millones de K WHora

c c Encuentre E(x) y V(x)

SOLUCIOacuteN

DISTRIBUCIOacuteN PARETO

En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad

continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores

es

Su funcioacuten de distribucioacuten es

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto

son

El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (

DISTRIBUCIOacuteN T DE STUDENT

Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una

distribucioacuten t con n grados de libertad

Cuando n--gtinfinito a curva t coincide com la normal estandarizada

FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX

MOMENTOS

La distribucioacuten -Student se construye como un cociente entre una normal

y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-

Student con n grados de libertad a la de una va T

donde Este tipo de distribuciones aparece cuando

tenemos n+1 va independientes

y nos interesa la distribucioacuten de

La funcioacuten de densidad de es

Figura Funcioacuten de densidad de una de Student

La distribucioacuten de Student tiene propiedades parecidas a

Es de media cero y simeacutetrica con respecto a la misma

Es algo maacutes dispersa que la normal pero la varianza decrece hasta

1 cuando el nuacutemero de grados de libertad aumenta

Figura Comparacioacuten entre las funciones de densidad de y

Para un nuacutemero alto de grados de libertad se puede aproximar la

distribucioacuten de Student por la normal es decir

Figura Cuando aumentan los grados de libertad la distribucioacuten de

Student se aproxima a la distribucioacuten normal tipificada

Para calcular

DISTRIBUCIOacuteN BETA

Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede

representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un

intervalo de longitud finita Tales como

Proporcioacuten de impurezas en un producto quiacutemico

La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten

La proporcioacuten vendida de un lote durante un tiempo t

La humedad relativa medida en cierto lugar

Porcentaje del costo total destinado a reparacioacuten de maquinaria

Porcentaje de costo adicional destinado a reparacioacuten de maquinaria

La distribucioacuten del tiempo necesario para completar una fase del proyecto

PERT

Evaluacioacuten de programas y teacutecnicas de revisioacuten

Ejemplo

La proporcioacuten de tramos de una autopista que requieren repararse

semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros

= 3 y =2

a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten

b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista

requieren reparacioacuten en un antildeo cualquiera

DISTRIBUCIOacuteN CAUCHY

En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de

Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es

donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene

valor esperado ni varianza

Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V

2 lt 1 el

numero U V tiene la distribucioacuten Cauchy

La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un

grado de libertad

Ejemplo

Sean y dos observaciones independientes de una distribucioacuten

Cauchy con funcioacuten de densidad

Puede demostrarse que si y son tales que entonces la

funcioacuten de verosimilitud de es bimodal

Sean y Supongamos que se desea hacer inferencias sobre el

valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa

Especiacuteficamente interesa encontrar la distribucioacuten final de

Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la

distribucioacuten final de tiene una forma complicada Es conveniente notar sin

embargo que corresponde a la densidad marginal de respecto a la

densidad conjunta

DISTRIBUCIOacuteN BERNOULLI

Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto

suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el

que no lo sea (fracaso) En realidad no se trata maacutes que de una variable

dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello

que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas

obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la

situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este

experimento mediante una va discreta Xque toma los valores X=0 si el suceso no

ocurre y X=1 en caso contrario y que se denota

Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar

una moneda al aire y considerar la va

Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de

probabilidad es

y su funcioacuten de distribucioacuten

Su funcioacuten caracteriacutestica es

Los principales momentos de la X los podemos calcular directamente

o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina

Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)

cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de

intentos

CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE

BERNOULLI

Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la

probabilidad y asegurar que se cumplen las tres condiciones necesarias en

particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del

resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3

requiere que los ensayos o intentos de un proceso de Bernoulli sean

estadiacutesticamente independientes es decir que el resultado de un intento no puede

afectar de ninguacuten modo el resultado de cualquier otro intento

DISTRIBUCIOacuteN EXPONENCIAL

Modelo para variable aleatoria continua que permite representar variables

del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos

Componentes

En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de

probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para

valores x gt 0 es

f(x) = λe - λx

Su funcioacuten de distribucioacuten es

Aqui e significa el nuacutemero e

El valor esperado y la varianza de una variable aleatoria X con

distribucioacuten exponencial son

E[X] = 1 λ

V(X) = 1 λ2

Ejemplo

Ejemplos para la distribucioacuten exponencial son los tiempos dentro

accidentes con probabilidad invariable

La funcioacuten de densidad para λ igual 05 10 y 15

DISTRIBUCIOacuteN MULTINOMIAL

La distribucioacuten multinomial es similar a la distribucioacuten binomial con la

diferencia de que en lugar de dos posibles resultados en cada ensayo

La distribucioacuten multinomial sigue el siguiente modelo

Donde

X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo

que el partido POPO lo hayan votado 3 personas)

n indica el nuacutemero de veces que se ha repetido el suceso (en el

ejemplo 5 veces)

n es factorial de n (en el ejemplo 5 4 3 2 1)

p1 es la probabilidad del suceso X1 (en el ejemplo el 40)

Veamos el ejemplo

Luego

P = 00256

Es decir que la probabilidad de que las 5 personas elegidas hayan votado

de esta manera es tan soacutelo del 256

Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1

Veamos otro ejemplo

En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el

40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4

invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos

Aplicamos el modelo

LuegoP = 00384

Por lo tanto la probabilidad de que el grupo esteacute formado por personas de

estos paiacuteses es tan soacutelo del 384

DISTRIBUCIOacuteN UNIFORME

En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de

probabilidad cuyos valores tienen la misma probabilidad

Caso discreto

Su funcioacuten de probabilidad es en el caso discreto con valores posibles

p(xi) = 1 n

Su funcioacuten de distribucioacuten es en el caso discreto

Su media estadiacutestica es

Caso continuo

Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b

La funcioacuten de densidad en el caso continuo entre a y b es

Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12

Ejemplos

Para un dado perfecto todos los resultados tienen la misma probabilidad 1

6

Calcular variables aleatorias

Las variables aleatorias de probabilidad uniforme pueden calcularse con un

generador de variables aleatorias

DISTRIBUCIOacuteN BINOMIAL

En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad

discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con

probabilidad p de un eacutexito

Su funcioacuten de densidad es

Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)

posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos

((1 - p)n - x

)

El valor esperado de una variable aleatoria de probabilidad binominal es

E[x] = np y su varianza V[x] = np(1 - p)

DISTRIBUCIOacuteN BINOMIAL NEGATIVA

Sobre una sucesioacuten de va de Bernouilli independientes

Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r

eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de

distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo

Su ley de probabilidad se deduce siguiendo el esquema

De nuevo el conjunto de posibles valores de esta va discreta es

Su funcioacuten caracteriacutestica es

y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima

Ejemplo

Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en

operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal

que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda

definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para

intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus

5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones

que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se

necesiten 10 intervenciones

Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por

una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan

4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso

Identificando los paraacutemetros se tiene

Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el

nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy

simple

Y=X+r

Luego

Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente

es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de

que X=10-4=6 Por tanto

La distribucioacuten binomial negativa tambieacuten se puede definir como el

nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas

contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que

DISTRIBUCIOacuteN DE POISSON

Modelo para variable aleatoria discreta que permite calcular la

probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten

discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo

muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos

o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual

a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es

independiente de cuaacutendo se presenta dicho periacuteodo

En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de

probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos

es

Aquiacute e significa el nuacutemero e y x significa el factorial de x

La distribucion de Poisson describe el nuacutemero de sucesos en una unidad

de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un

proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens

en una carrera

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten

Poisson son

E[X] = V[X] = λ

La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos

entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un

conmutador la demanda (necesidades) de los pacientes que requieren servicio en

una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el

nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos

ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una

variable aleatoria discreta que toma valores enteros (0 1 2)

Caacutelculo de la probabilidad de Poisson

La letra X por lo general representa a una variable discreta y puede tomar

valores enteros Utilizamos la letra X para representar a la variable aleatoria y la

letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La

probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson

se calcula con la foacutermula

LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA

DISTRIBUCIOacuteN BINOMIAL

La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la

binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan

cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es

grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan

con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena

aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es

igual o menor que 005 En los casos en que se cumplen estas condiciones

podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media

de la distribucioacuten de Poisson

DISTRIBUCIOacuteN GEOMEacuteTRICA

En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten

probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores

discretos es

P(X = x) = p(1 - p)x - 1

Su funcioacuten de distribucioacuten es

El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media

estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2

Ejemplo

El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es

una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6

DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA

En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de

probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de

masa para valores es

Aqui (a sobre b) es el coeficiente binomial

El valor esperado de una variable aleatoria X de distribucioacuten

hipergeomeacutetrica es

Y su varianza

DISTRIBUCIOacuteN ZETA

En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad

discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos

es

Aqui ζ(s) es la funcioacuten zeta de Rieman con

El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto

DISTRIBUCION CHI CUADRADO

El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una

comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es

diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con

ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno

es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario

estas dos frecuencias acusan una diferencia significativa para por ejemplo un

nivel de significacioacuten del 5

El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la

asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada

por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito

bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor

del famoso libro Statistical Methods for Research Workers (1925) donde se

marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con

Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde

estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y

el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las

pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba

exacta de Fisher

Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico

publicitario presentado a grupos de clientes comparar la rentabilidad de un

proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos

de los turistas por determinados espacios geograacuteficos o por determinados

servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las

frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las

frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o

tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o

de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2

x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos

turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han

ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han

tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula

que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido

en los sitios A y B

Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es

independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo

A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces

alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este

anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos

empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de

las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51

La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten

igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es

2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del

Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del

5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206

podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para

suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B

Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias

observadas empiacutericamente de dos muestras con las frecuencias esperadas o

teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el

Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de

las materias primas perecederas Los resultados son seguacuten atributos cualitativos

los siguientes Primero veremos las frecuencias empiacutericas u observadas

Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten

Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son

131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas

Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y

fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres

columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta

maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x

120 260 = 6046 b2 = 129 x 120 260 = 5954

Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten

igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de

2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de

libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La

diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna

conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten

Es una medida de la discrepancia existente entre las frecuencias

observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso

de frecuencias () debido a que permite determinar las desviaciones entre ellas

ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la

expresioacuten

E

EOX

2

2

Donde

O frecuencia observada

E frecuencia teoacuterica esperada

TEST DE CHI-CUADRADO DE CONTINGENCIA

Un caso particular del test de chi-cuadrado que permite hacer un test sobre

la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-

cuadrado de contingencia Los dos caracteres observados en una misma

poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases

de se denotan las de por Tambieacuten vamos a

denotar

el efectivo conjunto de y es el nuacutemero de individuos para los

cuales toma el valor e el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

Estos valores se representan en una tabla de doble entrada conocida como

tabla de contingencia

Cada fila y cada columna corresponden a una submuestra particular La

fila de iacutendice es la distribucioacuten en las clases de los individuos para

los cuales el caraacutecter toma el valor La columna de iacutendice es la

distribucioacuten en las clases de los individuos para los cuales el caraacutecter

toma el valor Dividiendo las filas y las columnas por su suma se obtienen

frecuencias condicionales para cada una de las distribuciones empiacutericas Para

y las denotaremos por

y

Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y

los perfiles columna Para el modelo probabilista las observaciones provienen de

una muestra

de una ley bidimensional La hipoacutetesis a comprobar

es que los dos marginales de esta ley son independientes Si este es el caso los

perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna

de la de

y

Es equivalente a decir que las frecuencias conjuntas deben estar cerca de

los productos de las frecuencias marginales

Las frecuencias conjuntas por un lado (distribucioacuten observada) y los

productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen

dos distribuciones de probabilidad sobre el conjunto producto

Podemos por tanto calcular la distancia de

chi-cuadrado de una con respecto a la otra

Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la

distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale

Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la

definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado

Por lo dicho anteriormente para suficientemente grande podemos

aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el

nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados

a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las

que han sido estimadas Hay para el caraacutecter y para el caraacutecter

(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley

chi-cuadrado seraacute por tanto

Vamos a presentar un ejemplo de dos caracteres binarios que tienen que

ver con enfermos para los cuales se ha observado si tienen o no una tendencia al

suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y

neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las

tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla

de contingencia observada es

Tendencia Sin tendencia Total

Psicosis 20 180 200

Nneurosis 60 140 200

Total 80 320 400

La distancia de chi-cuadrado de contingencia calculada a partir de esta

tabla es de El valor tomado por el estadiacutegrafo es el cual

debemos comparar con la ley El p-valor es de

Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre

la tendencia al suicidio y la clasificacioacuten de las enfermedades

El test no precisa el sentido de esta dependencia Para describirla hay que

comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre

los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten

PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS

Los investigadores se interesan constantemente en las diferencias entre dos

poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado

civil profesioacuten color de ojos preferencia por una marca etc)

Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de

contingenciardquo

Se puede realizar una prueba para la diferencia entre dos proporciones

sobre la base de muestras independientes usaacutendose como instrumento la prueba

de chi cuadrado

El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es

la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se

podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda

Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la

ecuacioacuten

n

nnE CR

donde

nR nuacutemero total en el rengloacuten

nC nuacutemero total en la columna

n tamantildeo total de la muestra

El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado

entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia

al cuadrado se divide entre la frecuencia esperada de la celda

La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se

rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el

valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados

de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el

tamantildeo de la muestra

CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD

Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a

las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se

puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la

distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado

siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal

Por consiguiente al probar la diferencia entre las dos proporciones la

distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes

Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia

direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten

normal

La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede

ilustrar mediante el siguiente ejemplo

Cuartos de bantildeos modernos

Cocina moderna Caren

cia

existenc

ia

totales

Carencia 72 8 80

Existencia 7 146 153

La hipoacutetesis nula y alternativa seriacutean

YN ppH 0

YN ppH 0

Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de

significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute

Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H

A partir de la informacioacuten del cuadro

10080

8

N

NSN

n

Xp 95420

153

146

Y

YSY

n

Xp

A partir de la expresioacuten

21

21

111

nnpp

pPZ SS

donde

661015380

1468

p

por lo tanto

0813

153

1

80

133906610

95420100

Z

Totales 79 154 223

Dado que 1960813 Z se rechaza la 0H por lo tanto hay

diferencia entre las dos proporciones

Usando la prueba de chi cuadrado y la tabla de contingencia de este

ejemplo se tiene

Las frecuencias teoacutericas se pueden obtener a partir de la siguiente

ecuacioacuten

n

nnE CR

Por lo tanto se tiene

1227233

7980E 8852

233

15480E

8851233

79153E 12101

233

154153E

Chi cuadrado se obtiene a partir de la expresioacuten

E

EOX

2

2

A partir de la tabla se tiene

O E (O ndash E) (O ndash E)2

(O ndash E)2E

7

2

2

712

+4488 20142144 742704

7 5

188

- 4488 20142144 388245

8 5 -4488 20142144 380903

288

1

46

1

0112

+4488 20142144 199191

1711043

10431712 CALCULADOX

Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el

84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo

tanto hay diferencia entre las dos proporciones

Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la

distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos

distribuciones que a un nivel de significancia de 005 el valor de 196 es el

cuadrado de 3 841 es decir 22 ZX

CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA

La afirmacioacuten de que no existen diferencias entre proporciones significa

que las dos variables son independientes Cuando las conclusiones se presentan en

esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo

Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que

no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la

hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos

variables Independientemente de que la prueba de chi cuadrado se considera una

prueba de diferencia entre dos proporciones o una prueba de independencia los

caacutelculos y resultados son exactamente los mismos

CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE

Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o

intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que

ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de

probabilidades

Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que

seguir varios pasos Primero se tiene que establecer la distribucioacuten de

probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada

paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la

media) se deben establecer mediante hipoacutetesis o estimarlos con base a la

informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para

determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o

intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado

para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la

informacioacuten

BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON

La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de

Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la

cantidad de automoacuteviles estacionados en una cochera cubierta siguen una

distribucioacuten de Poisson 0H

En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero

de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una

muestra aleatoria de 233 casas

Numero de automoacuteviles Frecuencia

0 61

1 151

2 21

233

Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados

de la distribucioacuten de frecuencia

No de automoacuteviles Frecuencia observada On

0 61 0

1 151 151

2 21 42

233 193

808280233

193

1

n

On

X

n

i por lo tanto 80X

El valor de la media muestral se utilizara como el estimado de X

Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)

y se obtiene la frecuencia teoacuterica para cada una

Automoacutevil

n

Frecuencia

O

Probabilidad

XP

Frecuencia (E)

XPn

0 61 04493 104687

1 151 03595 87764

2 21 01438 33505

Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de

significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX

El valor calculado de chi cuadrado es

50679

2

2

K

CALCULADO

E

EOX

Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de

automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una

distribucioacuten de Poisson

CORRECCIOacuteN DE YATES

Cuando se aplican a datos discretos los resultados para distribuciones

continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres

comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de

Yates la cual viene dada mediante la expresioacuten

E

EOX CALCULADO

502

2

En general la correccioacuten se hace solamente cuando el numero de grados

de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos

resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en

relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia

esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi

cuadrado corregido y no corregido Si ambos valores conducen a la misma

conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se

presentan dificultades Si conducen a conclusiones diferentes se puede o bien

incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear

meacutetodos de probabilidad exactos

El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente

ejemplo

En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces

Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de

significancia del 005

No de caras Frecuencia Probabilidad Frecuencia (E)

Cara 115 05 100

cruce 85 05 100

2054

100

0510085

100

0510011522

2

CALCULADOX

Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado

con correccioacuten de Yates es

8432 TABULADOX

Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha

PRUEBA EXACTA DE FISHER

Para examinar la igualdad de las varianzas de dos poblaciones

independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de

las varianzas de las dos muestras Suponiendo que la informacioacuten de cada

poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2

2

2

1 SS sigue una

distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso

estadiacutestico RA Fisher

Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de

grados de libertad los grados de libertad en el numerador y en el denominador

la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea

2

2

2

111 21

S

SF nn

donde

n1 = tamantildeo de muestra en el grupo 1

n2 = tamantildeo de muestra en el grupo 2

n1 ndash 1 = grados de libertad en el grupo 1

n2 ndash 1 = grados de libertad en el grupo 2

2

1S varianza de la muestra en el grupo 1

2

2S varianza de la muestra en el grupo 2

Al probar la igualdad de dos varianzas se pueden emplear pruebas de una

cola o de dos colas

El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente

ejemplo

Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas

alta en la planta A que en la planta B Para determinar la variabilidad se puede

establecer una prueba de una cola en la forma siguiente

22 BAOH

22

1 BAH

Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta

A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta

ubicada en la cola superior de la distribucioacuten

Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de

libertad en el numerador y 19 en el denominador a un nivel de significancia de

001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene

71162 AS y 20142 BS por lo tanto

38512014

71162

2

1924 F como 1385 lt

292 no se rechaza la hipoacutetesis nula ( OH )

CONCLUSIOacuteN

La conclusioacuten que los resultados de una medida variable es la causa de

variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten

estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero

no puede reclamar legitimidad

La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en

describir la distribucioacuten de las variables estudiadas y en particular de los datos

numeacutericos Ademaacutes de las medidas descriptivas correspondientes el

comportamiento de estas variables puede explorarse graacuteficamente de un modo

muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro

organizador de las ciencias computarizadas y el modelo que nos dota de un

mejor razonamiento para implementar programas eficientes En este sentido la

combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un

reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en

colegios y universidades

Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de

combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y

evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras

loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre

operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten

juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la

teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones

simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades

que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea

BIBLIOGRAFIacuteA

AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis

Third Edition Texts in Statistical Science Chapman and Hall

BOXG E P HUNTER W G HUNTER JS (1978) Statistics for

Experimenters John Wiley amp Sons

BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores

Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de

Modelos Ed Revertsbquo SA

Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed

Piraacutemide

Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten

(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica

Matemaacutetica I Universidad de Antioquia

Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma

Madrid

Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill

Meacutexico

Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten

yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico

Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw

ndashHill 4ta Edicioacuten Colombia

CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana

Meacutexico

COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas

COX DR (1958) Planning of experiments New York John Wiley amp Sons

DANIEL C Applications of Statistics to Industrial Experimentation Willey

DAVIES OL The Design and Analysis of Industrial Experiments Hafner

(McMillan)

DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias

Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico

SA de CV Meacutexico

De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H

(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico

Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta

Estadiacutestica Editorial Microsoft corporation USA

ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial

Limusa SA Meacutexico

EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis

Arnold

FEDERER W (1965) Experimental design Oxford Publ Co

GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la

Varianza Grupo Editorial Universitario

FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico

McGraw Hill

FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque

ModernoEditorial SA Meacutexico

George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y

Meacutetodosrdquo Ed McGraw-Hill

GILL JL (1978) Design and Analysis of Experiments in the Animal and

Medical Sciences Iowa State University Press

JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression

and Experimental Design Springer-Verlag

Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor

Caracas

GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining

Institute

GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data

Mining Institute

Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial

Bourgeoacuten Caracas

Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la

EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute

Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial

BourgeoacutenCA Caracas ndash Venezuela

HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis

Multivariante 5ordf Edicioacuten Prentice Hall

JOBSON JD (1992) Applied Multivariate Data Analysis Volume II

Categorical and Multivariate Methods Springer-Verlag

KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial

Hispanoamericana Meacutexico

KIRK RE Experimental Design Procedures for the Behavioral Sciencies

BrooksCole Publishing Company

LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e

inferencia Estadiacutestica Editorial Limusa Meacutexico

LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV

Grupo Noriega Editores Meacutexico

LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial

HARLA Meacutexico

LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta

edicioacuten Editorial McGaw-Hill Usa

Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial

Hispanoameacuterica VI edicioacuten Meacutexico

LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire

Multidimensionnelle 3ordf Edition DUNOD

LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e

Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB

Caracas- Venezuela

LORENZEN T J Anderson V L (1993) Design of experiments A No-Name

Approach Marcel Dekker Inc

Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc

(1999) SPSS 90 Manual de Usuario SPSS Chicago

MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis

Academic Press

Enfocados hacia SPSS

Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de

wwwspssparatodoscom 2005

MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten

Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla

Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea

Ediciones Alfaomega SAN Meacutexico

MASON RL Statistical Design and Analysis of Experiments with Applications

to Engineering and Science John Wiley amp Sons New York

MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y

Economiacutea Editorial Iberoamericana Meacutexico

MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in

agriculture and experimental biology Second edition Chapman amp Hall

MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo

Editorial Iberoameacuterica

MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers

John Wiley amp Sons

Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial

Reverte Mejicana Meacutexico

Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da

Edicioacuten Meacutexico

Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc

Graw Hill

PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones

Editorial Limusa Meacutexico

NETER J et al Applied Linear Statistical Models Regression Analysis of

Variance and Experimental Designs Library of Congress Cataloging Publication

Data

OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp

RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo

Editorial Universitario

PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos

Lineales y Series Temporales Vol 1 y 2 Alianza Editorial

Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores

Spain SA Espantildea 2005

PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial

Mir Moscuacute

RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed

McGraw-Hill

Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca

UCV Caracas ndash Venezuela

RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE

Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en

Psicologiacuteardquo p 1

SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons

Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti

Caracas ndash Venezuela

Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores

deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico

Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica

Editorial Harla Meacutexico

STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y

procedimientos Segunda edicioacuten McGraw Hill

SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas

Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1

Ediciones UNESR Caracas

URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante

Coartiacuteculo Plan Nuevo Editorial AC

VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II

Anaacutelisis Multivariante) Mc-Graw Hill

Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows

Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea

2002

WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros

Editorial Interamericana Meacutexico

Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8

Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage

Learning Editores p 364 ISBN 9706861947

Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea

Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea

Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de

CV Meacutexico

Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para

Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico

DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR

httpesmwikipediaorgwikiSPSS

httpwwwbuenastareascomensayosque-es-el-SPSS1465478html

httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-

del-software-estadistico-integral-spss-base-160

httpesanswersyahoocomquestionindexqid=20070727073908aatuamw

httpwwwslidesharenetleticiagpestructura-de-spss-3126476

httpwwwehowenespanolcomprograma-spss-sobre_48697

httpwwwugres~bioestmedicinamanual_spsspdf

httpwwwmonografiascomtrabajos12tutortutorshtml

httpwwwspsscom

wwwspssparatodoscom

httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html

httpwwwspssfreecomcapitulotreshtml

httpwwwuvesRELIEVEemail relieveuves

httpwwwscribdcomdochellipspss-introduccioacuten

httpeswikipediaorgwikiSPSS

httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd

f

httpwwwspsscomaressuccessargentinashtml

httpeswikipediaorgwikiSPSS

httpwww-01ibmcomsoftwareesanalyticsspss

httppsicofcepurvesspssindex0htm

httpssitesgooglecomsiteestadisticaconelspss

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpe-stadisticabioucmesweb_spssindice_spsshtml

httpwwwquimicaurvesquimiogeneralanovacastpdf

httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da

tosyMultivariable14anova1_SPSSpdf

httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800

20AnE1lisis20de20Varianzaspdf

httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-

pearson

httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf

httpwwwuoceduin3emathdocsRegresionLinealpdf

httpeswikipediaorgwikiRegresiC3B3n_lineal

httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES

ION_LINEAL_CON_SPSSpdf

httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN

EAL20SIMPLE20CON20SPSSpdf

httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE

SION_LINEAL_CON_SPSSpdf

httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm

httpeswikipediaorgwikiNivel_de_medida

httphtmlrincondelvagocomregresion-lineal-simplehtml

httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp

lepdf

httpwwwvitutorcomestadisticabi8html

httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf

httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-

Martinez_1pdf

httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml

httpesslidesharenetpatolinkecuacin-de-regresin-lineal

httpeswikipediaorgwikiMC3ADnimos_cuadrados

httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios

httpwwwwordreferencecomdefinicioncorrelaciC3B3n

httpwwwditutorcomestadistica_2correlacion_estadisticahtml

httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson

httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n

httpeswikipediaorgwikiMatriz_de_correlaciC3B3n

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpwwwinfecepiunizares

httpwwwltbioestadisticaumaes

httpwwwuaqmxmatematicasestadisticasxu3html

httpwwwmembers-americastripodcom

httpwwwmsiplceorg

httpwwwbnvcocrsesionnotaaspg

httpwwwaltavistacom

httpwwwauyantepuycom

httpwwwinees

httpwwwudeccl

httpwwwrincondelvagocom

httpwwwmonografiascom

httpwwwfestadisticafguamesindicadoresiprihtml

httpwwwuaqmxmatematicasestadisticaxu3html

httpwwwinegoboiwd0801htmlE

httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm

httpwwwitlpedumx

httpwwweclaevespanovestadisticasna93nnsnann7eshtml

httpw3moritesmmx~cmendozamaestestoohtml

httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml

httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion

httpwwwunleduarfaveseiencuestasindexhtml

httpwwwmonografiascomtrabajos11operaoperashtml

httpwwwmonografiascomtrabajos6hisohisoshtml

httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos

httpwwwmonografiascomtrabajos16sistema-operativosistema-

operativoshtmlTIPPOS

httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-

operativoshtml

httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei

httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml

httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-

operativo

httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software

httpwwwsscccoclinformaticaconceptoshtml

httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr

httpwwwcadcommxhistoria_de_la_computacionhtm

httpwwweswikipediaorgwikiBus_(informC3A1tica)

httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla

httpwwwcavsicompreguntasrespuestasque-es-el-teclado

httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm

Page 7: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,

PRUEBAS NO PARAMEacuteTRICAS

Se denominan pruebas no parameacutetricas aquellas que no presuponen una

distribucioacuten de probabilidad para los datos por ello se conocen tambieacuten como de

distribucioacuten libre (distribution free) En la mayor parte de ellas los resultados

estadiacutesticos se derivan uacutenicamente a partir de procedimientos de ordenacioacuten y

recuento por lo que su base loacutegica es de faacutecil comprensioacuten Cuando trabajamos

con muestras pequentildeas (n lt 10) en las que se desconoce si es vaacutelido suponer la

normalidad de los datos conviene utilizar pruebas no parameacutetricas al menos para

corroborar los resultados obtenidos a partir de la utilizacioacuten de la teoriacutea basada en

la normal

Cuando se analizan datos medidos por una variable cuantitativa continua

las pruebas estadiacutesticas de estimacioacuten y contraste frecuentemente empleadas se

basan en suponer que se ha obtenido una muestra aleatoria de una distribucioacuten de

probabilidad de tipo normal o de Gauss Pero en muchas ocasiones esta

suposicioacuten no resulta vaacutelida y en otras la sospecha de que no sea adecuada no

resulta faacutecil de comprobar por tratarse de muestras pequentildeas En estos casos

disponemos de dos posibles mecanismos los datos se pueden transformar de tal

manera que sigan una distribucioacuten normal o bien se puede acudir a pruebas

estadiacutesticas que no se basan en ninguna suposicioacuten en cuanto a la distribucioacuten de

probabilidad a partir de la que fueron obtenidos los datos y por ello se denominan

pruebas no parameacutetricas (distribution free)

La mayoriacutea de las pruebas de hipoacutetesis requieren suposiciones especiacuteficas

acerca de la poblacioacuten o poblaciones que se muestran En muchos casos debemos

suponer que las poblaciones tienen maacutes o menos la forma de distribuciones

normales o que se conocen sus varianzas o se sabe que son iguales o bien que las

muestras son independientes Como hay muchos casos donde no se pueden

cumplir estas suposiciones los estadiacutesticos han generado teacutecnicas alternativas

basadas en suposiciones menos estrictas que se han dado a conocer como

ldquoPruebas no parametricasrdquo

En estos casos se emplea como paraacutemetro de centralizacioacuten la mediana

que es aquel punto para el que el valor de X estaacute el 50 de las veces por debajo y

el 50 por encima

Propiedades

1 No se relacionan con el estudio de un paraacutemetro de la poblacioacuten

Por lo general cuando se hace referencia a pruebas no parameacutetricas se puede estar

hablando tanto de las no parameacutetricas como de las libres de distribucioacuten

(distribution free tests)

Las dos indicaciones maacutes importantes que se deben tener en cuenta para utilizar

una prueba no parameacutetrica son que

1 la distribucioacuten de la poblacioacuten no sea normal

2 la escala de medicioacuten de la variable en cuestioacuten sea categoacuterica

Los meacutetodos no parameacutetricos son menos poderosos que los parameacutetricos Esto

quiere decir que es maacutes difiacutecil rechazar la hipoacutetesis nula con las pruebas no

parameacutetricas

Por esa razoacuten los estadiacutesticos por lo general recurren a los meacutetodos no

parameacutetricos soacutelo cuando los datos no cumplen con los supuestos parameacutetricos

Sin embargo hay problemas de investigacioacuten en los que las variables categoacutericas

son las indicadas y por lo tanto soacutelo un meacutetodo no parameacutetrico es el indicado Los

pasos en las pruebas de hipoacutetesis no parameacutetricas son los mismos de las

parameacutetricas Los cambios por lo general se limitan a cambios en la foacutermula para

obtener el valor observado y en la tabla que se utiliza Pero se habla de hipoacutetesis

nula nivel de significacioacuten error tipo I y tipo II etc

El uso de meacutetodos no parametricos ofrece numerosas ventajas

1 los meacutetodos no parametricos se pueden usar con todo tipos de datos

ndash informacioacuten cualitativa (de escala nominal) informacioacuten en forma de rangos

(escala ordinal) asiacute como informacioacuten medida de un modo mas exacto (escala de

intervalo o de razoacuten)

2 por lo general son faacuteciles de aplicar y raacutepidos de calcular con

tamantildeos pequentildeos de muestra En ocasiones son tan sencillos que basta contar

con la frecuencia con que algunas caracteriacutesticas aparecen en los datos Por lo

tanto a menudo se usan para estudios piloto o preliminares yo en situaciones en

que se desean respuestas raacutepidas

3 hacen menos premisas menos estrictas (mas faacuteciles de cumplir) que

los procedimientos claacutesicos por lo tanto gozan de mayor aplicabilidad y

proporcionan un conjunto de conclusiones mas generales de base mas amplia

4 permiten solucionar problemas que no implican pruebas de

paraacutemetros de poblacioacuten

5 son mas econoacutemicos que los procedimientos claacutesicos ya que el

investigador puede aumentar la potencia y a pesar de ello ahorrar dinero tiempo y

trabajo al recopilar muestras de datos mayores medibles con mas aproximacioacuten

lo que soluciona con mayor rapidez el problema

6 seguacuten el procedimiento seleccionado los meacutetodos no parametricos

pueden ser tan poderosos (o casi tanto) como el procesamiento claacutesico cuando se

cumplen las premisas de este ultimo y quizaacutes sean un poco mas poderosos aun

cuando no se cumplan

Los procedimientos no parametricos tambieacuten ofrecen algunas desventajas

1 no conviene usar meacutetodos no parametricos cuando se pueden

cumplir todas las premisas de los procedimientos claacutesicos y los datos se miden en

una escala bien sea de intervalos de razones A menos de que se empleen

procedimientos claacutesicos en estos casos el investigador no esta aprovechando por

completo los datos Se pierde informacioacuten al convertir datos recopilados (de una

escala de intervalo o de razoacuten) a rangos (escala ordinal) o categoriacuteas (escala

nominal) En particular en esas circunstancias algunas pruebas no parametricas

muy raacutepidas y sencillas tienen mucha menos potencia que los procedimientos

claacutesicos y por lo general se deben evitar

2 seguacuten aumenta el tamantildeo de la muestra en ocasiones el manejo

requerido de datos para los procedimientos no parametricos se hace laborioso a

menos que se disponga de un paquete de computacioacuten adecuado

3 con frecuencia se necesitan tablas especiales de valores

criacuteticos y estas no se obtienen con tanta facilidad como las tablas de los

valores criacuteticos normales t 2X y F Ccedil

Prueba de signos para una sola muestra

Salvo para las pruebas con muestra grande todas las pruebas estaacutendar

concernientes a medias estaacuten basadas en la suposicioacuten de que las poblaciones que

se muestrean tienen aproximadamente la forma de distribuciones normales

Cuando en un caso determinado esta suposicioacuten resulta insostenible la prueba

estaacutendar se puede sustituir por una de varias alternativas no parametricas entre

ellas la ldquoprueba de signosrdquo

La prueba de signos de una sola muestra se aplica cuando se muestrea una

poblacioacuten simeacutetrica continua de manera que la probabilidad de que un valor de la

muestra sea menor que la media o mayor que la media es en ambos casos frac12 Para

probar la hipoacutetesis nula ( O ) contra una hipoacutetesis alternativa apropiada con

base en una muestra aleatoria de tamantildeo n se sustituye cada valor de la muestra

mayor que O por un signo de mas y cada valor de la muestra menor que O por

un signo de menos despueacutes se aprueba la hipoacutetesis nula de que estos signos de

mas y menos son valores de una variable aleatoria que tiene distribucioacuten binomial

con 2

1p (si un valor de la muestra es igual a O simplemente lo rechazamos)

Prueba de suma de rangos

Se puede utilizar cuando se desea probar una hipoacutetesis relacionada a un

paraacutemetro que refleje una tendencia central Cuando no se cumplen las premisas

de la prueba t el procedimiento de Wilcoxon es probable que sea mas potente

para detectar la existencia de diferencias importantes que su contraparte

correspondiente

Para llevar a cabo la prueba de rangos y signos de Wilcoxon se puede

aplicar el siguiente procedimiento de seis pasos

1 para cada partiacutecula en una muestra de n partidas se obtiene un

resultado de diferencia Di

2 despueacutes no se toman en cuenta los signos + y ndash y se obtiene un

grupo de n diferencias absolutas iD

3 se omite de cualquier anaacutelisis adicional cualquier diferencia

absoluta con resultados de 0 con lo cual se obtiene un grupo de n resultados de

diferencias absolutas que no sean cero donde n

4 despueacutes se asignan rangos Ri desde uno hasta n a cada una de las

iD de modo que el resultado de diferencia absoluta mas pequentildeo obtiene una

clasificacioacuten de uno y el mayor de n Por la falta de precisioacuten en el proceso de

medicioacuten si dos o mas iD son iguales a cada una se asigna el ldquorango promediordquo

de los rangos que de lo contrario se les hubieran asignado individualmente si no

hubiera ocurrido la igualdad de los datos

5 ahora se asignan de nuevo el siacutembolo + o el signo ndash a cada uno de

los n rangos de Ri dependiendo de si originalmente Di era positiva o negativa

6 la prueba estadiacutestica de Wilcoxon W se obtiene como la suma de

las clasificaciones +

n

i

iRW1

Para muestras de n 20 se puede utilizar tablas para obtener los valores

criacuteticos de la prueba estadiacutestica W tanto para las pruebas de una cola como de dos

a diversos niveles de significacioacuten Se rechaza la hipoacutetesis nula en una prueba de

dos colas si el valor observado W es igual o excede al valor critico superior o es

igual o inferior al valor critico inferior Se rechaza la hipoacutetesis nula en una prueba

de una cola en direccioacuten positiva si el valor observado W es igual o excede el

valor critico superior Se rechaza la hipoacutetesis nula para una prueba de una cola en

direccioacuten negativa si el valor observado de w es inferior o igual al valor critico

inferior

Para nge20 la prueba estadiacutestica W tiene distribucioacuten aproximadamente

normal y se puede utilizar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis nula

W

WWZ

VARIABLES ALEATORIA Y COMO SE DIVIDEN

Una variable es aleatoria si toma diferentes valores como resultado de un

experimento aleatorio Puede ser discreta o continua Si puede tomar soacutelo un

nuacutemero limitado de valores entonces es una variable aleatoria discreta En el otro

extremo si puede tomar cualquier valor dentro de un intervalo dado entonces se

trata de una variable aleatoria continua

Se puede pensar en una variable aleatoria como un valor o una magnitud

que cambia de una presentacioacuten a otra sin seguir una secuencia predecible Los

valores de una variable aleatoria son los valores numeacutericos correspondientes a

cada posible resultado de un experimento aleatorio

La distribucioacuten de probabilidad de una variable aleatoria proporciona una

probabilidad para cada valor posible y estas probabilidades deben sumar 1

VALOR ESPERADO DE UNA VARIABLE ALEATORIA

El valor esperado es una idea fundamental en el estudio de las distribuciones de

probabilidad

Para obtener el valor esperado de una variable aleatoria discreta se

multiplica cada valor que la variable puede tomar por la probabilidad de

presentacioacuten de ese valor y luego se suman esos productos Es un promedio

pesado de los resultados que se esperan en el futuro El valor esperado pesa cada

resultado posible con respecto a la frecuencia con que se espera se que presente

En consecuencia las presentaciones maacutes comunes tienen asignadas un peso

mayor que las menos comunes

El valor esperado tambieacuten puede ser obtenido a partir de estimaciones

subjetivas En ese caso el valor esperado no es maacutes que la representacioacuten de las

convicciones personales acerca del resultado posible

VARIABLES ALEATORIAS DISCRETAS

Variable que toma un nuacutemero finito o infinito de valores numerables

Sean x1 x2 x3 xn los distintos valores que puede tomar la variable

aleatoria

Y p(x1) p(x2) p(xn) su probabilidad

Los pares de valores (xj p(xj)) constituyen la distribucioacuten de probabilidades de la

variable aleatoria

p(x) se denomina funcioacuten de probabilidad y debe cumplir con las siguientes

propiedades

0 lt p(xj) lt 1 (p(x) es una probabilidad y por lo tanto debe tomar valores

entre 0 y 1)

1)( jxP (la suma de probabilidades repartidas entre todos los valores

de la variable debe ser igual a 1)

De la misma manera que calculamos frecuencias acumuladas podemos acumular

probabilidades obteniendo la funcioacuten de distribucioacuten de probabilidades

Esta funcioacuten representa la probabilidad de que la variable aleatoria sea menor o

igual que un determinado valor

F(xj) = P (X lt xj)

Graacuteficamente la funcioacuten aumenta de a saltos ya que entre dos valores

consecutivos de una variable discreta no puede tomar valores intermedios

VARIABLES ALEATORIAS CONTINUAS

En este caso en lugar de trabajar con la probabilidad de valores

particulares de la variable resulta maacutes apropiado calcular probabilidades

asociadas a intervalos Para distribuir propiedades se usa una funcioacuten que mide

concentracioacuten de probabilidades alrededor de un punto que se denomina

funcioacuten de densidad de probabilidad (fdp) y se denota como f(x)

Una funcioacuten de densidad de probabilidad debe cumplir con las siguientes

propiedades

F(x) gt 0 (la funcioacuten es no negativa para cualquier valor de x f(x) no es

una probabilidad y puede valer maacutes de 1)

el aacuterea bajo la curva de la funcioacuten vale 1)

La funcioacuten de distribucioacuten para una variable aleatoria continua se calcula

F(a) = P(X lt

La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula

P (alt x lt b) = F(b) - F(a)

La probabilidad de que la variable tome un valor particular se puede expresar

como

F(c) - F(c) = 0

DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO

Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia

valores de una variable aleatoria con sus respectivas probabilidades es

decir Probabilidad de x = Funcioacuten de x

Las distribuciones se caracterizan por una foacutermula que determina el tipo de

distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio

muestral

En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una

funcioacuten de la probabilidad que representa los resultados que se van obteniendo en

un experimento aleatorio

Asiacute para un nuacutemero dado x la probabilidad es

A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la

variable X y representa la probabilidad de que la variable tome el valor desde

hasta x

Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de

probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad

Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos

y seraacuten mutuamente excluyentes y su suma es el

suceso por lo que tenemos entonces que

y finalmente

Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos

los valores de la variable aleatoria x conoceremos completamente la distribucioacuten

de probabilidad de la variable

Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten

de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente

Es decir la probabilidad de todo el espacio muestral es 1 tal y como

establece la teoriacutea de la probabilidad y por otra parte

Es decir la probabilidad del suceso nulo es cero

Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de

probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes

praacutectico el uso de la funcioacuten de densidad

En el caso de una variable discreta la distribucioacuten puede describirse

mediante una funcioacuten de probabilidad que para cada valor de x de la variable X

determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de

una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de

distribucioacuten la que para cada valor provee la probabilidad de no ser superado

evidentemente el valor de la funcioacuten de distribucioacuten es igual

a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo

inferior del dominio de la variable hasta x inclusive Lista de los resultados de un

experimento con las probabilidades que se esperariacutean ver asociadas con cada

resultado

Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores

diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12

En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica

Para el caso de 1 solo dado donde todos los valores tienen la misma

probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme

Prueba de aleatoriedad

Con frecuencia se supone que los datos recopilados constituyen una

muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la

utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash

Wolfowitz de corridas de una muestra para aleatoriedadrdquo

Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o

la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos

siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la

partida tiene una propiedad en particular o de la cantidad o magnitud en que se

posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la

sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con

distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente

de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que

la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las

partidas que la preceden o las que la suceden en forma tal que la probabilidad de

su ocurrencia varia de una posicioacuten a otra el proceso no se considera como

aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando

esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en

forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico

Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el

tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico

de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una

prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede

rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la

sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de

una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2

exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por

consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis de aleatoriedad

U

UUZ

donde

U = numero total de corridas

U = valor medio de U 12 21

n

nnU

U = desviacioacuten estaacutendar de U 1

222

2121

nn

nnnnnU

n1 = numero de eacutexitos en la muestra

n2 = numero de fracasos en la muestra

n = tamantildeo de la muestra n = n1 + n2

PRUEBA DE McNEMAR

Suele darse el caso en que se desean comparar las proporciones de los

datos de muestras tomados de poblaciones relacionadas En este caso se quisiera

determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a

alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea

determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y

otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede

utilizar la prueba desarrollada por McNemar

El principal intereacutes es determinar si hay diferencia entre las dos

proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta

que el otro (prueba de una cola)

La prueba estadiacutestica para la prueba de McNemar es

CB

CBZ

PRUEBA U DE MANN ndash WHITNEY

Es una alternativa no parametrica a la prueba t de dos muestras para la

diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula

μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos

la forma de distribuciones normales de hecho la prueba solo requiere que las

poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no

importa si se cumple o no esta suposicioacuten

Estadiacutesticos U1 y U2

111

2112

1 W

nnnnU

222

2122

1 W

nnnnU

PRUEBA DE RACHAS

Son todas las diferencias que tiene el mismo signo y se presentan en una

misma fila Una serie de n diferencias puede tener solamente una racha (toda

positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las

rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de

poblaciones con la misma distribucioacuten de frecuencias Colocamos las

observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces

contamos el numero de rachas item de cada una de las muestras Si hay menos

rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales

rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten

La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de

que las observaciones se han sacado aleatoriamente de una sola poblacioacuten

Para hacer esto se halla la mediana de la muestra y se designa las

observaciones situadas por debajo de la mediana por un signo menos (-) y las

observaciones situadas por encima de la mediana por un signo (+) Si el numero

de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado

rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el

numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10

puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la

tabla normal con

u

uu

z

2

1

12

21

21

NN

NNu

)1()(

2(2

21

2

21

2121212

NNNN

NNNNNNu

DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES

DISTRIBUCIONES DE EJEMPLO Y USO

DISTRIBUCIOacuteN NORMAL O GAUSSIANA

Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que

multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal

Esta distribucioacuten de caracteriza porque los valores se distribuyen formando

una campana de Gauss en torno a un valor central que coincide con el valor

medio de la distribucioacuten

Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a

la izquierda

Esta distribucioacuten viene definida por dos paraacutemetros

X N (m S2)

m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro

de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores

estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores

estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de

ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten

estaacutendar

Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina

normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo

que permiten obtener esos mismos valores donde se recoge la probabilidad

acumulada para cada punto de la curva de esta distribucioacuten

Ademaacutes toda distribucioacuten normal se puede transformar en una normal

tipificada

Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con

media 10 y varianza 4 Transformarla en una normal tipificada

X N (10 4)

Para transformarla en una normal tipificada se crea una nueva variable (Y)

que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica

(que es la raiacutez cuadrada de la varianza)

En el ejemplo la nueva variable seriacutea

Esta nueva variable se distribuye como una normal tipificada

permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor

Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos

indicado de que las probabilidades para cada valor de la curva se encuentran

recogidas en una tabla

MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)

La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten

normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta

distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros

y lo que representamos del modo si su funcioacuten de densidad

es

Observacioacuten

Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y

la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes

adelante65

La forma de la funcioacuten de densidad es la llamada campana de Gauss

Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten

normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1

Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un

uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto

con lo cual en coinciden la media la mediana

y la moda y por uacuteltimo calcular sus puntos de inflexioacuten

El soporte de la distribucioacuten es todo de modo que la mayor parte de la

masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se

encuentra concentrado alrededor de la media y las ramas de la curva se extienden

asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la

media es posible (aunque poco probable)

La forma de la campana de Gauss depende de los paraacutemetros y

indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)

Figura Distribuciones gaussianas con diferentes medias e igual

dispersioacuten

(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor

sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor

de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea

``maacutes aplastado seraacute

Figura Distribuciones gaussianas con igual media pero varianza

diferente

La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes

adelante que es

Como consecuencia la distribucioacuten normal es reproductiva con respecto a

los paraacutemetros y ya que

Observacioacuten

Como se ha mencionado anteriormente la ley de probabilidad gaussiana la

encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza

por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el

de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que

apuntar un hecho negativo para esta ley de probabilidad

La funcioacuten no posee primitiva66

conocida67

Las consecuencias desde el punto de vista praacutectico son importantes ya que

eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de

la normal y nos tenemos que limitar a decir que

sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente

esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho

puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto

se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en

problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde

se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie

limitada de valores xi dados Normalmente F se encuentra tabulada para una

distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten

normal tipificada

En el caso de que tengamos una distribucioacuten diferente se

obtiene Z haciendo el siguiente cambio

De manera general se tiene

Proposicioacuten (Cambio de origen y escala)

Sean Entonces

Este resultado puede ser utilizado del siguiente modo Si y nos

interesa calcular

1 Hacemos el cambio y calculamos

2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de

modo aproximado) Como

tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada

Ejemplo

Supongamos que cierto fenoacutemeno pueda ser representado mediante una

va y queremos calcular la probabilidad de que Xtome un valor

entre 39 y 48 es decir

Comenzamos haciendo el cambio de variable

de modo que

Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que

hemos mencionado anteriormente

Proposicioacuten

Sea Entonces

Demostracioacuten

Por ser la normal una ley de probabilidad se tiene que

es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con

respecto a se obtiene el valor 0

luego

Para demostrar la igualdad entre la y basta con aplicar la misma

teacutecnica pero esta vez derivando con respecto a

Luego

Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en

primer lugar la va tipificada de X

y calculamos

Como por la proposicioacuten 5 deducimos que

CURVA NORMAL ESTANDARIZADA

Una variable numeacuterica puede clasificarse como discreta o continua Las

variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas

con la idea de contar Las variables continuas se pueden asociar con la idea de

medir utilizando fracciones y decimales Cuando la variable es continua el

modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal

El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten

normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran

cantidad de variables continuas

El modelo matemaacutetico

La funcioacuten matemaacutetica que se usa como modelo es

e = 271

π = 314

μx = media de la poblacioacuten

σx = desviacioacuten estaacutendar de la poblacioacuten

x = un valor de la variable continua

Como e y π son constantes la forma de la curva normal depende

solamente de los dos parametros de la distribucioacuten normal la media μx y la

desviacioacuten estaacutendar σx

Las diferentes curvas normales van a variar dependiendo de esos dos

paraacutemetros

En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar

visualmente como una curva en forma de campana El aacuterea debajo de esta curva se

halla por medio del integral de la funcioacuten y corresponde al por ciento o la

proporcioacuten de puntuaciones que se encuentran en el intervalo dado

Propiedades de las distribuciones normales

a Son simeacutetricas y tienen forma de campana

b Al ser simeacutetricas la media la moda y la mediana coinciden

c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea

de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media

d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la

curva se encuentra a tres desviaciones estaacutendar de la media

En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral

de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de

diferentes secciones de la curva o se utiliza la computadora para calcular ese valor

del aacuterea

La distribucioacuten normal estandarizada

Puesto que hay un nuacutemero infinito de combinaciones para los dos

paraacutemetros hay un nuacutemero infinito de curvas normales diferentes

Este problema se ha resuelto praacutecticamente al transformar los valores de

todas las distribuciones normales a los valores de una distribucioacuten normal

estandarizada representada por la curva normal estandarizada (standard normal

curve)

Las puntuaciones estandarizadas se logran restando la media a cada

observacioacuten y dividiendo entre la desviacioacuten estaacutendar

donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar

Propiedades de la distribucioacuten normal estandarizada

μ z = 0

σ z = 1

En muchas ocasiones se quieren comparar puntuaciones que pertenecen a

dos distribuciones normales diferentes La diferencia entre las dos distribuciones

radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo

la comparacioacuten se hace posible si se convierten las puntuaciones de ambas

distribuciones a puntuaciones z que corresponden a la distribucioacuten normal

estandarizada

Percentiles y rangos percentiles de una distribucioacuten normal estandarizada

Si se desea hallar la percentiles o el rango percentil en una distribucioacuten

normal no estandarizada se recurre al procedimiento de convertir las puntuaciones

de la distribucioacuten normal dada a puntuaciones z que corresponden a la

distribucioacuten normal estandarizada

Estos valores en la distribucioacuten normal estandarizada se pueden obtener

por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en

las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el

intervalo dado

Es necesario visualizar siempre el aacuterea debajo de la curva como el por

ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo

dado

Cuando una distribucioacuten de puntuaciones es normal estandarizada la

pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar

en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o

cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten

dada

DISTRIBUCIOacuteN GAMMA

Una variable aleatoria X asociada a un experimento aleatorio tiene una

distribucioacuten GAMMA si se caracteriza por las siguientes propiedades

Algunas alternativas de funciones de densidad se pueden ver en la graacutefica

del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)

respectivamente =1

=1

La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo

III

El modelo Gamma se ha utilizado frecuentemente en variables tales como

ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el

intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson

ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900

ndash Flujos maacuteximos MARKOVIC 1965

ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965

ndash Altura de la precipitacioacuten mensual WHITCOMB 1940

ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia

infin

ndash Ingresos familiares

ndash Edad del hombre al contraer matrimonio por primera vez

ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en

subestaciones a una frecuencia part

Ejemplo

Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos

de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia

promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo

de tiempo se encuentre hasta que ocurre el segundo ciclo

a Dentro de una desviacioacuten con respecto del tiempo promedio

b A maacutes de dos desviaciones por encima de la media

Solucioacuten

X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en

horas

Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)

= 2

Y Nuacutemero de ciclos hora ---------Y~P( =002)

E(Y) = 002 =

X ~ G(2 002)

Ejemplo

En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de

kilovatios por hora puede considerarse como una variable aleatoria con

distribucioacuten GAMMA de paraacutemetros = 3 y

= 05

La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de

KWhora

iquestCuaacutel es la probabilidad de que este abastecimientos sea

a Insuficiente en un diacutea cualquiera

b Se consuman entre 3 y 8 millones de K WHora

c c Encuentre E(x) y V(x)

SOLUCIOacuteN

DISTRIBUCIOacuteN PARETO

En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad

continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores

es

Su funcioacuten de distribucioacuten es

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto

son

El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (

DISTRIBUCIOacuteN T DE STUDENT

Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una

distribucioacuten t con n grados de libertad

Cuando n--gtinfinito a curva t coincide com la normal estandarizada

FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX

MOMENTOS

La distribucioacuten -Student se construye como un cociente entre una normal

y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-

Student con n grados de libertad a la de una va T

donde Este tipo de distribuciones aparece cuando

tenemos n+1 va independientes

y nos interesa la distribucioacuten de

La funcioacuten de densidad de es

Figura Funcioacuten de densidad de una de Student

La distribucioacuten de Student tiene propiedades parecidas a

Es de media cero y simeacutetrica con respecto a la misma

Es algo maacutes dispersa que la normal pero la varianza decrece hasta

1 cuando el nuacutemero de grados de libertad aumenta

Figura Comparacioacuten entre las funciones de densidad de y

Para un nuacutemero alto de grados de libertad se puede aproximar la

distribucioacuten de Student por la normal es decir

Figura Cuando aumentan los grados de libertad la distribucioacuten de

Student se aproxima a la distribucioacuten normal tipificada

Para calcular

DISTRIBUCIOacuteN BETA

Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede

representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un

intervalo de longitud finita Tales como

Proporcioacuten de impurezas en un producto quiacutemico

La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten

La proporcioacuten vendida de un lote durante un tiempo t

La humedad relativa medida en cierto lugar

Porcentaje del costo total destinado a reparacioacuten de maquinaria

Porcentaje de costo adicional destinado a reparacioacuten de maquinaria

La distribucioacuten del tiempo necesario para completar una fase del proyecto

PERT

Evaluacioacuten de programas y teacutecnicas de revisioacuten

Ejemplo

La proporcioacuten de tramos de una autopista que requieren repararse

semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros

= 3 y =2

a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten

b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista

requieren reparacioacuten en un antildeo cualquiera

DISTRIBUCIOacuteN CAUCHY

En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de

Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es

donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene

valor esperado ni varianza

Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V

2 lt 1 el

numero U V tiene la distribucioacuten Cauchy

La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un

grado de libertad

Ejemplo

Sean y dos observaciones independientes de una distribucioacuten

Cauchy con funcioacuten de densidad

Puede demostrarse que si y son tales que entonces la

funcioacuten de verosimilitud de es bimodal

Sean y Supongamos que se desea hacer inferencias sobre el

valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa

Especiacuteficamente interesa encontrar la distribucioacuten final de

Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la

distribucioacuten final de tiene una forma complicada Es conveniente notar sin

embargo que corresponde a la densidad marginal de respecto a la

densidad conjunta

DISTRIBUCIOacuteN BERNOULLI

Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto

suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el

que no lo sea (fracaso) En realidad no se trata maacutes que de una variable

dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello

que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas

obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la

situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este

experimento mediante una va discreta Xque toma los valores X=0 si el suceso no

ocurre y X=1 en caso contrario y que se denota

Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar

una moneda al aire y considerar la va

Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de

probabilidad es

y su funcioacuten de distribucioacuten

Su funcioacuten caracteriacutestica es

Los principales momentos de la X los podemos calcular directamente

o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina

Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)

cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de

intentos

CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE

BERNOULLI

Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la

probabilidad y asegurar que se cumplen las tres condiciones necesarias en

particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del

resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3

requiere que los ensayos o intentos de un proceso de Bernoulli sean

estadiacutesticamente independientes es decir que el resultado de un intento no puede

afectar de ninguacuten modo el resultado de cualquier otro intento

DISTRIBUCIOacuteN EXPONENCIAL

Modelo para variable aleatoria continua que permite representar variables

del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos

Componentes

En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de

probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para

valores x gt 0 es

f(x) = λe - λx

Su funcioacuten de distribucioacuten es

Aqui e significa el nuacutemero e

El valor esperado y la varianza de una variable aleatoria X con

distribucioacuten exponencial son

E[X] = 1 λ

V(X) = 1 λ2

Ejemplo

Ejemplos para la distribucioacuten exponencial son los tiempos dentro

accidentes con probabilidad invariable

La funcioacuten de densidad para λ igual 05 10 y 15

DISTRIBUCIOacuteN MULTINOMIAL

La distribucioacuten multinomial es similar a la distribucioacuten binomial con la

diferencia de que en lugar de dos posibles resultados en cada ensayo

La distribucioacuten multinomial sigue el siguiente modelo

Donde

X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo

que el partido POPO lo hayan votado 3 personas)

n indica el nuacutemero de veces que se ha repetido el suceso (en el

ejemplo 5 veces)

n es factorial de n (en el ejemplo 5 4 3 2 1)

p1 es la probabilidad del suceso X1 (en el ejemplo el 40)

Veamos el ejemplo

Luego

P = 00256

Es decir que la probabilidad de que las 5 personas elegidas hayan votado

de esta manera es tan soacutelo del 256

Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1

Veamos otro ejemplo

En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el

40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4

invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos

Aplicamos el modelo

LuegoP = 00384

Por lo tanto la probabilidad de que el grupo esteacute formado por personas de

estos paiacuteses es tan soacutelo del 384

DISTRIBUCIOacuteN UNIFORME

En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de

probabilidad cuyos valores tienen la misma probabilidad

Caso discreto

Su funcioacuten de probabilidad es en el caso discreto con valores posibles

p(xi) = 1 n

Su funcioacuten de distribucioacuten es en el caso discreto

Su media estadiacutestica es

Caso continuo

Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b

La funcioacuten de densidad en el caso continuo entre a y b es

Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12

Ejemplos

Para un dado perfecto todos los resultados tienen la misma probabilidad 1

6

Calcular variables aleatorias

Las variables aleatorias de probabilidad uniforme pueden calcularse con un

generador de variables aleatorias

DISTRIBUCIOacuteN BINOMIAL

En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad

discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con

probabilidad p de un eacutexito

Su funcioacuten de densidad es

Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)

posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos

((1 - p)n - x

)

El valor esperado de una variable aleatoria de probabilidad binominal es

E[x] = np y su varianza V[x] = np(1 - p)

DISTRIBUCIOacuteN BINOMIAL NEGATIVA

Sobre una sucesioacuten de va de Bernouilli independientes

Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r

eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de

distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo

Su ley de probabilidad se deduce siguiendo el esquema

De nuevo el conjunto de posibles valores de esta va discreta es

Su funcioacuten caracteriacutestica es

y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima

Ejemplo

Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en

operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal

que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda

definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para

intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus

5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones

que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se

necesiten 10 intervenciones

Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por

una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan

4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso

Identificando los paraacutemetros se tiene

Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el

nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy

simple

Y=X+r

Luego

Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente

es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de

que X=10-4=6 Por tanto

La distribucioacuten binomial negativa tambieacuten se puede definir como el

nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas

contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que

DISTRIBUCIOacuteN DE POISSON

Modelo para variable aleatoria discreta que permite calcular la

probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten

discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo

muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos

o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual

a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es

independiente de cuaacutendo se presenta dicho periacuteodo

En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de

probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos

es

Aquiacute e significa el nuacutemero e y x significa el factorial de x

La distribucion de Poisson describe el nuacutemero de sucesos en una unidad

de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un

proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens

en una carrera

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten

Poisson son

E[X] = V[X] = λ

La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos

entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un

conmutador la demanda (necesidades) de los pacientes que requieren servicio en

una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el

nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos

ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una

variable aleatoria discreta que toma valores enteros (0 1 2)

Caacutelculo de la probabilidad de Poisson

La letra X por lo general representa a una variable discreta y puede tomar

valores enteros Utilizamos la letra X para representar a la variable aleatoria y la

letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La

probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson

se calcula con la foacutermula

LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA

DISTRIBUCIOacuteN BINOMIAL

La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la

binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan

cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es

grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan

con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena

aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es

igual o menor que 005 En los casos en que se cumplen estas condiciones

podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media

de la distribucioacuten de Poisson

DISTRIBUCIOacuteN GEOMEacuteTRICA

En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten

probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores

discretos es

P(X = x) = p(1 - p)x - 1

Su funcioacuten de distribucioacuten es

El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media

estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2

Ejemplo

El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es

una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6

DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA

En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de

probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de

masa para valores es

Aqui (a sobre b) es el coeficiente binomial

El valor esperado de una variable aleatoria X de distribucioacuten

hipergeomeacutetrica es

Y su varianza

DISTRIBUCIOacuteN ZETA

En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad

discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos

es

Aqui ζ(s) es la funcioacuten zeta de Rieman con

El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto

DISTRIBUCION CHI CUADRADO

El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una

comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es

diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con

ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno

es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario

estas dos frecuencias acusan una diferencia significativa para por ejemplo un

nivel de significacioacuten del 5

El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la

asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada

por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito

bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor

del famoso libro Statistical Methods for Research Workers (1925) donde se

marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con

Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde

estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y

el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las

pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba

exacta de Fisher

Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico

publicitario presentado a grupos de clientes comparar la rentabilidad de un

proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos

de los turistas por determinados espacios geograacuteficos o por determinados

servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las

frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las

frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o

tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o

de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2

x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos

turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han

ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han

tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula

que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido

en los sitios A y B

Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es

independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo

A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces

alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este

anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos

empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de

las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51

La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten

igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es

2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del

Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del

5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206

podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para

suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B

Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias

observadas empiacutericamente de dos muestras con las frecuencias esperadas o

teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el

Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de

las materias primas perecederas Los resultados son seguacuten atributos cualitativos

los siguientes Primero veremos las frecuencias empiacutericas u observadas

Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten

Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son

131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas

Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y

fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres

columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta

maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x

120 260 = 6046 b2 = 129 x 120 260 = 5954

Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten

igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de

2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de

libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La

diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna

conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten

Es una medida de la discrepancia existente entre las frecuencias

observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso

de frecuencias () debido a que permite determinar las desviaciones entre ellas

ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la

expresioacuten

E

EOX

2

2

Donde

O frecuencia observada

E frecuencia teoacuterica esperada

TEST DE CHI-CUADRADO DE CONTINGENCIA

Un caso particular del test de chi-cuadrado que permite hacer un test sobre

la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-

cuadrado de contingencia Los dos caracteres observados en una misma

poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases

de se denotan las de por Tambieacuten vamos a

denotar

el efectivo conjunto de y es el nuacutemero de individuos para los

cuales toma el valor e el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

Estos valores se representan en una tabla de doble entrada conocida como

tabla de contingencia

Cada fila y cada columna corresponden a una submuestra particular La

fila de iacutendice es la distribucioacuten en las clases de los individuos para

los cuales el caraacutecter toma el valor La columna de iacutendice es la

distribucioacuten en las clases de los individuos para los cuales el caraacutecter

toma el valor Dividiendo las filas y las columnas por su suma se obtienen

frecuencias condicionales para cada una de las distribuciones empiacutericas Para

y las denotaremos por

y

Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y

los perfiles columna Para el modelo probabilista las observaciones provienen de

una muestra

de una ley bidimensional La hipoacutetesis a comprobar

es que los dos marginales de esta ley son independientes Si este es el caso los

perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna

de la de

y

Es equivalente a decir que las frecuencias conjuntas deben estar cerca de

los productos de las frecuencias marginales

Las frecuencias conjuntas por un lado (distribucioacuten observada) y los

productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen

dos distribuciones de probabilidad sobre el conjunto producto

Podemos por tanto calcular la distancia de

chi-cuadrado de una con respecto a la otra

Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la

distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale

Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la

definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado

Por lo dicho anteriormente para suficientemente grande podemos

aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el

nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados

a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las

que han sido estimadas Hay para el caraacutecter y para el caraacutecter

(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley

chi-cuadrado seraacute por tanto

Vamos a presentar un ejemplo de dos caracteres binarios que tienen que

ver con enfermos para los cuales se ha observado si tienen o no una tendencia al

suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y

neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las

tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla

de contingencia observada es

Tendencia Sin tendencia Total

Psicosis 20 180 200

Nneurosis 60 140 200

Total 80 320 400

La distancia de chi-cuadrado de contingencia calculada a partir de esta

tabla es de El valor tomado por el estadiacutegrafo es el cual

debemos comparar con la ley El p-valor es de

Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre

la tendencia al suicidio y la clasificacioacuten de las enfermedades

El test no precisa el sentido de esta dependencia Para describirla hay que

comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre

los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten

PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS

Los investigadores se interesan constantemente en las diferencias entre dos

poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado

civil profesioacuten color de ojos preferencia por una marca etc)

Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de

contingenciardquo

Se puede realizar una prueba para la diferencia entre dos proporciones

sobre la base de muestras independientes usaacutendose como instrumento la prueba

de chi cuadrado

El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es

la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se

podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda

Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la

ecuacioacuten

n

nnE CR

donde

nR nuacutemero total en el rengloacuten

nC nuacutemero total en la columna

n tamantildeo total de la muestra

El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado

entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia

al cuadrado se divide entre la frecuencia esperada de la celda

La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se

rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el

valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados

de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el

tamantildeo de la muestra

CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD

Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a

las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se

puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la

distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado

siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal

Por consiguiente al probar la diferencia entre las dos proporciones la

distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes

Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia

direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten

normal

La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede

ilustrar mediante el siguiente ejemplo

Cuartos de bantildeos modernos

Cocina moderna Caren

cia

existenc

ia

totales

Carencia 72 8 80

Existencia 7 146 153

La hipoacutetesis nula y alternativa seriacutean

YN ppH 0

YN ppH 0

Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de

significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute

Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H

A partir de la informacioacuten del cuadro

10080

8

N

NSN

n

Xp 95420

153

146

Y

YSY

n

Xp

A partir de la expresioacuten

21

21

111

nnpp

pPZ SS

donde

661015380

1468

p

por lo tanto

0813

153

1

80

133906610

95420100

Z

Totales 79 154 223

Dado que 1960813 Z se rechaza la 0H por lo tanto hay

diferencia entre las dos proporciones

Usando la prueba de chi cuadrado y la tabla de contingencia de este

ejemplo se tiene

Las frecuencias teoacutericas se pueden obtener a partir de la siguiente

ecuacioacuten

n

nnE CR

Por lo tanto se tiene

1227233

7980E 8852

233

15480E

8851233

79153E 12101

233

154153E

Chi cuadrado se obtiene a partir de la expresioacuten

E

EOX

2

2

A partir de la tabla se tiene

O E (O ndash E) (O ndash E)2

(O ndash E)2E

7

2

2

712

+4488 20142144 742704

7 5

188

- 4488 20142144 388245

8 5 -4488 20142144 380903

288

1

46

1

0112

+4488 20142144 199191

1711043

10431712 CALCULADOX

Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el

84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo

tanto hay diferencia entre las dos proporciones

Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la

distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos

distribuciones que a un nivel de significancia de 005 el valor de 196 es el

cuadrado de 3 841 es decir 22 ZX

CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA

La afirmacioacuten de que no existen diferencias entre proporciones significa

que las dos variables son independientes Cuando las conclusiones se presentan en

esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo

Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que

no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la

hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos

variables Independientemente de que la prueba de chi cuadrado se considera una

prueba de diferencia entre dos proporciones o una prueba de independencia los

caacutelculos y resultados son exactamente los mismos

CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE

Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o

intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que

ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de

probabilidades

Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que

seguir varios pasos Primero se tiene que establecer la distribucioacuten de

probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada

paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la

media) se deben establecer mediante hipoacutetesis o estimarlos con base a la

informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para

determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o

intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado

para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la

informacioacuten

BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON

La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de

Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la

cantidad de automoacuteviles estacionados en una cochera cubierta siguen una

distribucioacuten de Poisson 0H

En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero

de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una

muestra aleatoria de 233 casas

Numero de automoacuteviles Frecuencia

0 61

1 151

2 21

233

Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados

de la distribucioacuten de frecuencia

No de automoacuteviles Frecuencia observada On

0 61 0

1 151 151

2 21 42

233 193

808280233

193

1

n

On

X

n

i por lo tanto 80X

El valor de la media muestral se utilizara como el estimado de X

Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)

y se obtiene la frecuencia teoacuterica para cada una

Automoacutevil

n

Frecuencia

O

Probabilidad

XP

Frecuencia (E)

XPn

0 61 04493 104687

1 151 03595 87764

2 21 01438 33505

Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de

significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX

El valor calculado de chi cuadrado es

50679

2

2

K

CALCULADO

E

EOX

Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de

automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una

distribucioacuten de Poisson

CORRECCIOacuteN DE YATES

Cuando se aplican a datos discretos los resultados para distribuciones

continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres

comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de

Yates la cual viene dada mediante la expresioacuten

E

EOX CALCULADO

502

2

En general la correccioacuten se hace solamente cuando el numero de grados

de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos

resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en

relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia

esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi

cuadrado corregido y no corregido Si ambos valores conducen a la misma

conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se

presentan dificultades Si conducen a conclusiones diferentes se puede o bien

incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear

meacutetodos de probabilidad exactos

El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente

ejemplo

En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces

Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de

significancia del 005

No de caras Frecuencia Probabilidad Frecuencia (E)

Cara 115 05 100

cruce 85 05 100

2054

100

0510085

100

0510011522

2

CALCULADOX

Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado

con correccioacuten de Yates es

8432 TABULADOX

Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha

PRUEBA EXACTA DE FISHER

Para examinar la igualdad de las varianzas de dos poblaciones

independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de

las varianzas de las dos muestras Suponiendo que la informacioacuten de cada

poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2

2

2

1 SS sigue una

distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso

estadiacutestico RA Fisher

Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de

grados de libertad los grados de libertad en el numerador y en el denominador

la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea

2

2

2

111 21

S

SF nn

donde

n1 = tamantildeo de muestra en el grupo 1

n2 = tamantildeo de muestra en el grupo 2

n1 ndash 1 = grados de libertad en el grupo 1

n2 ndash 1 = grados de libertad en el grupo 2

2

1S varianza de la muestra en el grupo 1

2

2S varianza de la muestra en el grupo 2

Al probar la igualdad de dos varianzas se pueden emplear pruebas de una

cola o de dos colas

El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente

ejemplo

Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas

alta en la planta A que en la planta B Para determinar la variabilidad se puede

establecer una prueba de una cola en la forma siguiente

22 BAOH

22

1 BAH

Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta

A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta

ubicada en la cola superior de la distribucioacuten

Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de

libertad en el numerador y 19 en el denominador a un nivel de significancia de

001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene

71162 AS y 20142 BS por lo tanto

38512014

71162

2

1924 F como 1385 lt

292 no se rechaza la hipoacutetesis nula ( OH )

CONCLUSIOacuteN

La conclusioacuten que los resultados de una medida variable es la causa de

variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten

estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero

no puede reclamar legitimidad

La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en

describir la distribucioacuten de las variables estudiadas y en particular de los datos

numeacutericos Ademaacutes de las medidas descriptivas correspondientes el

comportamiento de estas variables puede explorarse graacuteficamente de un modo

muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro

organizador de las ciencias computarizadas y el modelo que nos dota de un

mejor razonamiento para implementar programas eficientes En este sentido la

combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un

reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en

colegios y universidades

Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de

combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y

evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras

loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre

operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten

juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la

teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones

simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades

que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea

BIBLIOGRAFIacuteA

AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis

Third Edition Texts in Statistical Science Chapman and Hall

BOXG E P HUNTER W G HUNTER JS (1978) Statistics for

Experimenters John Wiley amp Sons

BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores

Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de

Modelos Ed Revertsbquo SA

Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed

Piraacutemide

Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten

(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica

Matemaacutetica I Universidad de Antioquia

Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma

Madrid

Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill

Meacutexico

Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten

yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico

Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw

ndashHill 4ta Edicioacuten Colombia

CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana

Meacutexico

COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas

COX DR (1958) Planning of experiments New York John Wiley amp Sons

DANIEL C Applications of Statistics to Industrial Experimentation Willey

DAVIES OL The Design and Analysis of Industrial Experiments Hafner

(McMillan)

DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias

Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico

SA de CV Meacutexico

De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H

(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico

Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta

Estadiacutestica Editorial Microsoft corporation USA

ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial

Limusa SA Meacutexico

EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis

Arnold

FEDERER W (1965) Experimental design Oxford Publ Co

GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la

Varianza Grupo Editorial Universitario

FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico

McGraw Hill

FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque

ModernoEditorial SA Meacutexico

George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y

Meacutetodosrdquo Ed McGraw-Hill

GILL JL (1978) Design and Analysis of Experiments in the Animal and

Medical Sciences Iowa State University Press

JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression

and Experimental Design Springer-Verlag

Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor

Caracas

GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining

Institute

GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data

Mining Institute

Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial

Bourgeoacuten Caracas

Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la

EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute

Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial

BourgeoacutenCA Caracas ndash Venezuela

HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis

Multivariante 5ordf Edicioacuten Prentice Hall

JOBSON JD (1992) Applied Multivariate Data Analysis Volume II

Categorical and Multivariate Methods Springer-Verlag

KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial

Hispanoamericana Meacutexico

KIRK RE Experimental Design Procedures for the Behavioral Sciencies

BrooksCole Publishing Company

LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e

inferencia Estadiacutestica Editorial Limusa Meacutexico

LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV

Grupo Noriega Editores Meacutexico

LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial

HARLA Meacutexico

LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta

edicioacuten Editorial McGaw-Hill Usa

Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial

Hispanoameacuterica VI edicioacuten Meacutexico

LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire

Multidimensionnelle 3ordf Edition DUNOD

LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e

Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB

Caracas- Venezuela

LORENZEN T J Anderson V L (1993) Design of experiments A No-Name

Approach Marcel Dekker Inc

Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc

(1999) SPSS 90 Manual de Usuario SPSS Chicago

MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis

Academic Press

Enfocados hacia SPSS

Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de

wwwspssparatodoscom 2005

MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten

Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla

Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea

Ediciones Alfaomega SAN Meacutexico

MASON RL Statistical Design and Analysis of Experiments with Applications

to Engineering and Science John Wiley amp Sons New York

MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y

Economiacutea Editorial Iberoamericana Meacutexico

MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in

agriculture and experimental biology Second edition Chapman amp Hall

MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo

Editorial Iberoameacuterica

MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers

John Wiley amp Sons

Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial

Reverte Mejicana Meacutexico

Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da

Edicioacuten Meacutexico

Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc

Graw Hill

PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones

Editorial Limusa Meacutexico

NETER J et al Applied Linear Statistical Models Regression Analysis of

Variance and Experimental Designs Library of Congress Cataloging Publication

Data

OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp

RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo

Editorial Universitario

PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos

Lineales y Series Temporales Vol 1 y 2 Alianza Editorial

Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores

Spain SA Espantildea 2005

PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial

Mir Moscuacute

RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed

McGraw-Hill

Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca

UCV Caracas ndash Venezuela

RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE

Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en

Psicologiacuteardquo p 1

SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons

Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti

Caracas ndash Venezuela

Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores

deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico

Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica

Editorial Harla Meacutexico

STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y

procedimientos Segunda edicioacuten McGraw Hill

SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas

Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1

Ediciones UNESR Caracas

URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante

Coartiacuteculo Plan Nuevo Editorial AC

VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II

Anaacutelisis Multivariante) Mc-Graw Hill

Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows

Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea

2002

WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros

Editorial Interamericana Meacutexico

Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8

Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage

Learning Editores p 364 ISBN 9706861947

Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea

Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea

Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de

CV Meacutexico

Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para

Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico

DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR

httpesmwikipediaorgwikiSPSS

httpwwwbuenastareascomensayosque-es-el-SPSS1465478html

httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-

del-software-estadistico-integral-spss-base-160

httpesanswersyahoocomquestionindexqid=20070727073908aatuamw

httpwwwslidesharenetleticiagpestructura-de-spss-3126476

httpwwwehowenespanolcomprograma-spss-sobre_48697

httpwwwugres~bioestmedicinamanual_spsspdf

httpwwwmonografiascomtrabajos12tutortutorshtml

httpwwwspsscom

wwwspssparatodoscom

httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html

httpwwwspssfreecomcapitulotreshtml

httpwwwuvesRELIEVEemail relieveuves

httpwwwscribdcomdochellipspss-introduccioacuten

httpeswikipediaorgwikiSPSS

httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd

f

httpwwwspsscomaressuccessargentinashtml

httpeswikipediaorgwikiSPSS

httpwww-01ibmcomsoftwareesanalyticsspss

httppsicofcepurvesspssindex0htm

httpssitesgooglecomsiteestadisticaconelspss

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpe-stadisticabioucmesweb_spssindice_spsshtml

httpwwwquimicaurvesquimiogeneralanovacastpdf

httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da

tosyMultivariable14anova1_SPSSpdf

httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800

20AnE1lisis20de20Varianzaspdf

httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-

pearson

httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf

httpwwwuoceduin3emathdocsRegresionLinealpdf

httpeswikipediaorgwikiRegresiC3B3n_lineal

httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES

ION_LINEAL_CON_SPSSpdf

httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN

EAL20SIMPLE20CON20SPSSpdf

httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE

SION_LINEAL_CON_SPSSpdf

httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm

httpeswikipediaorgwikiNivel_de_medida

httphtmlrincondelvagocomregresion-lineal-simplehtml

httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp

lepdf

httpwwwvitutorcomestadisticabi8html

httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf

httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-

Martinez_1pdf

httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml

httpesslidesharenetpatolinkecuacin-de-regresin-lineal

httpeswikipediaorgwikiMC3ADnimos_cuadrados

httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios

httpwwwwordreferencecomdefinicioncorrelaciC3B3n

httpwwwditutorcomestadistica_2correlacion_estadisticahtml

httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson

httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n

httpeswikipediaorgwikiMatriz_de_correlaciC3B3n

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpwwwinfecepiunizares

httpwwwltbioestadisticaumaes

httpwwwuaqmxmatematicasestadisticasxu3html

httpwwwmembers-americastripodcom

httpwwwmsiplceorg

httpwwwbnvcocrsesionnotaaspg

httpwwwaltavistacom

httpwwwauyantepuycom

httpwwwinees

httpwwwudeccl

httpwwwrincondelvagocom

httpwwwmonografiascom

httpwwwfestadisticafguamesindicadoresiprihtml

httpwwwuaqmxmatematicasestadisticaxu3html

httpwwwinegoboiwd0801htmlE

httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm

httpwwwitlpedumx

httpwwweclaevespanovestadisticasna93nnsnann7eshtml

httpw3moritesmmx~cmendozamaestestoohtml

httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml

httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion

httpwwwunleduarfaveseiencuestasindexhtml

httpwwwmonografiascomtrabajos11operaoperashtml

httpwwwmonografiascomtrabajos6hisohisoshtml

httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos

httpwwwmonografiascomtrabajos16sistema-operativosistema-

operativoshtmlTIPPOS

httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-

operativoshtml

httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei

httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml

httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-

operativo

httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software

httpwwwsscccoclinformaticaconceptoshtml

httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr

httpwwwcadcommxhistoria_de_la_computacionhtm

httpwwweswikipediaorgwikiBus_(informC3A1tica)

httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla

httpwwwcavsicompreguntasrespuestasque-es-el-teclado

httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm

Page 8: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,

En estos casos se emplea como paraacutemetro de centralizacioacuten la mediana

que es aquel punto para el que el valor de X estaacute el 50 de las veces por debajo y

el 50 por encima

Propiedades

1 No se relacionan con el estudio de un paraacutemetro de la poblacioacuten

Por lo general cuando se hace referencia a pruebas no parameacutetricas se puede estar

hablando tanto de las no parameacutetricas como de las libres de distribucioacuten

(distribution free tests)

Las dos indicaciones maacutes importantes que se deben tener en cuenta para utilizar

una prueba no parameacutetrica son que

1 la distribucioacuten de la poblacioacuten no sea normal

2 la escala de medicioacuten de la variable en cuestioacuten sea categoacuterica

Los meacutetodos no parameacutetricos son menos poderosos que los parameacutetricos Esto

quiere decir que es maacutes difiacutecil rechazar la hipoacutetesis nula con las pruebas no

parameacutetricas

Por esa razoacuten los estadiacutesticos por lo general recurren a los meacutetodos no

parameacutetricos soacutelo cuando los datos no cumplen con los supuestos parameacutetricos

Sin embargo hay problemas de investigacioacuten en los que las variables categoacutericas

son las indicadas y por lo tanto soacutelo un meacutetodo no parameacutetrico es el indicado Los

pasos en las pruebas de hipoacutetesis no parameacutetricas son los mismos de las

parameacutetricas Los cambios por lo general se limitan a cambios en la foacutermula para

obtener el valor observado y en la tabla que se utiliza Pero se habla de hipoacutetesis

nula nivel de significacioacuten error tipo I y tipo II etc

El uso de meacutetodos no parametricos ofrece numerosas ventajas

1 los meacutetodos no parametricos se pueden usar con todo tipos de datos

ndash informacioacuten cualitativa (de escala nominal) informacioacuten en forma de rangos

(escala ordinal) asiacute como informacioacuten medida de un modo mas exacto (escala de

intervalo o de razoacuten)

2 por lo general son faacuteciles de aplicar y raacutepidos de calcular con

tamantildeos pequentildeos de muestra En ocasiones son tan sencillos que basta contar

con la frecuencia con que algunas caracteriacutesticas aparecen en los datos Por lo

tanto a menudo se usan para estudios piloto o preliminares yo en situaciones en

que se desean respuestas raacutepidas

3 hacen menos premisas menos estrictas (mas faacuteciles de cumplir) que

los procedimientos claacutesicos por lo tanto gozan de mayor aplicabilidad y

proporcionan un conjunto de conclusiones mas generales de base mas amplia

4 permiten solucionar problemas que no implican pruebas de

paraacutemetros de poblacioacuten

5 son mas econoacutemicos que los procedimientos claacutesicos ya que el

investigador puede aumentar la potencia y a pesar de ello ahorrar dinero tiempo y

trabajo al recopilar muestras de datos mayores medibles con mas aproximacioacuten

lo que soluciona con mayor rapidez el problema

6 seguacuten el procedimiento seleccionado los meacutetodos no parametricos

pueden ser tan poderosos (o casi tanto) como el procesamiento claacutesico cuando se

cumplen las premisas de este ultimo y quizaacutes sean un poco mas poderosos aun

cuando no se cumplan

Los procedimientos no parametricos tambieacuten ofrecen algunas desventajas

1 no conviene usar meacutetodos no parametricos cuando se pueden

cumplir todas las premisas de los procedimientos claacutesicos y los datos se miden en

una escala bien sea de intervalos de razones A menos de que se empleen

procedimientos claacutesicos en estos casos el investigador no esta aprovechando por

completo los datos Se pierde informacioacuten al convertir datos recopilados (de una

escala de intervalo o de razoacuten) a rangos (escala ordinal) o categoriacuteas (escala

nominal) En particular en esas circunstancias algunas pruebas no parametricas

muy raacutepidas y sencillas tienen mucha menos potencia que los procedimientos

claacutesicos y por lo general se deben evitar

2 seguacuten aumenta el tamantildeo de la muestra en ocasiones el manejo

requerido de datos para los procedimientos no parametricos se hace laborioso a

menos que se disponga de un paquete de computacioacuten adecuado

3 con frecuencia se necesitan tablas especiales de valores

criacuteticos y estas no se obtienen con tanta facilidad como las tablas de los

valores criacuteticos normales t 2X y F Ccedil

Prueba de signos para una sola muestra

Salvo para las pruebas con muestra grande todas las pruebas estaacutendar

concernientes a medias estaacuten basadas en la suposicioacuten de que las poblaciones que

se muestrean tienen aproximadamente la forma de distribuciones normales

Cuando en un caso determinado esta suposicioacuten resulta insostenible la prueba

estaacutendar se puede sustituir por una de varias alternativas no parametricas entre

ellas la ldquoprueba de signosrdquo

La prueba de signos de una sola muestra se aplica cuando se muestrea una

poblacioacuten simeacutetrica continua de manera que la probabilidad de que un valor de la

muestra sea menor que la media o mayor que la media es en ambos casos frac12 Para

probar la hipoacutetesis nula ( O ) contra una hipoacutetesis alternativa apropiada con

base en una muestra aleatoria de tamantildeo n se sustituye cada valor de la muestra

mayor que O por un signo de mas y cada valor de la muestra menor que O por

un signo de menos despueacutes se aprueba la hipoacutetesis nula de que estos signos de

mas y menos son valores de una variable aleatoria que tiene distribucioacuten binomial

con 2

1p (si un valor de la muestra es igual a O simplemente lo rechazamos)

Prueba de suma de rangos

Se puede utilizar cuando se desea probar una hipoacutetesis relacionada a un

paraacutemetro que refleje una tendencia central Cuando no se cumplen las premisas

de la prueba t el procedimiento de Wilcoxon es probable que sea mas potente

para detectar la existencia de diferencias importantes que su contraparte

correspondiente

Para llevar a cabo la prueba de rangos y signos de Wilcoxon se puede

aplicar el siguiente procedimiento de seis pasos

1 para cada partiacutecula en una muestra de n partidas se obtiene un

resultado de diferencia Di

2 despueacutes no se toman en cuenta los signos + y ndash y se obtiene un

grupo de n diferencias absolutas iD

3 se omite de cualquier anaacutelisis adicional cualquier diferencia

absoluta con resultados de 0 con lo cual se obtiene un grupo de n resultados de

diferencias absolutas que no sean cero donde n

4 despueacutes se asignan rangos Ri desde uno hasta n a cada una de las

iD de modo que el resultado de diferencia absoluta mas pequentildeo obtiene una

clasificacioacuten de uno y el mayor de n Por la falta de precisioacuten en el proceso de

medicioacuten si dos o mas iD son iguales a cada una se asigna el ldquorango promediordquo

de los rangos que de lo contrario se les hubieran asignado individualmente si no

hubiera ocurrido la igualdad de los datos

5 ahora se asignan de nuevo el siacutembolo + o el signo ndash a cada uno de

los n rangos de Ri dependiendo de si originalmente Di era positiva o negativa

6 la prueba estadiacutestica de Wilcoxon W se obtiene como la suma de

las clasificaciones +

n

i

iRW1

Para muestras de n 20 se puede utilizar tablas para obtener los valores

criacuteticos de la prueba estadiacutestica W tanto para las pruebas de una cola como de dos

a diversos niveles de significacioacuten Se rechaza la hipoacutetesis nula en una prueba de

dos colas si el valor observado W es igual o excede al valor critico superior o es

igual o inferior al valor critico inferior Se rechaza la hipoacutetesis nula en una prueba

de una cola en direccioacuten positiva si el valor observado W es igual o excede el

valor critico superior Se rechaza la hipoacutetesis nula para una prueba de una cola en

direccioacuten negativa si el valor observado de w es inferior o igual al valor critico

inferior

Para nge20 la prueba estadiacutestica W tiene distribucioacuten aproximadamente

normal y se puede utilizar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis nula

W

WWZ

VARIABLES ALEATORIA Y COMO SE DIVIDEN

Una variable es aleatoria si toma diferentes valores como resultado de un

experimento aleatorio Puede ser discreta o continua Si puede tomar soacutelo un

nuacutemero limitado de valores entonces es una variable aleatoria discreta En el otro

extremo si puede tomar cualquier valor dentro de un intervalo dado entonces se

trata de una variable aleatoria continua

Se puede pensar en una variable aleatoria como un valor o una magnitud

que cambia de una presentacioacuten a otra sin seguir una secuencia predecible Los

valores de una variable aleatoria son los valores numeacutericos correspondientes a

cada posible resultado de un experimento aleatorio

La distribucioacuten de probabilidad de una variable aleatoria proporciona una

probabilidad para cada valor posible y estas probabilidades deben sumar 1

VALOR ESPERADO DE UNA VARIABLE ALEATORIA

El valor esperado es una idea fundamental en el estudio de las distribuciones de

probabilidad

Para obtener el valor esperado de una variable aleatoria discreta se

multiplica cada valor que la variable puede tomar por la probabilidad de

presentacioacuten de ese valor y luego se suman esos productos Es un promedio

pesado de los resultados que se esperan en el futuro El valor esperado pesa cada

resultado posible con respecto a la frecuencia con que se espera se que presente

En consecuencia las presentaciones maacutes comunes tienen asignadas un peso

mayor que las menos comunes

El valor esperado tambieacuten puede ser obtenido a partir de estimaciones

subjetivas En ese caso el valor esperado no es maacutes que la representacioacuten de las

convicciones personales acerca del resultado posible

VARIABLES ALEATORIAS DISCRETAS

Variable que toma un nuacutemero finito o infinito de valores numerables

Sean x1 x2 x3 xn los distintos valores que puede tomar la variable

aleatoria

Y p(x1) p(x2) p(xn) su probabilidad

Los pares de valores (xj p(xj)) constituyen la distribucioacuten de probabilidades de la

variable aleatoria

p(x) se denomina funcioacuten de probabilidad y debe cumplir con las siguientes

propiedades

0 lt p(xj) lt 1 (p(x) es una probabilidad y por lo tanto debe tomar valores

entre 0 y 1)

1)( jxP (la suma de probabilidades repartidas entre todos los valores

de la variable debe ser igual a 1)

De la misma manera que calculamos frecuencias acumuladas podemos acumular

probabilidades obteniendo la funcioacuten de distribucioacuten de probabilidades

Esta funcioacuten representa la probabilidad de que la variable aleatoria sea menor o

igual que un determinado valor

F(xj) = P (X lt xj)

Graacuteficamente la funcioacuten aumenta de a saltos ya que entre dos valores

consecutivos de una variable discreta no puede tomar valores intermedios

VARIABLES ALEATORIAS CONTINUAS

En este caso en lugar de trabajar con la probabilidad de valores

particulares de la variable resulta maacutes apropiado calcular probabilidades

asociadas a intervalos Para distribuir propiedades se usa una funcioacuten que mide

concentracioacuten de probabilidades alrededor de un punto que se denomina

funcioacuten de densidad de probabilidad (fdp) y se denota como f(x)

Una funcioacuten de densidad de probabilidad debe cumplir con las siguientes

propiedades

F(x) gt 0 (la funcioacuten es no negativa para cualquier valor de x f(x) no es

una probabilidad y puede valer maacutes de 1)

el aacuterea bajo la curva de la funcioacuten vale 1)

La funcioacuten de distribucioacuten para una variable aleatoria continua se calcula

F(a) = P(X lt

La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula

P (alt x lt b) = F(b) - F(a)

La probabilidad de que la variable tome un valor particular se puede expresar

como

F(c) - F(c) = 0

DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO

Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia

valores de una variable aleatoria con sus respectivas probabilidades es

decir Probabilidad de x = Funcioacuten de x

Las distribuciones se caracterizan por una foacutermula que determina el tipo de

distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio

muestral

En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una

funcioacuten de la probabilidad que representa los resultados que se van obteniendo en

un experimento aleatorio

Asiacute para un nuacutemero dado x la probabilidad es

A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la

variable X y representa la probabilidad de que la variable tome el valor desde

hasta x

Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de

probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad

Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos

y seraacuten mutuamente excluyentes y su suma es el

suceso por lo que tenemos entonces que

y finalmente

Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos

los valores de la variable aleatoria x conoceremos completamente la distribucioacuten

de probabilidad de la variable

Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten

de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente

Es decir la probabilidad de todo el espacio muestral es 1 tal y como

establece la teoriacutea de la probabilidad y por otra parte

Es decir la probabilidad del suceso nulo es cero

Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de

probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes

praacutectico el uso de la funcioacuten de densidad

En el caso de una variable discreta la distribucioacuten puede describirse

mediante una funcioacuten de probabilidad que para cada valor de x de la variable X

determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de

una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de

distribucioacuten la que para cada valor provee la probabilidad de no ser superado

evidentemente el valor de la funcioacuten de distribucioacuten es igual

a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo

inferior del dominio de la variable hasta x inclusive Lista de los resultados de un

experimento con las probabilidades que se esperariacutean ver asociadas con cada

resultado

Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores

diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12

En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica

Para el caso de 1 solo dado donde todos los valores tienen la misma

probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme

Prueba de aleatoriedad

Con frecuencia se supone que los datos recopilados constituyen una

muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la

utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash

Wolfowitz de corridas de una muestra para aleatoriedadrdquo

Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o

la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos

siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la

partida tiene una propiedad en particular o de la cantidad o magnitud en que se

posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la

sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con

distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente

de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que

la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las

partidas que la preceden o las que la suceden en forma tal que la probabilidad de

su ocurrencia varia de una posicioacuten a otra el proceso no se considera como

aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando

esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en

forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico

Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el

tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico

de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una

prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede

rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la

sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de

una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2

exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por

consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis de aleatoriedad

U

UUZ

donde

U = numero total de corridas

U = valor medio de U 12 21

n

nnU

U = desviacioacuten estaacutendar de U 1

222

2121

nn

nnnnnU

n1 = numero de eacutexitos en la muestra

n2 = numero de fracasos en la muestra

n = tamantildeo de la muestra n = n1 + n2

PRUEBA DE McNEMAR

Suele darse el caso en que se desean comparar las proporciones de los

datos de muestras tomados de poblaciones relacionadas En este caso se quisiera

determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a

alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea

determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y

otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede

utilizar la prueba desarrollada por McNemar

El principal intereacutes es determinar si hay diferencia entre las dos

proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta

que el otro (prueba de una cola)

La prueba estadiacutestica para la prueba de McNemar es

CB

CBZ

PRUEBA U DE MANN ndash WHITNEY

Es una alternativa no parametrica a la prueba t de dos muestras para la

diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula

μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos

la forma de distribuciones normales de hecho la prueba solo requiere que las

poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no

importa si se cumple o no esta suposicioacuten

Estadiacutesticos U1 y U2

111

2112

1 W

nnnnU

222

2122

1 W

nnnnU

PRUEBA DE RACHAS

Son todas las diferencias que tiene el mismo signo y se presentan en una

misma fila Una serie de n diferencias puede tener solamente una racha (toda

positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las

rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de

poblaciones con la misma distribucioacuten de frecuencias Colocamos las

observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces

contamos el numero de rachas item de cada una de las muestras Si hay menos

rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales

rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten

La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de

que las observaciones se han sacado aleatoriamente de una sola poblacioacuten

Para hacer esto se halla la mediana de la muestra y se designa las

observaciones situadas por debajo de la mediana por un signo menos (-) y las

observaciones situadas por encima de la mediana por un signo (+) Si el numero

de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado

rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el

numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10

puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la

tabla normal con

u

uu

z

2

1

12

21

21

NN

NNu

)1()(

2(2

21

2

21

2121212

NNNN

NNNNNNu

DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES

DISTRIBUCIONES DE EJEMPLO Y USO

DISTRIBUCIOacuteN NORMAL O GAUSSIANA

Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que

multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal

Esta distribucioacuten de caracteriza porque los valores se distribuyen formando

una campana de Gauss en torno a un valor central que coincide con el valor

medio de la distribucioacuten

Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a

la izquierda

Esta distribucioacuten viene definida por dos paraacutemetros

X N (m S2)

m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro

de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores

estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores

estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de

ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten

estaacutendar

Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina

normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo

que permiten obtener esos mismos valores donde se recoge la probabilidad

acumulada para cada punto de la curva de esta distribucioacuten

Ademaacutes toda distribucioacuten normal se puede transformar en una normal

tipificada

Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con

media 10 y varianza 4 Transformarla en una normal tipificada

X N (10 4)

Para transformarla en una normal tipificada se crea una nueva variable (Y)

que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica

(que es la raiacutez cuadrada de la varianza)

En el ejemplo la nueva variable seriacutea

Esta nueva variable se distribuye como una normal tipificada

permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor

Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos

indicado de que las probabilidades para cada valor de la curva se encuentran

recogidas en una tabla

MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)

La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten

normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta

distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros

y lo que representamos del modo si su funcioacuten de densidad

es

Observacioacuten

Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y

la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes

adelante65

La forma de la funcioacuten de densidad es la llamada campana de Gauss

Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten

normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1

Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un

uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto

con lo cual en coinciden la media la mediana

y la moda y por uacuteltimo calcular sus puntos de inflexioacuten

El soporte de la distribucioacuten es todo de modo que la mayor parte de la

masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se

encuentra concentrado alrededor de la media y las ramas de la curva se extienden

asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la

media es posible (aunque poco probable)

La forma de la campana de Gauss depende de los paraacutemetros y

indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)

Figura Distribuciones gaussianas con diferentes medias e igual

dispersioacuten

(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor

sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor

de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea

``maacutes aplastado seraacute

Figura Distribuciones gaussianas con igual media pero varianza

diferente

La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes

adelante que es

Como consecuencia la distribucioacuten normal es reproductiva con respecto a

los paraacutemetros y ya que

Observacioacuten

Como se ha mencionado anteriormente la ley de probabilidad gaussiana la

encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza

por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el

de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que

apuntar un hecho negativo para esta ley de probabilidad

La funcioacuten no posee primitiva66

conocida67

Las consecuencias desde el punto de vista praacutectico son importantes ya que

eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de

la normal y nos tenemos que limitar a decir que

sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente

esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho

puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto

se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en

problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde

se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie

limitada de valores xi dados Normalmente F se encuentra tabulada para una

distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten

normal tipificada

En el caso de que tengamos una distribucioacuten diferente se

obtiene Z haciendo el siguiente cambio

De manera general se tiene

Proposicioacuten (Cambio de origen y escala)

Sean Entonces

Este resultado puede ser utilizado del siguiente modo Si y nos

interesa calcular

1 Hacemos el cambio y calculamos

2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de

modo aproximado) Como

tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada

Ejemplo

Supongamos que cierto fenoacutemeno pueda ser representado mediante una

va y queremos calcular la probabilidad de que Xtome un valor

entre 39 y 48 es decir

Comenzamos haciendo el cambio de variable

de modo que

Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que

hemos mencionado anteriormente

Proposicioacuten

Sea Entonces

Demostracioacuten

Por ser la normal una ley de probabilidad se tiene que

es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con

respecto a se obtiene el valor 0

luego

Para demostrar la igualdad entre la y basta con aplicar la misma

teacutecnica pero esta vez derivando con respecto a

Luego

Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en

primer lugar la va tipificada de X

y calculamos

Como por la proposicioacuten 5 deducimos que

CURVA NORMAL ESTANDARIZADA

Una variable numeacuterica puede clasificarse como discreta o continua Las

variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas

con la idea de contar Las variables continuas se pueden asociar con la idea de

medir utilizando fracciones y decimales Cuando la variable es continua el

modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal

El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten

normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran

cantidad de variables continuas

El modelo matemaacutetico

La funcioacuten matemaacutetica que se usa como modelo es

e = 271

π = 314

μx = media de la poblacioacuten

σx = desviacioacuten estaacutendar de la poblacioacuten

x = un valor de la variable continua

Como e y π son constantes la forma de la curva normal depende

solamente de los dos parametros de la distribucioacuten normal la media μx y la

desviacioacuten estaacutendar σx

Las diferentes curvas normales van a variar dependiendo de esos dos

paraacutemetros

En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar

visualmente como una curva en forma de campana El aacuterea debajo de esta curva se

halla por medio del integral de la funcioacuten y corresponde al por ciento o la

proporcioacuten de puntuaciones que se encuentran en el intervalo dado

Propiedades de las distribuciones normales

a Son simeacutetricas y tienen forma de campana

b Al ser simeacutetricas la media la moda y la mediana coinciden

c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea

de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media

d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la

curva se encuentra a tres desviaciones estaacutendar de la media

En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral

de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de

diferentes secciones de la curva o se utiliza la computadora para calcular ese valor

del aacuterea

La distribucioacuten normal estandarizada

Puesto que hay un nuacutemero infinito de combinaciones para los dos

paraacutemetros hay un nuacutemero infinito de curvas normales diferentes

Este problema se ha resuelto praacutecticamente al transformar los valores de

todas las distribuciones normales a los valores de una distribucioacuten normal

estandarizada representada por la curva normal estandarizada (standard normal

curve)

Las puntuaciones estandarizadas se logran restando la media a cada

observacioacuten y dividiendo entre la desviacioacuten estaacutendar

donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar

Propiedades de la distribucioacuten normal estandarizada

μ z = 0

σ z = 1

En muchas ocasiones se quieren comparar puntuaciones que pertenecen a

dos distribuciones normales diferentes La diferencia entre las dos distribuciones

radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo

la comparacioacuten se hace posible si se convierten las puntuaciones de ambas

distribuciones a puntuaciones z que corresponden a la distribucioacuten normal

estandarizada

Percentiles y rangos percentiles de una distribucioacuten normal estandarizada

Si se desea hallar la percentiles o el rango percentil en una distribucioacuten

normal no estandarizada se recurre al procedimiento de convertir las puntuaciones

de la distribucioacuten normal dada a puntuaciones z que corresponden a la

distribucioacuten normal estandarizada

Estos valores en la distribucioacuten normal estandarizada se pueden obtener

por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en

las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el

intervalo dado

Es necesario visualizar siempre el aacuterea debajo de la curva como el por

ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo

dado

Cuando una distribucioacuten de puntuaciones es normal estandarizada la

pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar

en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o

cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten

dada

DISTRIBUCIOacuteN GAMMA

Una variable aleatoria X asociada a un experimento aleatorio tiene una

distribucioacuten GAMMA si se caracteriza por las siguientes propiedades

Algunas alternativas de funciones de densidad se pueden ver en la graacutefica

del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)

respectivamente =1

=1

La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo

III

El modelo Gamma se ha utilizado frecuentemente en variables tales como

ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el

intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson

ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900

ndash Flujos maacuteximos MARKOVIC 1965

ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965

ndash Altura de la precipitacioacuten mensual WHITCOMB 1940

ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia

infin

ndash Ingresos familiares

ndash Edad del hombre al contraer matrimonio por primera vez

ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en

subestaciones a una frecuencia part

Ejemplo

Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos

de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia

promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo

de tiempo se encuentre hasta que ocurre el segundo ciclo

a Dentro de una desviacioacuten con respecto del tiempo promedio

b A maacutes de dos desviaciones por encima de la media

Solucioacuten

X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en

horas

Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)

= 2

Y Nuacutemero de ciclos hora ---------Y~P( =002)

E(Y) = 002 =

X ~ G(2 002)

Ejemplo

En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de

kilovatios por hora puede considerarse como una variable aleatoria con

distribucioacuten GAMMA de paraacutemetros = 3 y

= 05

La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de

KWhora

iquestCuaacutel es la probabilidad de que este abastecimientos sea

a Insuficiente en un diacutea cualquiera

b Se consuman entre 3 y 8 millones de K WHora

c c Encuentre E(x) y V(x)

SOLUCIOacuteN

DISTRIBUCIOacuteN PARETO

En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad

continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores

es

Su funcioacuten de distribucioacuten es

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto

son

El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (

DISTRIBUCIOacuteN T DE STUDENT

Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una

distribucioacuten t con n grados de libertad

Cuando n--gtinfinito a curva t coincide com la normal estandarizada

FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX

MOMENTOS

La distribucioacuten -Student se construye como un cociente entre una normal

y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-

Student con n grados de libertad a la de una va T

donde Este tipo de distribuciones aparece cuando

tenemos n+1 va independientes

y nos interesa la distribucioacuten de

La funcioacuten de densidad de es

Figura Funcioacuten de densidad de una de Student

La distribucioacuten de Student tiene propiedades parecidas a

Es de media cero y simeacutetrica con respecto a la misma

Es algo maacutes dispersa que la normal pero la varianza decrece hasta

1 cuando el nuacutemero de grados de libertad aumenta

Figura Comparacioacuten entre las funciones de densidad de y

Para un nuacutemero alto de grados de libertad se puede aproximar la

distribucioacuten de Student por la normal es decir

Figura Cuando aumentan los grados de libertad la distribucioacuten de

Student se aproxima a la distribucioacuten normal tipificada

Para calcular

DISTRIBUCIOacuteN BETA

Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede

representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un

intervalo de longitud finita Tales como

Proporcioacuten de impurezas en un producto quiacutemico

La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten

La proporcioacuten vendida de un lote durante un tiempo t

La humedad relativa medida en cierto lugar

Porcentaje del costo total destinado a reparacioacuten de maquinaria

Porcentaje de costo adicional destinado a reparacioacuten de maquinaria

La distribucioacuten del tiempo necesario para completar una fase del proyecto

PERT

Evaluacioacuten de programas y teacutecnicas de revisioacuten

Ejemplo

La proporcioacuten de tramos de una autopista que requieren repararse

semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros

= 3 y =2

a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten

b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista

requieren reparacioacuten en un antildeo cualquiera

DISTRIBUCIOacuteN CAUCHY

En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de

Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es

donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene

valor esperado ni varianza

Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V

2 lt 1 el

numero U V tiene la distribucioacuten Cauchy

La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un

grado de libertad

Ejemplo

Sean y dos observaciones independientes de una distribucioacuten

Cauchy con funcioacuten de densidad

Puede demostrarse que si y son tales que entonces la

funcioacuten de verosimilitud de es bimodal

Sean y Supongamos que se desea hacer inferencias sobre el

valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa

Especiacuteficamente interesa encontrar la distribucioacuten final de

Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la

distribucioacuten final de tiene una forma complicada Es conveniente notar sin

embargo que corresponde a la densidad marginal de respecto a la

densidad conjunta

DISTRIBUCIOacuteN BERNOULLI

Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto

suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el

que no lo sea (fracaso) En realidad no se trata maacutes que de una variable

dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello

que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas

obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la

situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este

experimento mediante una va discreta Xque toma los valores X=0 si el suceso no

ocurre y X=1 en caso contrario y que se denota

Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar

una moneda al aire y considerar la va

Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de

probabilidad es

y su funcioacuten de distribucioacuten

Su funcioacuten caracteriacutestica es

Los principales momentos de la X los podemos calcular directamente

o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina

Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)

cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de

intentos

CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE

BERNOULLI

Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la

probabilidad y asegurar que se cumplen las tres condiciones necesarias en

particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del

resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3

requiere que los ensayos o intentos de un proceso de Bernoulli sean

estadiacutesticamente independientes es decir que el resultado de un intento no puede

afectar de ninguacuten modo el resultado de cualquier otro intento

DISTRIBUCIOacuteN EXPONENCIAL

Modelo para variable aleatoria continua que permite representar variables

del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos

Componentes

En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de

probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para

valores x gt 0 es

f(x) = λe - λx

Su funcioacuten de distribucioacuten es

Aqui e significa el nuacutemero e

El valor esperado y la varianza de una variable aleatoria X con

distribucioacuten exponencial son

E[X] = 1 λ

V(X) = 1 λ2

Ejemplo

Ejemplos para la distribucioacuten exponencial son los tiempos dentro

accidentes con probabilidad invariable

La funcioacuten de densidad para λ igual 05 10 y 15

DISTRIBUCIOacuteN MULTINOMIAL

La distribucioacuten multinomial es similar a la distribucioacuten binomial con la

diferencia de que en lugar de dos posibles resultados en cada ensayo

La distribucioacuten multinomial sigue el siguiente modelo

Donde

X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo

que el partido POPO lo hayan votado 3 personas)

n indica el nuacutemero de veces que se ha repetido el suceso (en el

ejemplo 5 veces)

n es factorial de n (en el ejemplo 5 4 3 2 1)

p1 es la probabilidad del suceso X1 (en el ejemplo el 40)

Veamos el ejemplo

Luego

P = 00256

Es decir que la probabilidad de que las 5 personas elegidas hayan votado

de esta manera es tan soacutelo del 256

Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1

Veamos otro ejemplo

En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el

40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4

invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos

Aplicamos el modelo

LuegoP = 00384

Por lo tanto la probabilidad de que el grupo esteacute formado por personas de

estos paiacuteses es tan soacutelo del 384

DISTRIBUCIOacuteN UNIFORME

En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de

probabilidad cuyos valores tienen la misma probabilidad

Caso discreto

Su funcioacuten de probabilidad es en el caso discreto con valores posibles

p(xi) = 1 n

Su funcioacuten de distribucioacuten es en el caso discreto

Su media estadiacutestica es

Caso continuo

Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b

La funcioacuten de densidad en el caso continuo entre a y b es

Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12

Ejemplos

Para un dado perfecto todos los resultados tienen la misma probabilidad 1

6

Calcular variables aleatorias

Las variables aleatorias de probabilidad uniforme pueden calcularse con un

generador de variables aleatorias

DISTRIBUCIOacuteN BINOMIAL

En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad

discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con

probabilidad p de un eacutexito

Su funcioacuten de densidad es

Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)

posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos

((1 - p)n - x

)

El valor esperado de una variable aleatoria de probabilidad binominal es

E[x] = np y su varianza V[x] = np(1 - p)

DISTRIBUCIOacuteN BINOMIAL NEGATIVA

Sobre una sucesioacuten de va de Bernouilli independientes

Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r

eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de

distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo

Su ley de probabilidad se deduce siguiendo el esquema

De nuevo el conjunto de posibles valores de esta va discreta es

Su funcioacuten caracteriacutestica es

y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima

Ejemplo

Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en

operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal

que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda

definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para

intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus

5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones

que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se

necesiten 10 intervenciones

Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por

una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan

4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso

Identificando los paraacutemetros se tiene

Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el

nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy

simple

Y=X+r

Luego

Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente

es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de

que X=10-4=6 Por tanto

La distribucioacuten binomial negativa tambieacuten se puede definir como el

nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas

contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que

DISTRIBUCIOacuteN DE POISSON

Modelo para variable aleatoria discreta que permite calcular la

probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten

discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo

muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos

o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual

a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es

independiente de cuaacutendo se presenta dicho periacuteodo

En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de

probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos

es

Aquiacute e significa el nuacutemero e y x significa el factorial de x

La distribucion de Poisson describe el nuacutemero de sucesos en una unidad

de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un

proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens

en una carrera

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten

Poisson son

E[X] = V[X] = λ

La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos

entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un

conmutador la demanda (necesidades) de los pacientes que requieren servicio en

una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el

nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos

ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una

variable aleatoria discreta que toma valores enteros (0 1 2)

Caacutelculo de la probabilidad de Poisson

La letra X por lo general representa a una variable discreta y puede tomar

valores enteros Utilizamos la letra X para representar a la variable aleatoria y la

letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La

probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson

se calcula con la foacutermula

LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA

DISTRIBUCIOacuteN BINOMIAL

La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la

binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan

cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es

grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan

con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena

aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es

igual o menor que 005 En los casos en que se cumplen estas condiciones

podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media

de la distribucioacuten de Poisson

DISTRIBUCIOacuteN GEOMEacuteTRICA

En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten

probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores

discretos es

P(X = x) = p(1 - p)x - 1

Su funcioacuten de distribucioacuten es

El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media

estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2

Ejemplo

El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es

una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6

DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA

En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de

probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de

masa para valores es

Aqui (a sobre b) es el coeficiente binomial

El valor esperado de una variable aleatoria X de distribucioacuten

hipergeomeacutetrica es

Y su varianza

DISTRIBUCIOacuteN ZETA

En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad

discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos

es

Aqui ζ(s) es la funcioacuten zeta de Rieman con

El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto

DISTRIBUCION CHI CUADRADO

El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una

comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es

diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con

ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno

es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario

estas dos frecuencias acusan una diferencia significativa para por ejemplo un

nivel de significacioacuten del 5

El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la

asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada

por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito

bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor

del famoso libro Statistical Methods for Research Workers (1925) donde se

marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con

Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde

estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y

el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las

pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba

exacta de Fisher

Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico

publicitario presentado a grupos de clientes comparar la rentabilidad de un

proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos

de los turistas por determinados espacios geograacuteficos o por determinados

servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las

frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las

frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o

tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o

de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2

x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos

turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han

ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han

tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula

que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido

en los sitios A y B

Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es

independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo

A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces

alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este

anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos

empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de

las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51

La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten

igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es

2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del

Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del

5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206

podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para

suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B

Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias

observadas empiacutericamente de dos muestras con las frecuencias esperadas o

teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el

Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de

las materias primas perecederas Los resultados son seguacuten atributos cualitativos

los siguientes Primero veremos las frecuencias empiacutericas u observadas

Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten

Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son

131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas

Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y

fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres

columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta

maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x

120 260 = 6046 b2 = 129 x 120 260 = 5954

Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten

igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de

2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de

libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La

diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna

conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten

Es una medida de la discrepancia existente entre las frecuencias

observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso

de frecuencias () debido a que permite determinar las desviaciones entre ellas

ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la

expresioacuten

E

EOX

2

2

Donde

O frecuencia observada

E frecuencia teoacuterica esperada

TEST DE CHI-CUADRADO DE CONTINGENCIA

Un caso particular del test de chi-cuadrado que permite hacer un test sobre

la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-

cuadrado de contingencia Los dos caracteres observados en una misma

poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases

de se denotan las de por Tambieacuten vamos a

denotar

el efectivo conjunto de y es el nuacutemero de individuos para los

cuales toma el valor e el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

Estos valores se representan en una tabla de doble entrada conocida como

tabla de contingencia

Cada fila y cada columna corresponden a una submuestra particular La

fila de iacutendice es la distribucioacuten en las clases de los individuos para

los cuales el caraacutecter toma el valor La columna de iacutendice es la

distribucioacuten en las clases de los individuos para los cuales el caraacutecter

toma el valor Dividiendo las filas y las columnas por su suma se obtienen

frecuencias condicionales para cada una de las distribuciones empiacutericas Para

y las denotaremos por

y

Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y

los perfiles columna Para el modelo probabilista las observaciones provienen de

una muestra

de una ley bidimensional La hipoacutetesis a comprobar

es que los dos marginales de esta ley son independientes Si este es el caso los

perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna

de la de

y

Es equivalente a decir que las frecuencias conjuntas deben estar cerca de

los productos de las frecuencias marginales

Las frecuencias conjuntas por un lado (distribucioacuten observada) y los

productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen

dos distribuciones de probabilidad sobre el conjunto producto

Podemos por tanto calcular la distancia de

chi-cuadrado de una con respecto a la otra

Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la

distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale

Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la

definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado

Por lo dicho anteriormente para suficientemente grande podemos

aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el

nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados

a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las

que han sido estimadas Hay para el caraacutecter y para el caraacutecter

(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley

chi-cuadrado seraacute por tanto

Vamos a presentar un ejemplo de dos caracteres binarios que tienen que

ver con enfermos para los cuales se ha observado si tienen o no una tendencia al

suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y

neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las

tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla

de contingencia observada es

Tendencia Sin tendencia Total

Psicosis 20 180 200

Nneurosis 60 140 200

Total 80 320 400

La distancia de chi-cuadrado de contingencia calculada a partir de esta

tabla es de El valor tomado por el estadiacutegrafo es el cual

debemos comparar con la ley El p-valor es de

Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre

la tendencia al suicidio y la clasificacioacuten de las enfermedades

El test no precisa el sentido de esta dependencia Para describirla hay que

comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre

los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten

PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS

Los investigadores se interesan constantemente en las diferencias entre dos

poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado

civil profesioacuten color de ojos preferencia por una marca etc)

Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de

contingenciardquo

Se puede realizar una prueba para la diferencia entre dos proporciones

sobre la base de muestras independientes usaacutendose como instrumento la prueba

de chi cuadrado

El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es

la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se

podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda

Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la

ecuacioacuten

n

nnE CR

donde

nR nuacutemero total en el rengloacuten

nC nuacutemero total en la columna

n tamantildeo total de la muestra

El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado

entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia

al cuadrado se divide entre la frecuencia esperada de la celda

La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se

rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el

valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados

de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el

tamantildeo de la muestra

CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD

Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a

las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se

puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la

distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado

siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal

Por consiguiente al probar la diferencia entre las dos proporciones la

distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes

Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia

direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten

normal

La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede

ilustrar mediante el siguiente ejemplo

Cuartos de bantildeos modernos

Cocina moderna Caren

cia

existenc

ia

totales

Carencia 72 8 80

Existencia 7 146 153

La hipoacutetesis nula y alternativa seriacutean

YN ppH 0

YN ppH 0

Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de

significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute

Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H

A partir de la informacioacuten del cuadro

10080

8

N

NSN

n

Xp 95420

153

146

Y

YSY

n

Xp

A partir de la expresioacuten

21

21

111

nnpp

pPZ SS

donde

661015380

1468

p

por lo tanto

0813

153

1

80

133906610

95420100

Z

Totales 79 154 223

Dado que 1960813 Z se rechaza la 0H por lo tanto hay

diferencia entre las dos proporciones

Usando la prueba de chi cuadrado y la tabla de contingencia de este

ejemplo se tiene

Las frecuencias teoacutericas se pueden obtener a partir de la siguiente

ecuacioacuten

n

nnE CR

Por lo tanto se tiene

1227233

7980E 8852

233

15480E

8851233

79153E 12101

233

154153E

Chi cuadrado se obtiene a partir de la expresioacuten

E

EOX

2

2

A partir de la tabla se tiene

O E (O ndash E) (O ndash E)2

(O ndash E)2E

7

2

2

712

+4488 20142144 742704

7 5

188

- 4488 20142144 388245

8 5 -4488 20142144 380903

288

1

46

1

0112

+4488 20142144 199191

1711043

10431712 CALCULADOX

Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el

84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo

tanto hay diferencia entre las dos proporciones

Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la

distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos

distribuciones que a un nivel de significancia de 005 el valor de 196 es el

cuadrado de 3 841 es decir 22 ZX

CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA

La afirmacioacuten de que no existen diferencias entre proporciones significa

que las dos variables son independientes Cuando las conclusiones se presentan en

esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo

Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que

no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la

hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos

variables Independientemente de que la prueba de chi cuadrado se considera una

prueba de diferencia entre dos proporciones o una prueba de independencia los

caacutelculos y resultados son exactamente los mismos

CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE

Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o

intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que

ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de

probabilidades

Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que

seguir varios pasos Primero se tiene que establecer la distribucioacuten de

probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada

paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la

media) se deben establecer mediante hipoacutetesis o estimarlos con base a la

informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para

determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o

intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado

para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la

informacioacuten

BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON

La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de

Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la

cantidad de automoacuteviles estacionados en una cochera cubierta siguen una

distribucioacuten de Poisson 0H

En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero

de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una

muestra aleatoria de 233 casas

Numero de automoacuteviles Frecuencia

0 61

1 151

2 21

233

Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados

de la distribucioacuten de frecuencia

No de automoacuteviles Frecuencia observada On

0 61 0

1 151 151

2 21 42

233 193

808280233

193

1

n

On

X

n

i por lo tanto 80X

El valor de la media muestral se utilizara como el estimado de X

Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)

y se obtiene la frecuencia teoacuterica para cada una

Automoacutevil

n

Frecuencia

O

Probabilidad

XP

Frecuencia (E)

XPn

0 61 04493 104687

1 151 03595 87764

2 21 01438 33505

Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de

significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX

El valor calculado de chi cuadrado es

50679

2

2

K

CALCULADO

E

EOX

Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de

automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una

distribucioacuten de Poisson

CORRECCIOacuteN DE YATES

Cuando se aplican a datos discretos los resultados para distribuciones

continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres

comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de

Yates la cual viene dada mediante la expresioacuten

E

EOX CALCULADO

502

2

En general la correccioacuten se hace solamente cuando el numero de grados

de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos

resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en

relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia

esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi

cuadrado corregido y no corregido Si ambos valores conducen a la misma

conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se

presentan dificultades Si conducen a conclusiones diferentes se puede o bien

incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear

meacutetodos de probabilidad exactos

El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente

ejemplo

En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces

Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de

significancia del 005

No de caras Frecuencia Probabilidad Frecuencia (E)

Cara 115 05 100

cruce 85 05 100

2054

100

0510085

100

0510011522

2

CALCULADOX

Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado

con correccioacuten de Yates es

8432 TABULADOX

Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha

PRUEBA EXACTA DE FISHER

Para examinar la igualdad de las varianzas de dos poblaciones

independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de

las varianzas de las dos muestras Suponiendo que la informacioacuten de cada

poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2

2

2

1 SS sigue una

distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso

estadiacutestico RA Fisher

Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de

grados de libertad los grados de libertad en el numerador y en el denominador

la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea

2

2

2

111 21

S

SF nn

donde

n1 = tamantildeo de muestra en el grupo 1

n2 = tamantildeo de muestra en el grupo 2

n1 ndash 1 = grados de libertad en el grupo 1

n2 ndash 1 = grados de libertad en el grupo 2

2

1S varianza de la muestra en el grupo 1

2

2S varianza de la muestra en el grupo 2

Al probar la igualdad de dos varianzas se pueden emplear pruebas de una

cola o de dos colas

El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente

ejemplo

Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas

alta en la planta A que en la planta B Para determinar la variabilidad se puede

establecer una prueba de una cola en la forma siguiente

22 BAOH

22

1 BAH

Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta

A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta

ubicada en la cola superior de la distribucioacuten

Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de

libertad en el numerador y 19 en el denominador a un nivel de significancia de

001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene

71162 AS y 20142 BS por lo tanto

38512014

71162

2

1924 F como 1385 lt

292 no se rechaza la hipoacutetesis nula ( OH )

CONCLUSIOacuteN

La conclusioacuten que los resultados de una medida variable es la causa de

variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten

estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero

no puede reclamar legitimidad

La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en

describir la distribucioacuten de las variables estudiadas y en particular de los datos

numeacutericos Ademaacutes de las medidas descriptivas correspondientes el

comportamiento de estas variables puede explorarse graacuteficamente de un modo

muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro

organizador de las ciencias computarizadas y el modelo que nos dota de un

mejor razonamiento para implementar programas eficientes En este sentido la

combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un

reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en

colegios y universidades

Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de

combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y

evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras

loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre

operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten

juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la

teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones

simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades

que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea

BIBLIOGRAFIacuteA

AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis

Third Edition Texts in Statistical Science Chapman and Hall

BOXG E P HUNTER W G HUNTER JS (1978) Statistics for

Experimenters John Wiley amp Sons

BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores

Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de

Modelos Ed Revertsbquo SA

Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed

Piraacutemide

Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten

(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica

Matemaacutetica I Universidad de Antioquia

Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma

Madrid

Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill

Meacutexico

Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten

yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico

Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw

ndashHill 4ta Edicioacuten Colombia

CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana

Meacutexico

COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas

COX DR (1958) Planning of experiments New York John Wiley amp Sons

DANIEL C Applications of Statistics to Industrial Experimentation Willey

DAVIES OL The Design and Analysis of Industrial Experiments Hafner

(McMillan)

DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias

Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico

SA de CV Meacutexico

De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H

(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico

Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta

Estadiacutestica Editorial Microsoft corporation USA

ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial

Limusa SA Meacutexico

EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis

Arnold

FEDERER W (1965) Experimental design Oxford Publ Co

GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la

Varianza Grupo Editorial Universitario

FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico

McGraw Hill

FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque

ModernoEditorial SA Meacutexico

George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y

Meacutetodosrdquo Ed McGraw-Hill

GILL JL (1978) Design and Analysis of Experiments in the Animal and

Medical Sciences Iowa State University Press

JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression

and Experimental Design Springer-Verlag

Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor

Caracas

GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining

Institute

GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data

Mining Institute

Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial

Bourgeoacuten Caracas

Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la

EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute

Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial

BourgeoacutenCA Caracas ndash Venezuela

HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis

Multivariante 5ordf Edicioacuten Prentice Hall

JOBSON JD (1992) Applied Multivariate Data Analysis Volume II

Categorical and Multivariate Methods Springer-Verlag

KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial

Hispanoamericana Meacutexico

KIRK RE Experimental Design Procedures for the Behavioral Sciencies

BrooksCole Publishing Company

LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e

inferencia Estadiacutestica Editorial Limusa Meacutexico

LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV

Grupo Noriega Editores Meacutexico

LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial

HARLA Meacutexico

LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta

edicioacuten Editorial McGaw-Hill Usa

Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial

Hispanoameacuterica VI edicioacuten Meacutexico

LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire

Multidimensionnelle 3ordf Edition DUNOD

LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e

Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB

Caracas- Venezuela

LORENZEN T J Anderson V L (1993) Design of experiments A No-Name

Approach Marcel Dekker Inc

Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc

(1999) SPSS 90 Manual de Usuario SPSS Chicago

MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis

Academic Press

Enfocados hacia SPSS

Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de

wwwspssparatodoscom 2005

MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten

Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla

Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea

Ediciones Alfaomega SAN Meacutexico

MASON RL Statistical Design and Analysis of Experiments with Applications

to Engineering and Science John Wiley amp Sons New York

MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y

Economiacutea Editorial Iberoamericana Meacutexico

MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in

agriculture and experimental biology Second edition Chapman amp Hall

MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo

Editorial Iberoameacuterica

MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers

John Wiley amp Sons

Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial

Reverte Mejicana Meacutexico

Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da

Edicioacuten Meacutexico

Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc

Graw Hill

PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones

Editorial Limusa Meacutexico

NETER J et al Applied Linear Statistical Models Regression Analysis of

Variance and Experimental Designs Library of Congress Cataloging Publication

Data

OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp

RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo

Editorial Universitario

PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos

Lineales y Series Temporales Vol 1 y 2 Alianza Editorial

Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores

Spain SA Espantildea 2005

PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial

Mir Moscuacute

RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed

McGraw-Hill

Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca

UCV Caracas ndash Venezuela

RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE

Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en

Psicologiacuteardquo p 1

SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons

Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti

Caracas ndash Venezuela

Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores

deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico

Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica

Editorial Harla Meacutexico

STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y

procedimientos Segunda edicioacuten McGraw Hill

SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas

Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1

Ediciones UNESR Caracas

URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante

Coartiacuteculo Plan Nuevo Editorial AC

VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II

Anaacutelisis Multivariante) Mc-Graw Hill

Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows

Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea

2002

WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros

Editorial Interamericana Meacutexico

Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8

Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage

Learning Editores p 364 ISBN 9706861947

Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea

Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea

Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de

CV Meacutexico

Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para

Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico

DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR

httpesmwikipediaorgwikiSPSS

httpwwwbuenastareascomensayosque-es-el-SPSS1465478html

httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-

del-software-estadistico-integral-spss-base-160

httpesanswersyahoocomquestionindexqid=20070727073908aatuamw

httpwwwslidesharenetleticiagpestructura-de-spss-3126476

httpwwwehowenespanolcomprograma-spss-sobre_48697

httpwwwugres~bioestmedicinamanual_spsspdf

httpwwwmonografiascomtrabajos12tutortutorshtml

httpwwwspsscom

wwwspssparatodoscom

httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html

httpwwwspssfreecomcapitulotreshtml

httpwwwuvesRELIEVEemail relieveuves

httpwwwscribdcomdochellipspss-introduccioacuten

httpeswikipediaorgwikiSPSS

httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd

f

httpwwwspsscomaressuccessargentinashtml

httpeswikipediaorgwikiSPSS

httpwww-01ibmcomsoftwareesanalyticsspss

httppsicofcepurvesspssindex0htm

httpssitesgooglecomsiteestadisticaconelspss

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpe-stadisticabioucmesweb_spssindice_spsshtml

httpwwwquimicaurvesquimiogeneralanovacastpdf

httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da

tosyMultivariable14anova1_SPSSpdf

httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800

20AnE1lisis20de20Varianzaspdf

httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-

pearson

httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf

httpwwwuoceduin3emathdocsRegresionLinealpdf

httpeswikipediaorgwikiRegresiC3B3n_lineal

httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES

ION_LINEAL_CON_SPSSpdf

httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN

EAL20SIMPLE20CON20SPSSpdf

httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE

SION_LINEAL_CON_SPSSpdf

httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm

httpeswikipediaorgwikiNivel_de_medida

httphtmlrincondelvagocomregresion-lineal-simplehtml

httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp

lepdf

httpwwwvitutorcomestadisticabi8html

httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf

httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-

Martinez_1pdf

httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml

httpesslidesharenetpatolinkecuacin-de-regresin-lineal

httpeswikipediaorgwikiMC3ADnimos_cuadrados

httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios

httpwwwwordreferencecomdefinicioncorrelaciC3B3n

httpwwwditutorcomestadistica_2correlacion_estadisticahtml

httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson

httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n

httpeswikipediaorgwikiMatriz_de_correlaciC3B3n

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpwwwinfecepiunizares

httpwwwltbioestadisticaumaes

httpwwwuaqmxmatematicasestadisticasxu3html

httpwwwmembers-americastripodcom

httpwwwmsiplceorg

httpwwwbnvcocrsesionnotaaspg

httpwwwaltavistacom

httpwwwauyantepuycom

httpwwwinees

httpwwwudeccl

httpwwwrincondelvagocom

httpwwwmonografiascom

httpwwwfestadisticafguamesindicadoresiprihtml

httpwwwuaqmxmatematicasestadisticaxu3html

httpwwwinegoboiwd0801htmlE

httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm

httpwwwitlpedumx

httpwwweclaevespanovestadisticasna93nnsnann7eshtml

httpw3moritesmmx~cmendozamaestestoohtml

httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml

httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion

httpwwwunleduarfaveseiencuestasindexhtml

httpwwwmonografiascomtrabajos11operaoperashtml

httpwwwmonografiascomtrabajos6hisohisoshtml

httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos

httpwwwmonografiascomtrabajos16sistema-operativosistema-

operativoshtmlTIPPOS

httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-

operativoshtml

httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei

httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml

httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-

operativo

httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software

httpwwwsscccoclinformaticaconceptoshtml

httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr

httpwwwcadcommxhistoria_de_la_computacionhtm

httpwwweswikipediaorgwikiBus_(informC3A1tica)

httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla

httpwwwcavsicompreguntasrespuestasque-es-el-teclado

httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm

Page 9: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,

El uso de meacutetodos no parametricos ofrece numerosas ventajas

1 los meacutetodos no parametricos se pueden usar con todo tipos de datos

ndash informacioacuten cualitativa (de escala nominal) informacioacuten en forma de rangos

(escala ordinal) asiacute como informacioacuten medida de un modo mas exacto (escala de

intervalo o de razoacuten)

2 por lo general son faacuteciles de aplicar y raacutepidos de calcular con

tamantildeos pequentildeos de muestra En ocasiones son tan sencillos que basta contar

con la frecuencia con que algunas caracteriacutesticas aparecen en los datos Por lo

tanto a menudo se usan para estudios piloto o preliminares yo en situaciones en

que se desean respuestas raacutepidas

3 hacen menos premisas menos estrictas (mas faacuteciles de cumplir) que

los procedimientos claacutesicos por lo tanto gozan de mayor aplicabilidad y

proporcionan un conjunto de conclusiones mas generales de base mas amplia

4 permiten solucionar problemas que no implican pruebas de

paraacutemetros de poblacioacuten

5 son mas econoacutemicos que los procedimientos claacutesicos ya que el

investigador puede aumentar la potencia y a pesar de ello ahorrar dinero tiempo y

trabajo al recopilar muestras de datos mayores medibles con mas aproximacioacuten

lo que soluciona con mayor rapidez el problema

6 seguacuten el procedimiento seleccionado los meacutetodos no parametricos

pueden ser tan poderosos (o casi tanto) como el procesamiento claacutesico cuando se

cumplen las premisas de este ultimo y quizaacutes sean un poco mas poderosos aun

cuando no se cumplan

Los procedimientos no parametricos tambieacuten ofrecen algunas desventajas

1 no conviene usar meacutetodos no parametricos cuando se pueden

cumplir todas las premisas de los procedimientos claacutesicos y los datos se miden en

una escala bien sea de intervalos de razones A menos de que se empleen

procedimientos claacutesicos en estos casos el investigador no esta aprovechando por

completo los datos Se pierde informacioacuten al convertir datos recopilados (de una

escala de intervalo o de razoacuten) a rangos (escala ordinal) o categoriacuteas (escala

nominal) En particular en esas circunstancias algunas pruebas no parametricas

muy raacutepidas y sencillas tienen mucha menos potencia que los procedimientos

claacutesicos y por lo general se deben evitar

2 seguacuten aumenta el tamantildeo de la muestra en ocasiones el manejo

requerido de datos para los procedimientos no parametricos se hace laborioso a

menos que se disponga de un paquete de computacioacuten adecuado

3 con frecuencia se necesitan tablas especiales de valores

criacuteticos y estas no se obtienen con tanta facilidad como las tablas de los

valores criacuteticos normales t 2X y F Ccedil

Prueba de signos para una sola muestra

Salvo para las pruebas con muestra grande todas las pruebas estaacutendar

concernientes a medias estaacuten basadas en la suposicioacuten de que las poblaciones que

se muestrean tienen aproximadamente la forma de distribuciones normales

Cuando en un caso determinado esta suposicioacuten resulta insostenible la prueba

estaacutendar se puede sustituir por una de varias alternativas no parametricas entre

ellas la ldquoprueba de signosrdquo

La prueba de signos de una sola muestra se aplica cuando se muestrea una

poblacioacuten simeacutetrica continua de manera que la probabilidad de que un valor de la

muestra sea menor que la media o mayor que la media es en ambos casos frac12 Para

probar la hipoacutetesis nula ( O ) contra una hipoacutetesis alternativa apropiada con

base en una muestra aleatoria de tamantildeo n se sustituye cada valor de la muestra

mayor que O por un signo de mas y cada valor de la muestra menor que O por

un signo de menos despueacutes se aprueba la hipoacutetesis nula de que estos signos de

mas y menos son valores de una variable aleatoria que tiene distribucioacuten binomial

con 2

1p (si un valor de la muestra es igual a O simplemente lo rechazamos)

Prueba de suma de rangos

Se puede utilizar cuando se desea probar una hipoacutetesis relacionada a un

paraacutemetro que refleje una tendencia central Cuando no se cumplen las premisas

de la prueba t el procedimiento de Wilcoxon es probable que sea mas potente

para detectar la existencia de diferencias importantes que su contraparte

correspondiente

Para llevar a cabo la prueba de rangos y signos de Wilcoxon se puede

aplicar el siguiente procedimiento de seis pasos

1 para cada partiacutecula en una muestra de n partidas se obtiene un

resultado de diferencia Di

2 despueacutes no se toman en cuenta los signos + y ndash y se obtiene un

grupo de n diferencias absolutas iD

3 se omite de cualquier anaacutelisis adicional cualquier diferencia

absoluta con resultados de 0 con lo cual se obtiene un grupo de n resultados de

diferencias absolutas que no sean cero donde n

4 despueacutes se asignan rangos Ri desde uno hasta n a cada una de las

iD de modo que el resultado de diferencia absoluta mas pequentildeo obtiene una

clasificacioacuten de uno y el mayor de n Por la falta de precisioacuten en el proceso de

medicioacuten si dos o mas iD son iguales a cada una se asigna el ldquorango promediordquo

de los rangos que de lo contrario se les hubieran asignado individualmente si no

hubiera ocurrido la igualdad de los datos

5 ahora se asignan de nuevo el siacutembolo + o el signo ndash a cada uno de

los n rangos de Ri dependiendo de si originalmente Di era positiva o negativa

6 la prueba estadiacutestica de Wilcoxon W se obtiene como la suma de

las clasificaciones +

n

i

iRW1

Para muestras de n 20 se puede utilizar tablas para obtener los valores

criacuteticos de la prueba estadiacutestica W tanto para las pruebas de una cola como de dos

a diversos niveles de significacioacuten Se rechaza la hipoacutetesis nula en una prueba de

dos colas si el valor observado W es igual o excede al valor critico superior o es

igual o inferior al valor critico inferior Se rechaza la hipoacutetesis nula en una prueba

de una cola en direccioacuten positiva si el valor observado W es igual o excede el

valor critico superior Se rechaza la hipoacutetesis nula para una prueba de una cola en

direccioacuten negativa si el valor observado de w es inferior o igual al valor critico

inferior

Para nge20 la prueba estadiacutestica W tiene distribucioacuten aproximadamente

normal y se puede utilizar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis nula

W

WWZ

VARIABLES ALEATORIA Y COMO SE DIVIDEN

Una variable es aleatoria si toma diferentes valores como resultado de un

experimento aleatorio Puede ser discreta o continua Si puede tomar soacutelo un

nuacutemero limitado de valores entonces es una variable aleatoria discreta En el otro

extremo si puede tomar cualquier valor dentro de un intervalo dado entonces se

trata de una variable aleatoria continua

Se puede pensar en una variable aleatoria como un valor o una magnitud

que cambia de una presentacioacuten a otra sin seguir una secuencia predecible Los

valores de una variable aleatoria son los valores numeacutericos correspondientes a

cada posible resultado de un experimento aleatorio

La distribucioacuten de probabilidad de una variable aleatoria proporciona una

probabilidad para cada valor posible y estas probabilidades deben sumar 1

VALOR ESPERADO DE UNA VARIABLE ALEATORIA

El valor esperado es una idea fundamental en el estudio de las distribuciones de

probabilidad

Para obtener el valor esperado de una variable aleatoria discreta se

multiplica cada valor que la variable puede tomar por la probabilidad de

presentacioacuten de ese valor y luego se suman esos productos Es un promedio

pesado de los resultados que se esperan en el futuro El valor esperado pesa cada

resultado posible con respecto a la frecuencia con que se espera se que presente

En consecuencia las presentaciones maacutes comunes tienen asignadas un peso

mayor que las menos comunes

El valor esperado tambieacuten puede ser obtenido a partir de estimaciones

subjetivas En ese caso el valor esperado no es maacutes que la representacioacuten de las

convicciones personales acerca del resultado posible

VARIABLES ALEATORIAS DISCRETAS

Variable que toma un nuacutemero finito o infinito de valores numerables

Sean x1 x2 x3 xn los distintos valores que puede tomar la variable

aleatoria

Y p(x1) p(x2) p(xn) su probabilidad

Los pares de valores (xj p(xj)) constituyen la distribucioacuten de probabilidades de la

variable aleatoria

p(x) se denomina funcioacuten de probabilidad y debe cumplir con las siguientes

propiedades

0 lt p(xj) lt 1 (p(x) es una probabilidad y por lo tanto debe tomar valores

entre 0 y 1)

1)( jxP (la suma de probabilidades repartidas entre todos los valores

de la variable debe ser igual a 1)

De la misma manera que calculamos frecuencias acumuladas podemos acumular

probabilidades obteniendo la funcioacuten de distribucioacuten de probabilidades

Esta funcioacuten representa la probabilidad de que la variable aleatoria sea menor o

igual que un determinado valor

F(xj) = P (X lt xj)

Graacuteficamente la funcioacuten aumenta de a saltos ya que entre dos valores

consecutivos de una variable discreta no puede tomar valores intermedios

VARIABLES ALEATORIAS CONTINUAS

En este caso en lugar de trabajar con la probabilidad de valores

particulares de la variable resulta maacutes apropiado calcular probabilidades

asociadas a intervalos Para distribuir propiedades se usa una funcioacuten que mide

concentracioacuten de probabilidades alrededor de un punto que se denomina

funcioacuten de densidad de probabilidad (fdp) y se denota como f(x)

Una funcioacuten de densidad de probabilidad debe cumplir con las siguientes

propiedades

F(x) gt 0 (la funcioacuten es no negativa para cualquier valor de x f(x) no es

una probabilidad y puede valer maacutes de 1)

el aacuterea bajo la curva de la funcioacuten vale 1)

La funcioacuten de distribucioacuten para una variable aleatoria continua se calcula

F(a) = P(X lt

La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula

P (alt x lt b) = F(b) - F(a)

La probabilidad de que la variable tome un valor particular se puede expresar

como

F(c) - F(c) = 0

DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO

Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia

valores de una variable aleatoria con sus respectivas probabilidades es

decir Probabilidad de x = Funcioacuten de x

Las distribuciones se caracterizan por una foacutermula que determina el tipo de

distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio

muestral

En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una

funcioacuten de la probabilidad que representa los resultados que se van obteniendo en

un experimento aleatorio

Asiacute para un nuacutemero dado x la probabilidad es

A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la

variable X y representa la probabilidad de que la variable tome el valor desde

hasta x

Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de

probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad

Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos

y seraacuten mutuamente excluyentes y su suma es el

suceso por lo que tenemos entonces que

y finalmente

Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos

los valores de la variable aleatoria x conoceremos completamente la distribucioacuten

de probabilidad de la variable

Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten

de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente

Es decir la probabilidad de todo el espacio muestral es 1 tal y como

establece la teoriacutea de la probabilidad y por otra parte

Es decir la probabilidad del suceso nulo es cero

Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de

probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes

praacutectico el uso de la funcioacuten de densidad

En el caso de una variable discreta la distribucioacuten puede describirse

mediante una funcioacuten de probabilidad que para cada valor de x de la variable X

determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de

una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de

distribucioacuten la que para cada valor provee la probabilidad de no ser superado

evidentemente el valor de la funcioacuten de distribucioacuten es igual

a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo

inferior del dominio de la variable hasta x inclusive Lista de los resultados de un

experimento con las probabilidades que se esperariacutean ver asociadas con cada

resultado

Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores

diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12

En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica

Para el caso de 1 solo dado donde todos los valores tienen la misma

probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme

Prueba de aleatoriedad

Con frecuencia se supone que los datos recopilados constituyen una

muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la

utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash

Wolfowitz de corridas de una muestra para aleatoriedadrdquo

Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o

la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos

siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la

partida tiene una propiedad en particular o de la cantidad o magnitud en que se

posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la

sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con

distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente

de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que

la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las

partidas que la preceden o las que la suceden en forma tal que la probabilidad de

su ocurrencia varia de una posicioacuten a otra el proceso no se considera como

aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando

esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en

forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico

Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el

tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico

de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una

prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede

rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la

sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de

una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2

exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por

consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis de aleatoriedad

U

UUZ

donde

U = numero total de corridas

U = valor medio de U 12 21

n

nnU

U = desviacioacuten estaacutendar de U 1

222

2121

nn

nnnnnU

n1 = numero de eacutexitos en la muestra

n2 = numero de fracasos en la muestra

n = tamantildeo de la muestra n = n1 + n2

PRUEBA DE McNEMAR

Suele darse el caso en que se desean comparar las proporciones de los

datos de muestras tomados de poblaciones relacionadas En este caso se quisiera

determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a

alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea

determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y

otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede

utilizar la prueba desarrollada por McNemar

El principal intereacutes es determinar si hay diferencia entre las dos

proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta

que el otro (prueba de una cola)

La prueba estadiacutestica para la prueba de McNemar es

CB

CBZ

PRUEBA U DE MANN ndash WHITNEY

Es una alternativa no parametrica a la prueba t de dos muestras para la

diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula

μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos

la forma de distribuciones normales de hecho la prueba solo requiere que las

poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no

importa si se cumple o no esta suposicioacuten

Estadiacutesticos U1 y U2

111

2112

1 W

nnnnU

222

2122

1 W

nnnnU

PRUEBA DE RACHAS

Son todas las diferencias que tiene el mismo signo y se presentan en una

misma fila Una serie de n diferencias puede tener solamente una racha (toda

positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las

rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de

poblaciones con la misma distribucioacuten de frecuencias Colocamos las

observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces

contamos el numero de rachas item de cada una de las muestras Si hay menos

rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales

rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten

La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de

que las observaciones se han sacado aleatoriamente de una sola poblacioacuten

Para hacer esto se halla la mediana de la muestra y se designa las

observaciones situadas por debajo de la mediana por un signo menos (-) y las

observaciones situadas por encima de la mediana por un signo (+) Si el numero

de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado

rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el

numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10

puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la

tabla normal con

u

uu

z

2

1

12

21

21

NN

NNu

)1()(

2(2

21

2

21

2121212

NNNN

NNNNNNu

DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES

DISTRIBUCIONES DE EJEMPLO Y USO

DISTRIBUCIOacuteN NORMAL O GAUSSIANA

Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que

multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal

Esta distribucioacuten de caracteriza porque los valores se distribuyen formando

una campana de Gauss en torno a un valor central que coincide con el valor

medio de la distribucioacuten

Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a

la izquierda

Esta distribucioacuten viene definida por dos paraacutemetros

X N (m S2)

m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro

de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores

estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores

estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de

ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten

estaacutendar

Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina

normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo

que permiten obtener esos mismos valores donde se recoge la probabilidad

acumulada para cada punto de la curva de esta distribucioacuten

Ademaacutes toda distribucioacuten normal se puede transformar en una normal

tipificada

Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con

media 10 y varianza 4 Transformarla en una normal tipificada

X N (10 4)

Para transformarla en una normal tipificada se crea una nueva variable (Y)

que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica

(que es la raiacutez cuadrada de la varianza)

En el ejemplo la nueva variable seriacutea

Esta nueva variable se distribuye como una normal tipificada

permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor

Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos

indicado de que las probabilidades para cada valor de la curva se encuentran

recogidas en una tabla

MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)

La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten

normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta

distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros

y lo que representamos del modo si su funcioacuten de densidad

es

Observacioacuten

Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y

la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes

adelante65

La forma de la funcioacuten de densidad es la llamada campana de Gauss

Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten

normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1

Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un

uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto

con lo cual en coinciden la media la mediana

y la moda y por uacuteltimo calcular sus puntos de inflexioacuten

El soporte de la distribucioacuten es todo de modo que la mayor parte de la

masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se

encuentra concentrado alrededor de la media y las ramas de la curva se extienden

asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la

media es posible (aunque poco probable)

La forma de la campana de Gauss depende de los paraacutemetros y

indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)

Figura Distribuciones gaussianas con diferentes medias e igual

dispersioacuten

(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor

sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor

de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea

``maacutes aplastado seraacute

Figura Distribuciones gaussianas con igual media pero varianza

diferente

La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes

adelante que es

Como consecuencia la distribucioacuten normal es reproductiva con respecto a

los paraacutemetros y ya que

Observacioacuten

Como se ha mencionado anteriormente la ley de probabilidad gaussiana la

encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza

por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el

de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que

apuntar un hecho negativo para esta ley de probabilidad

La funcioacuten no posee primitiva66

conocida67

Las consecuencias desde el punto de vista praacutectico son importantes ya que

eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de

la normal y nos tenemos que limitar a decir que

sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente

esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho

puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto

se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en

problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde

se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie

limitada de valores xi dados Normalmente F se encuentra tabulada para una

distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten

normal tipificada

En el caso de que tengamos una distribucioacuten diferente se

obtiene Z haciendo el siguiente cambio

De manera general se tiene

Proposicioacuten (Cambio de origen y escala)

Sean Entonces

Este resultado puede ser utilizado del siguiente modo Si y nos

interesa calcular

1 Hacemos el cambio y calculamos

2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de

modo aproximado) Como

tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada

Ejemplo

Supongamos que cierto fenoacutemeno pueda ser representado mediante una

va y queremos calcular la probabilidad de que Xtome un valor

entre 39 y 48 es decir

Comenzamos haciendo el cambio de variable

de modo que

Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que

hemos mencionado anteriormente

Proposicioacuten

Sea Entonces

Demostracioacuten

Por ser la normal una ley de probabilidad se tiene que

es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con

respecto a se obtiene el valor 0

luego

Para demostrar la igualdad entre la y basta con aplicar la misma

teacutecnica pero esta vez derivando con respecto a

Luego

Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en

primer lugar la va tipificada de X

y calculamos

Como por la proposicioacuten 5 deducimos que

CURVA NORMAL ESTANDARIZADA

Una variable numeacuterica puede clasificarse como discreta o continua Las

variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas

con la idea de contar Las variables continuas se pueden asociar con la idea de

medir utilizando fracciones y decimales Cuando la variable es continua el

modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal

El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten

normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran

cantidad de variables continuas

El modelo matemaacutetico

La funcioacuten matemaacutetica que se usa como modelo es

e = 271

π = 314

μx = media de la poblacioacuten

σx = desviacioacuten estaacutendar de la poblacioacuten

x = un valor de la variable continua

Como e y π son constantes la forma de la curva normal depende

solamente de los dos parametros de la distribucioacuten normal la media μx y la

desviacioacuten estaacutendar σx

Las diferentes curvas normales van a variar dependiendo de esos dos

paraacutemetros

En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar

visualmente como una curva en forma de campana El aacuterea debajo de esta curva se

halla por medio del integral de la funcioacuten y corresponde al por ciento o la

proporcioacuten de puntuaciones que se encuentran en el intervalo dado

Propiedades de las distribuciones normales

a Son simeacutetricas y tienen forma de campana

b Al ser simeacutetricas la media la moda y la mediana coinciden

c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea

de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media

d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la

curva se encuentra a tres desviaciones estaacutendar de la media

En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral

de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de

diferentes secciones de la curva o se utiliza la computadora para calcular ese valor

del aacuterea

La distribucioacuten normal estandarizada

Puesto que hay un nuacutemero infinito de combinaciones para los dos

paraacutemetros hay un nuacutemero infinito de curvas normales diferentes

Este problema se ha resuelto praacutecticamente al transformar los valores de

todas las distribuciones normales a los valores de una distribucioacuten normal

estandarizada representada por la curva normal estandarizada (standard normal

curve)

Las puntuaciones estandarizadas se logran restando la media a cada

observacioacuten y dividiendo entre la desviacioacuten estaacutendar

donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar

Propiedades de la distribucioacuten normal estandarizada

μ z = 0

σ z = 1

En muchas ocasiones se quieren comparar puntuaciones que pertenecen a

dos distribuciones normales diferentes La diferencia entre las dos distribuciones

radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo

la comparacioacuten se hace posible si se convierten las puntuaciones de ambas

distribuciones a puntuaciones z que corresponden a la distribucioacuten normal

estandarizada

Percentiles y rangos percentiles de una distribucioacuten normal estandarizada

Si se desea hallar la percentiles o el rango percentil en una distribucioacuten

normal no estandarizada se recurre al procedimiento de convertir las puntuaciones

de la distribucioacuten normal dada a puntuaciones z que corresponden a la

distribucioacuten normal estandarizada

Estos valores en la distribucioacuten normal estandarizada se pueden obtener

por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en

las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el

intervalo dado

Es necesario visualizar siempre el aacuterea debajo de la curva como el por

ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo

dado

Cuando una distribucioacuten de puntuaciones es normal estandarizada la

pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar

en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o

cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten

dada

DISTRIBUCIOacuteN GAMMA

Una variable aleatoria X asociada a un experimento aleatorio tiene una

distribucioacuten GAMMA si se caracteriza por las siguientes propiedades

Algunas alternativas de funciones de densidad se pueden ver en la graacutefica

del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)

respectivamente =1

=1

La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo

III

El modelo Gamma se ha utilizado frecuentemente en variables tales como

ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el

intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson

ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900

ndash Flujos maacuteximos MARKOVIC 1965

ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965

ndash Altura de la precipitacioacuten mensual WHITCOMB 1940

ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia

infin

ndash Ingresos familiares

ndash Edad del hombre al contraer matrimonio por primera vez

ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en

subestaciones a una frecuencia part

Ejemplo

Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos

de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia

promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo

de tiempo se encuentre hasta que ocurre el segundo ciclo

a Dentro de una desviacioacuten con respecto del tiempo promedio

b A maacutes de dos desviaciones por encima de la media

Solucioacuten

X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en

horas

Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)

= 2

Y Nuacutemero de ciclos hora ---------Y~P( =002)

E(Y) = 002 =

X ~ G(2 002)

Ejemplo

En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de

kilovatios por hora puede considerarse como una variable aleatoria con

distribucioacuten GAMMA de paraacutemetros = 3 y

= 05

La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de

KWhora

iquestCuaacutel es la probabilidad de que este abastecimientos sea

a Insuficiente en un diacutea cualquiera

b Se consuman entre 3 y 8 millones de K WHora

c c Encuentre E(x) y V(x)

SOLUCIOacuteN

DISTRIBUCIOacuteN PARETO

En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad

continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores

es

Su funcioacuten de distribucioacuten es

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto

son

El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (

DISTRIBUCIOacuteN T DE STUDENT

Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una

distribucioacuten t con n grados de libertad

Cuando n--gtinfinito a curva t coincide com la normal estandarizada

FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX

MOMENTOS

La distribucioacuten -Student se construye como un cociente entre una normal

y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-

Student con n grados de libertad a la de una va T

donde Este tipo de distribuciones aparece cuando

tenemos n+1 va independientes

y nos interesa la distribucioacuten de

La funcioacuten de densidad de es

Figura Funcioacuten de densidad de una de Student

La distribucioacuten de Student tiene propiedades parecidas a

Es de media cero y simeacutetrica con respecto a la misma

Es algo maacutes dispersa que la normal pero la varianza decrece hasta

1 cuando el nuacutemero de grados de libertad aumenta

Figura Comparacioacuten entre las funciones de densidad de y

Para un nuacutemero alto de grados de libertad se puede aproximar la

distribucioacuten de Student por la normal es decir

Figura Cuando aumentan los grados de libertad la distribucioacuten de

Student se aproxima a la distribucioacuten normal tipificada

Para calcular

DISTRIBUCIOacuteN BETA

Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede

representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un

intervalo de longitud finita Tales como

Proporcioacuten de impurezas en un producto quiacutemico

La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten

La proporcioacuten vendida de un lote durante un tiempo t

La humedad relativa medida en cierto lugar

Porcentaje del costo total destinado a reparacioacuten de maquinaria

Porcentaje de costo adicional destinado a reparacioacuten de maquinaria

La distribucioacuten del tiempo necesario para completar una fase del proyecto

PERT

Evaluacioacuten de programas y teacutecnicas de revisioacuten

Ejemplo

La proporcioacuten de tramos de una autopista que requieren repararse

semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros

= 3 y =2

a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten

b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista

requieren reparacioacuten en un antildeo cualquiera

DISTRIBUCIOacuteN CAUCHY

En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de

Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es

donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene

valor esperado ni varianza

Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V

2 lt 1 el

numero U V tiene la distribucioacuten Cauchy

La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un

grado de libertad

Ejemplo

Sean y dos observaciones independientes de una distribucioacuten

Cauchy con funcioacuten de densidad

Puede demostrarse que si y son tales que entonces la

funcioacuten de verosimilitud de es bimodal

Sean y Supongamos que se desea hacer inferencias sobre el

valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa

Especiacuteficamente interesa encontrar la distribucioacuten final de

Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la

distribucioacuten final de tiene una forma complicada Es conveniente notar sin

embargo que corresponde a la densidad marginal de respecto a la

densidad conjunta

DISTRIBUCIOacuteN BERNOULLI

Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto

suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el

que no lo sea (fracaso) En realidad no se trata maacutes que de una variable

dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello

que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas

obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la

situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este

experimento mediante una va discreta Xque toma los valores X=0 si el suceso no

ocurre y X=1 en caso contrario y que se denota

Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar

una moneda al aire y considerar la va

Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de

probabilidad es

y su funcioacuten de distribucioacuten

Su funcioacuten caracteriacutestica es

Los principales momentos de la X los podemos calcular directamente

o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina

Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)

cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de

intentos

CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE

BERNOULLI

Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la

probabilidad y asegurar que se cumplen las tres condiciones necesarias en

particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del

resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3

requiere que los ensayos o intentos de un proceso de Bernoulli sean

estadiacutesticamente independientes es decir que el resultado de un intento no puede

afectar de ninguacuten modo el resultado de cualquier otro intento

DISTRIBUCIOacuteN EXPONENCIAL

Modelo para variable aleatoria continua que permite representar variables

del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos

Componentes

En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de

probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para

valores x gt 0 es

f(x) = λe - λx

Su funcioacuten de distribucioacuten es

Aqui e significa el nuacutemero e

El valor esperado y la varianza de una variable aleatoria X con

distribucioacuten exponencial son

E[X] = 1 λ

V(X) = 1 λ2

Ejemplo

Ejemplos para la distribucioacuten exponencial son los tiempos dentro

accidentes con probabilidad invariable

La funcioacuten de densidad para λ igual 05 10 y 15

DISTRIBUCIOacuteN MULTINOMIAL

La distribucioacuten multinomial es similar a la distribucioacuten binomial con la

diferencia de que en lugar de dos posibles resultados en cada ensayo

La distribucioacuten multinomial sigue el siguiente modelo

Donde

X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo

que el partido POPO lo hayan votado 3 personas)

n indica el nuacutemero de veces que se ha repetido el suceso (en el

ejemplo 5 veces)

n es factorial de n (en el ejemplo 5 4 3 2 1)

p1 es la probabilidad del suceso X1 (en el ejemplo el 40)

Veamos el ejemplo

Luego

P = 00256

Es decir que la probabilidad de que las 5 personas elegidas hayan votado

de esta manera es tan soacutelo del 256

Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1

Veamos otro ejemplo

En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el

40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4

invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos

Aplicamos el modelo

LuegoP = 00384

Por lo tanto la probabilidad de que el grupo esteacute formado por personas de

estos paiacuteses es tan soacutelo del 384

DISTRIBUCIOacuteN UNIFORME

En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de

probabilidad cuyos valores tienen la misma probabilidad

Caso discreto

Su funcioacuten de probabilidad es en el caso discreto con valores posibles

p(xi) = 1 n

Su funcioacuten de distribucioacuten es en el caso discreto

Su media estadiacutestica es

Caso continuo

Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b

La funcioacuten de densidad en el caso continuo entre a y b es

Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12

Ejemplos

Para un dado perfecto todos los resultados tienen la misma probabilidad 1

6

Calcular variables aleatorias

Las variables aleatorias de probabilidad uniforme pueden calcularse con un

generador de variables aleatorias

DISTRIBUCIOacuteN BINOMIAL

En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad

discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con

probabilidad p de un eacutexito

Su funcioacuten de densidad es

Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)

posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos

((1 - p)n - x

)

El valor esperado de una variable aleatoria de probabilidad binominal es

E[x] = np y su varianza V[x] = np(1 - p)

DISTRIBUCIOacuteN BINOMIAL NEGATIVA

Sobre una sucesioacuten de va de Bernouilli independientes

Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r

eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de

distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo

Su ley de probabilidad se deduce siguiendo el esquema

De nuevo el conjunto de posibles valores de esta va discreta es

Su funcioacuten caracteriacutestica es

y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima

Ejemplo

Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en

operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal

que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda

definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para

intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus

5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones

que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se

necesiten 10 intervenciones

Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por

una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan

4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso

Identificando los paraacutemetros se tiene

Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el

nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy

simple

Y=X+r

Luego

Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente

es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de

que X=10-4=6 Por tanto

La distribucioacuten binomial negativa tambieacuten se puede definir como el

nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas

contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que

DISTRIBUCIOacuteN DE POISSON

Modelo para variable aleatoria discreta que permite calcular la

probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten

discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo

muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos

o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual

a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es

independiente de cuaacutendo se presenta dicho periacuteodo

En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de

probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos

es

Aquiacute e significa el nuacutemero e y x significa el factorial de x

La distribucion de Poisson describe el nuacutemero de sucesos en una unidad

de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un

proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens

en una carrera

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten

Poisson son

E[X] = V[X] = λ

La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos

entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un

conmutador la demanda (necesidades) de los pacientes que requieren servicio en

una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el

nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos

ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una

variable aleatoria discreta que toma valores enteros (0 1 2)

Caacutelculo de la probabilidad de Poisson

La letra X por lo general representa a una variable discreta y puede tomar

valores enteros Utilizamos la letra X para representar a la variable aleatoria y la

letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La

probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson

se calcula con la foacutermula

LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA

DISTRIBUCIOacuteN BINOMIAL

La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la

binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan

cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es

grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan

con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena

aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es

igual o menor que 005 En los casos en que se cumplen estas condiciones

podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media

de la distribucioacuten de Poisson

DISTRIBUCIOacuteN GEOMEacuteTRICA

En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten

probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores

discretos es

P(X = x) = p(1 - p)x - 1

Su funcioacuten de distribucioacuten es

El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media

estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2

Ejemplo

El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es

una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6

DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA

En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de

probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de

masa para valores es

Aqui (a sobre b) es el coeficiente binomial

El valor esperado de una variable aleatoria X de distribucioacuten

hipergeomeacutetrica es

Y su varianza

DISTRIBUCIOacuteN ZETA

En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad

discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos

es

Aqui ζ(s) es la funcioacuten zeta de Rieman con

El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto

DISTRIBUCION CHI CUADRADO

El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una

comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es

diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con

ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno

es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario

estas dos frecuencias acusan una diferencia significativa para por ejemplo un

nivel de significacioacuten del 5

El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la

asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada

por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito

bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor

del famoso libro Statistical Methods for Research Workers (1925) donde se

marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con

Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde

estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y

el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las

pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba

exacta de Fisher

Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico

publicitario presentado a grupos de clientes comparar la rentabilidad de un

proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos

de los turistas por determinados espacios geograacuteficos o por determinados

servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las

frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las

frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o

tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o

de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2

x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos

turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han

ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han

tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula

que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido

en los sitios A y B

Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es

independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo

A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces

alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este

anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos

empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de

las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51

La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten

igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es

2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del

Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del

5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206

podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para

suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B

Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias

observadas empiacutericamente de dos muestras con las frecuencias esperadas o

teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el

Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de

las materias primas perecederas Los resultados son seguacuten atributos cualitativos

los siguientes Primero veremos las frecuencias empiacutericas u observadas

Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten

Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son

131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas

Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y

fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres

columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta

maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x

120 260 = 6046 b2 = 129 x 120 260 = 5954

Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten

igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de

2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de

libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La

diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna

conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten

Es una medida de la discrepancia existente entre las frecuencias

observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso

de frecuencias () debido a que permite determinar las desviaciones entre ellas

ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la

expresioacuten

E

EOX

2

2

Donde

O frecuencia observada

E frecuencia teoacuterica esperada

TEST DE CHI-CUADRADO DE CONTINGENCIA

Un caso particular del test de chi-cuadrado que permite hacer un test sobre

la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-

cuadrado de contingencia Los dos caracteres observados en una misma

poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases

de se denotan las de por Tambieacuten vamos a

denotar

el efectivo conjunto de y es el nuacutemero de individuos para los

cuales toma el valor e el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

Estos valores se representan en una tabla de doble entrada conocida como

tabla de contingencia

Cada fila y cada columna corresponden a una submuestra particular La

fila de iacutendice es la distribucioacuten en las clases de los individuos para

los cuales el caraacutecter toma el valor La columna de iacutendice es la

distribucioacuten en las clases de los individuos para los cuales el caraacutecter

toma el valor Dividiendo las filas y las columnas por su suma se obtienen

frecuencias condicionales para cada una de las distribuciones empiacutericas Para

y las denotaremos por

y

Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y

los perfiles columna Para el modelo probabilista las observaciones provienen de

una muestra

de una ley bidimensional La hipoacutetesis a comprobar

es que los dos marginales de esta ley son independientes Si este es el caso los

perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna

de la de

y

Es equivalente a decir que las frecuencias conjuntas deben estar cerca de

los productos de las frecuencias marginales

Las frecuencias conjuntas por un lado (distribucioacuten observada) y los

productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen

dos distribuciones de probabilidad sobre el conjunto producto

Podemos por tanto calcular la distancia de

chi-cuadrado de una con respecto a la otra

Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la

distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale

Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la

definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado

Por lo dicho anteriormente para suficientemente grande podemos

aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el

nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados

a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las

que han sido estimadas Hay para el caraacutecter y para el caraacutecter

(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley

chi-cuadrado seraacute por tanto

Vamos a presentar un ejemplo de dos caracteres binarios que tienen que

ver con enfermos para los cuales se ha observado si tienen o no una tendencia al

suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y

neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las

tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla

de contingencia observada es

Tendencia Sin tendencia Total

Psicosis 20 180 200

Nneurosis 60 140 200

Total 80 320 400

La distancia de chi-cuadrado de contingencia calculada a partir de esta

tabla es de El valor tomado por el estadiacutegrafo es el cual

debemos comparar con la ley El p-valor es de

Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre

la tendencia al suicidio y la clasificacioacuten de las enfermedades

El test no precisa el sentido de esta dependencia Para describirla hay que

comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre

los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten

PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS

Los investigadores se interesan constantemente en las diferencias entre dos

poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado

civil profesioacuten color de ojos preferencia por una marca etc)

Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de

contingenciardquo

Se puede realizar una prueba para la diferencia entre dos proporciones

sobre la base de muestras independientes usaacutendose como instrumento la prueba

de chi cuadrado

El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es

la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se

podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda

Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la

ecuacioacuten

n

nnE CR

donde

nR nuacutemero total en el rengloacuten

nC nuacutemero total en la columna

n tamantildeo total de la muestra

El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado

entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia

al cuadrado se divide entre la frecuencia esperada de la celda

La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se

rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el

valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados

de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el

tamantildeo de la muestra

CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD

Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a

las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se

puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la

distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado

siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal

Por consiguiente al probar la diferencia entre las dos proporciones la

distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes

Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia

direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten

normal

La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede

ilustrar mediante el siguiente ejemplo

Cuartos de bantildeos modernos

Cocina moderna Caren

cia

existenc

ia

totales

Carencia 72 8 80

Existencia 7 146 153

La hipoacutetesis nula y alternativa seriacutean

YN ppH 0

YN ppH 0

Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de

significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute

Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H

A partir de la informacioacuten del cuadro

10080

8

N

NSN

n

Xp 95420

153

146

Y

YSY

n

Xp

A partir de la expresioacuten

21

21

111

nnpp

pPZ SS

donde

661015380

1468

p

por lo tanto

0813

153

1

80

133906610

95420100

Z

Totales 79 154 223

Dado que 1960813 Z se rechaza la 0H por lo tanto hay

diferencia entre las dos proporciones

Usando la prueba de chi cuadrado y la tabla de contingencia de este

ejemplo se tiene

Las frecuencias teoacutericas se pueden obtener a partir de la siguiente

ecuacioacuten

n

nnE CR

Por lo tanto se tiene

1227233

7980E 8852

233

15480E

8851233

79153E 12101

233

154153E

Chi cuadrado se obtiene a partir de la expresioacuten

E

EOX

2

2

A partir de la tabla se tiene

O E (O ndash E) (O ndash E)2

(O ndash E)2E

7

2

2

712

+4488 20142144 742704

7 5

188

- 4488 20142144 388245

8 5 -4488 20142144 380903

288

1

46

1

0112

+4488 20142144 199191

1711043

10431712 CALCULADOX

Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el

84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo

tanto hay diferencia entre las dos proporciones

Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la

distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos

distribuciones que a un nivel de significancia de 005 el valor de 196 es el

cuadrado de 3 841 es decir 22 ZX

CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA

La afirmacioacuten de que no existen diferencias entre proporciones significa

que las dos variables son independientes Cuando las conclusiones se presentan en

esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo

Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que

no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la

hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos

variables Independientemente de que la prueba de chi cuadrado se considera una

prueba de diferencia entre dos proporciones o una prueba de independencia los

caacutelculos y resultados son exactamente los mismos

CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE

Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o

intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que

ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de

probabilidades

Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que

seguir varios pasos Primero se tiene que establecer la distribucioacuten de

probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada

paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la

media) se deben establecer mediante hipoacutetesis o estimarlos con base a la

informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para

determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o

intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado

para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la

informacioacuten

BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON

La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de

Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la

cantidad de automoacuteviles estacionados en una cochera cubierta siguen una

distribucioacuten de Poisson 0H

En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero

de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una

muestra aleatoria de 233 casas

Numero de automoacuteviles Frecuencia

0 61

1 151

2 21

233

Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados

de la distribucioacuten de frecuencia

No de automoacuteviles Frecuencia observada On

0 61 0

1 151 151

2 21 42

233 193

808280233

193

1

n

On

X

n

i por lo tanto 80X

El valor de la media muestral se utilizara como el estimado de X

Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)

y se obtiene la frecuencia teoacuterica para cada una

Automoacutevil

n

Frecuencia

O

Probabilidad

XP

Frecuencia (E)

XPn

0 61 04493 104687

1 151 03595 87764

2 21 01438 33505

Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de

significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX

El valor calculado de chi cuadrado es

50679

2

2

K

CALCULADO

E

EOX

Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de

automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una

distribucioacuten de Poisson

CORRECCIOacuteN DE YATES

Cuando se aplican a datos discretos los resultados para distribuciones

continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres

comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de

Yates la cual viene dada mediante la expresioacuten

E

EOX CALCULADO

502

2

En general la correccioacuten se hace solamente cuando el numero de grados

de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos

resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en

relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia

esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi

cuadrado corregido y no corregido Si ambos valores conducen a la misma

conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se

presentan dificultades Si conducen a conclusiones diferentes se puede o bien

incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear

meacutetodos de probabilidad exactos

El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente

ejemplo

En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces

Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de

significancia del 005

No de caras Frecuencia Probabilidad Frecuencia (E)

Cara 115 05 100

cruce 85 05 100

2054

100

0510085

100

0510011522

2

CALCULADOX

Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado

con correccioacuten de Yates es

8432 TABULADOX

Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha

PRUEBA EXACTA DE FISHER

Para examinar la igualdad de las varianzas de dos poblaciones

independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de

las varianzas de las dos muestras Suponiendo que la informacioacuten de cada

poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2

2

2

1 SS sigue una

distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso

estadiacutestico RA Fisher

Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de

grados de libertad los grados de libertad en el numerador y en el denominador

la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea

2

2

2

111 21

S

SF nn

donde

n1 = tamantildeo de muestra en el grupo 1

n2 = tamantildeo de muestra en el grupo 2

n1 ndash 1 = grados de libertad en el grupo 1

n2 ndash 1 = grados de libertad en el grupo 2

2

1S varianza de la muestra en el grupo 1

2

2S varianza de la muestra en el grupo 2

Al probar la igualdad de dos varianzas se pueden emplear pruebas de una

cola o de dos colas

El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente

ejemplo

Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas

alta en la planta A que en la planta B Para determinar la variabilidad se puede

establecer una prueba de una cola en la forma siguiente

22 BAOH

22

1 BAH

Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta

A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta

ubicada en la cola superior de la distribucioacuten

Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de

libertad en el numerador y 19 en el denominador a un nivel de significancia de

001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene

71162 AS y 20142 BS por lo tanto

38512014

71162

2

1924 F como 1385 lt

292 no se rechaza la hipoacutetesis nula ( OH )

CONCLUSIOacuteN

La conclusioacuten que los resultados de una medida variable es la causa de

variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten

estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero

no puede reclamar legitimidad

La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en

describir la distribucioacuten de las variables estudiadas y en particular de los datos

numeacutericos Ademaacutes de las medidas descriptivas correspondientes el

comportamiento de estas variables puede explorarse graacuteficamente de un modo

muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro

organizador de las ciencias computarizadas y el modelo que nos dota de un

mejor razonamiento para implementar programas eficientes En este sentido la

combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un

reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en

colegios y universidades

Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de

combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y

evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras

loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre

operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten

juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la

teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones

simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades

que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea

BIBLIOGRAFIacuteA

AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis

Third Edition Texts in Statistical Science Chapman and Hall

BOXG E P HUNTER W G HUNTER JS (1978) Statistics for

Experimenters John Wiley amp Sons

BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores

Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de

Modelos Ed Revertsbquo SA

Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed

Piraacutemide

Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten

(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica

Matemaacutetica I Universidad de Antioquia

Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma

Madrid

Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill

Meacutexico

Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten

yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico

Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw

ndashHill 4ta Edicioacuten Colombia

CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana

Meacutexico

COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas

COX DR (1958) Planning of experiments New York John Wiley amp Sons

DANIEL C Applications of Statistics to Industrial Experimentation Willey

DAVIES OL The Design and Analysis of Industrial Experiments Hafner

(McMillan)

DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias

Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico

SA de CV Meacutexico

De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H

(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico

Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta

Estadiacutestica Editorial Microsoft corporation USA

ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial

Limusa SA Meacutexico

EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis

Arnold

FEDERER W (1965) Experimental design Oxford Publ Co

GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la

Varianza Grupo Editorial Universitario

FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico

McGraw Hill

FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque

ModernoEditorial SA Meacutexico

George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y

Meacutetodosrdquo Ed McGraw-Hill

GILL JL (1978) Design and Analysis of Experiments in the Animal and

Medical Sciences Iowa State University Press

JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression

and Experimental Design Springer-Verlag

Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor

Caracas

GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining

Institute

GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data

Mining Institute

Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial

Bourgeoacuten Caracas

Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la

EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute

Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial

BourgeoacutenCA Caracas ndash Venezuela

HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis

Multivariante 5ordf Edicioacuten Prentice Hall

JOBSON JD (1992) Applied Multivariate Data Analysis Volume II

Categorical and Multivariate Methods Springer-Verlag

KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial

Hispanoamericana Meacutexico

KIRK RE Experimental Design Procedures for the Behavioral Sciencies

BrooksCole Publishing Company

LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e

inferencia Estadiacutestica Editorial Limusa Meacutexico

LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV

Grupo Noriega Editores Meacutexico

LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial

HARLA Meacutexico

LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta

edicioacuten Editorial McGaw-Hill Usa

Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial

Hispanoameacuterica VI edicioacuten Meacutexico

LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire

Multidimensionnelle 3ordf Edition DUNOD

LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e

Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB

Caracas- Venezuela

LORENZEN T J Anderson V L (1993) Design of experiments A No-Name

Approach Marcel Dekker Inc

Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc

(1999) SPSS 90 Manual de Usuario SPSS Chicago

MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis

Academic Press

Enfocados hacia SPSS

Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de

wwwspssparatodoscom 2005

MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten

Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla

Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea

Ediciones Alfaomega SAN Meacutexico

MASON RL Statistical Design and Analysis of Experiments with Applications

to Engineering and Science John Wiley amp Sons New York

MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y

Economiacutea Editorial Iberoamericana Meacutexico

MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in

agriculture and experimental biology Second edition Chapman amp Hall

MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo

Editorial Iberoameacuterica

MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers

John Wiley amp Sons

Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial

Reverte Mejicana Meacutexico

Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da

Edicioacuten Meacutexico

Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc

Graw Hill

PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones

Editorial Limusa Meacutexico

NETER J et al Applied Linear Statistical Models Regression Analysis of

Variance and Experimental Designs Library of Congress Cataloging Publication

Data

OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp

RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo

Editorial Universitario

PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos

Lineales y Series Temporales Vol 1 y 2 Alianza Editorial

Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores

Spain SA Espantildea 2005

PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial

Mir Moscuacute

RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed

McGraw-Hill

Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca

UCV Caracas ndash Venezuela

RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE

Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en

Psicologiacuteardquo p 1

SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons

Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti

Caracas ndash Venezuela

Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores

deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico

Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica

Editorial Harla Meacutexico

STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y

procedimientos Segunda edicioacuten McGraw Hill

SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas

Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1

Ediciones UNESR Caracas

URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante

Coartiacuteculo Plan Nuevo Editorial AC

VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II

Anaacutelisis Multivariante) Mc-Graw Hill

Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows

Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea

2002

WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros

Editorial Interamericana Meacutexico

Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8

Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage

Learning Editores p 364 ISBN 9706861947

Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea

Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea

Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de

CV Meacutexico

Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para

Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico

DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR

httpesmwikipediaorgwikiSPSS

httpwwwbuenastareascomensayosque-es-el-SPSS1465478html

httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-

del-software-estadistico-integral-spss-base-160

httpesanswersyahoocomquestionindexqid=20070727073908aatuamw

httpwwwslidesharenetleticiagpestructura-de-spss-3126476

httpwwwehowenespanolcomprograma-spss-sobre_48697

httpwwwugres~bioestmedicinamanual_spsspdf

httpwwwmonografiascomtrabajos12tutortutorshtml

httpwwwspsscom

wwwspssparatodoscom

httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html

httpwwwspssfreecomcapitulotreshtml

httpwwwuvesRELIEVEemail relieveuves

httpwwwscribdcomdochellipspss-introduccioacuten

httpeswikipediaorgwikiSPSS

httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd

f

httpwwwspsscomaressuccessargentinashtml

httpeswikipediaorgwikiSPSS

httpwww-01ibmcomsoftwareesanalyticsspss

httppsicofcepurvesspssindex0htm

httpssitesgooglecomsiteestadisticaconelspss

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpe-stadisticabioucmesweb_spssindice_spsshtml

httpwwwquimicaurvesquimiogeneralanovacastpdf

httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da

tosyMultivariable14anova1_SPSSpdf

httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800

20AnE1lisis20de20Varianzaspdf

httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-

pearson

httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf

httpwwwuoceduin3emathdocsRegresionLinealpdf

httpeswikipediaorgwikiRegresiC3B3n_lineal

httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES

ION_LINEAL_CON_SPSSpdf

httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN

EAL20SIMPLE20CON20SPSSpdf

httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE

SION_LINEAL_CON_SPSSpdf

httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm

httpeswikipediaorgwikiNivel_de_medida

httphtmlrincondelvagocomregresion-lineal-simplehtml

httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp

lepdf

httpwwwvitutorcomestadisticabi8html

httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf

httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-

Martinez_1pdf

httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml

httpesslidesharenetpatolinkecuacin-de-regresin-lineal

httpeswikipediaorgwikiMC3ADnimos_cuadrados

httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios

httpwwwwordreferencecomdefinicioncorrelaciC3B3n

httpwwwditutorcomestadistica_2correlacion_estadisticahtml

httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson

httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n

httpeswikipediaorgwikiMatriz_de_correlaciC3B3n

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpwwwinfecepiunizares

httpwwwltbioestadisticaumaes

httpwwwuaqmxmatematicasestadisticasxu3html

httpwwwmembers-americastripodcom

httpwwwmsiplceorg

httpwwwbnvcocrsesionnotaaspg

httpwwwaltavistacom

httpwwwauyantepuycom

httpwwwinees

httpwwwudeccl

httpwwwrincondelvagocom

httpwwwmonografiascom

httpwwwfestadisticafguamesindicadoresiprihtml

httpwwwuaqmxmatematicasestadisticaxu3html

httpwwwinegoboiwd0801htmlE

httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm

httpwwwitlpedumx

httpwwweclaevespanovestadisticasna93nnsnann7eshtml

httpw3moritesmmx~cmendozamaestestoohtml

httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml

httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion

httpwwwunleduarfaveseiencuestasindexhtml

httpwwwmonografiascomtrabajos11operaoperashtml

httpwwwmonografiascomtrabajos6hisohisoshtml

httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos

httpwwwmonografiascomtrabajos16sistema-operativosistema-

operativoshtmlTIPPOS

httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-

operativoshtml

httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei

httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml

httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-

operativo

httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software

httpwwwsscccoclinformaticaconceptoshtml

httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr

httpwwwcadcommxhistoria_de_la_computacionhtm

httpwwweswikipediaorgwikiBus_(informC3A1tica)

httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla

httpwwwcavsicompreguntasrespuestasque-es-el-teclado

httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm

Page 10: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,

escala de intervalo o de razoacuten) a rangos (escala ordinal) o categoriacuteas (escala

nominal) En particular en esas circunstancias algunas pruebas no parametricas

muy raacutepidas y sencillas tienen mucha menos potencia que los procedimientos

claacutesicos y por lo general se deben evitar

2 seguacuten aumenta el tamantildeo de la muestra en ocasiones el manejo

requerido de datos para los procedimientos no parametricos se hace laborioso a

menos que se disponga de un paquete de computacioacuten adecuado

3 con frecuencia se necesitan tablas especiales de valores

criacuteticos y estas no se obtienen con tanta facilidad como las tablas de los

valores criacuteticos normales t 2X y F Ccedil

Prueba de signos para una sola muestra

Salvo para las pruebas con muestra grande todas las pruebas estaacutendar

concernientes a medias estaacuten basadas en la suposicioacuten de que las poblaciones que

se muestrean tienen aproximadamente la forma de distribuciones normales

Cuando en un caso determinado esta suposicioacuten resulta insostenible la prueba

estaacutendar se puede sustituir por una de varias alternativas no parametricas entre

ellas la ldquoprueba de signosrdquo

La prueba de signos de una sola muestra se aplica cuando se muestrea una

poblacioacuten simeacutetrica continua de manera que la probabilidad de que un valor de la

muestra sea menor que la media o mayor que la media es en ambos casos frac12 Para

probar la hipoacutetesis nula ( O ) contra una hipoacutetesis alternativa apropiada con

base en una muestra aleatoria de tamantildeo n se sustituye cada valor de la muestra

mayor que O por un signo de mas y cada valor de la muestra menor que O por

un signo de menos despueacutes se aprueba la hipoacutetesis nula de que estos signos de

mas y menos son valores de una variable aleatoria que tiene distribucioacuten binomial

con 2

1p (si un valor de la muestra es igual a O simplemente lo rechazamos)

Prueba de suma de rangos

Se puede utilizar cuando se desea probar una hipoacutetesis relacionada a un

paraacutemetro que refleje una tendencia central Cuando no se cumplen las premisas

de la prueba t el procedimiento de Wilcoxon es probable que sea mas potente

para detectar la existencia de diferencias importantes que su contraparte

correspondiente

Para llevar a cabo la prueba de rangos y signos de Wilcoxon se puede

aplicar el siguiente procedimiento de seis pasos

1 para cada partiacutecula en una muestra de n partidas se obtiene un

resultado de diferencia Di

2 despueacutes no se toman en cuenta los signos + y ndash y se obtiene un

grupo de n diferencias absolutas iD

3 se omite de cualquier anaacutelisis adicional cualquier diferencia

absoluta con resultados de 0 con lo cual se obtiene un grupo de n resultados de

diferencias absolutas que no sean cero donde n

4 despueacutes se asignan rangos Ri desde uno hasta n a cada una de las

iD de modo que el resultado de diferencia absoluta mas pequentildeo obtiene una

clasificacioacuten de uno y el mayor de n Por la falta de precisioacuten en el proceso de

medicioacuten si dos o mas iD son iguales a cada una se asigna el ldquorango promediordquo

de los rangos que de lo contrario se les hubieran asignado individualmente si no

hubiera ocurrido la igualdad de los datos

5 ahora se asignan de nuevo el siacutembolo + o el signo ndash a cada uno de

los n rangos de Ri dependiendo de si originalmente Di era positiva o negativa

6 la prueba estadiacutestica de Wilcoxon W se obtiene como la suma de

las clasificaciones +

n

i

iRW1

Para muestras de n 20 se puede utilizar tablas para obtener los valores

criacuteticos de la prueba estadiacutestica W tanto para las pruebas de una cola como de dos

a diversos niveles de significacioacuten Se rechaza la hipoacutetesis nula en una prueba de

dos colas si el valor observado W es igual o excede al valor critico superior o es

igual o inferior al valor critico inferior Se rechaza la hipoacutetesis nula en una prueba

de una cola en direccioacuten positiva si el valor observado W es igual o excede el

valor critico superior Se rechaza la hipoacutetesis nula para una prueba de una cola en

direccioacuten negativa si el valor observado de w es inferior o igual al valor critico

inferior

Para nge20 la prueba estadiacutestica W tiene distribucioacuten aproximadamente

normal y se puede utilizar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis nula

W

WWZ

VARIABLES ALEATORIA Y COMO SE DIVIDEN

Una variable es aleatoria si toma diferentes valores como resultado de un

experimento aleatorio Puede ser discreta o continua Si puede tomar soacutelo un

nuacutemero limitado de valores entonces es una variable aleatoria discreta En el otro

extremo si puede tomar cualquier valor dentro de un intervalo dado entonces se

trata de una variable aleatoria continua

Se puede pensar en una variable aleatoria como un valor o una magnitud

que cambia de una presentacioacuten a otra sin seguir una secuencia predecible Los

valores de una variable aleatoria son los valores numeacutericos correspondientes a

cada posible resultado de un experimento aleatorio

La distribucioacuten de probabilidad de una variable aleatoria proporciona una

probabilidad para cada valor posible y estas probabilidades deben sumar 1

VALOR ESPERADO DE UNA VARIABLE ALEATORIA

El valor esperado es una idea fundamental en el estudio de las distribuciones de

probabilidad

Para obtener el valor esperado de una variable aleatoria discreta se

multiplica cada valor que la variable puede tomar por la probabilidad de

presentacioacuten de ese valor y luego se suman esos productos Es un promedio

pesado de los resultados que se esperan en el futuro El valor esperado pesa cada

resultado posible con respecto a la frecuencia con que se espera se que presente

En consecuencia las presentaciones maacutes comunes tienen asignadas un peso

mayor que las menos comunes

El valor esperado tambieacuten puede ser obtenido a partir de estimaciones

subjetivas En ese caso el valor esperado no es maacutes que la representacioacuten de las

convicciones personales acerca del resultado posible

VARIABLES ALEATORIAS DISCRETAS

Variable que toma un nuacutemero finito o infinito de valores numerables

Sean x1 x2 x3 xn los distintos valores que puede tomar la variable

aleatoria

Y p(x1) p(x2) p(xn) su probabilidad

Los pares de valores (xj p(xj)) constituyen la distribucioacuten de probabilidades de la

variable aleatoria

p(x) se denomina funcioacuten de probabilidad y debe cumplir con las siguientes

propiedades

0 lt p(xj) lt 1 (p(x) es una probabilidad y por lo tanto debe tomar valores

entre 0 y 1)

1)( jxP (la suma de probabilidades repartidas entre todos los valores

de la variable debe ser igual a 1)

De la misma manera que calculamos frecuencias acumuladas podemos acumular

probabilidades obteniendo la funcioacuten de distribucioacuten de probabilidades

Esta funcioacuten representa la probabilidad de que la variable aleatoria sea menor o

igual que un determinado valor

F(xj) = P (X lt xj)

Graacuteficamente la funcioacuten aumenta de a saltos ya que entre dos valores

consecutivos de una variable discreta no puede tomar valores intermedios

VARIABLES ALEATORIAS CONTINUAS

En este caso en lugar de trabajar con la probabilidad de valores

particulares de la variable resulta maacutes apropiado calcular probabilidades

asociadas a intervalos Para distribuir propiedades se usa una funcioacuten que mide

concentracioacuten de probabilidades alrededor de un punto que se denomina

funcioacuten de densidad de probabilidad (fdp) y se denota como f(x)

Una funcioacuten de densidad de probabilidad debe cumplir con las siguientes

propiedades

F(x) gt 0 (la funcioacuten es no negativa para cualquier valor de x f(x) no es

una probabilidad y puede valer maacutes de 1)

el aacuterea bajo la curva de la funcioacuten vale 1)

La funcioacuten de distribucioacuten para una variable aleatoria continua se calcula

F(a) = P(X lt

La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula

P (alt x lt b) = F(b) - F(a)

La probabilidad de que la variable tome un valor particular se puede expresar

como

F(c) - F(c) = 0

DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO

Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia

valores de una variable aleatoria con sus respectivas probabilidades es

decir Probabilidad de x = Funcioacuten de x

Las distribuciones se caracterizan por una foacutermula que determina el tipo de

distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio

muestral

En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una

funcioacuten de la probabilidad que representa los resultados que se van obteniendo en

un experimento aleatorio

Asiacute para un nuacutemero dado x la probabilidad es

A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la

variable X y representa la probabilidad de que la variable tome el valor desde

hasta x

Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de

probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad

Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos

y seraacuten mutuamente excluyentes y su suma es el

suceso por lo que tenemos entonces que

y finalmente

Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos

los valores de la variable aleatoria x conoceremos completamente la distribucioacuten

de probabilidad de la variable

Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten

de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente

Es decir la probabilidad de todo el espacio muestral es 1 tal y como

establece la teoriacutea de la probabilidad y por otra parte

Es decir la probabilidad del suceso nulo es cero

Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de

probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes

praacutectico el uso de la funcioacuten de densidad

En el caso de una variable discreta la distribucioacuten puede describirse

mediante una funcioacuten de probabilidad que para cada valor de x de la variable X

determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de

una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de

distribucioacuten la que para cada valor provee la probabilidad de no ser superado

evidentemente el valor de la funcioacuten de distribucioacuten es igual

a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo

inferior del dominio de la variable hasta x inclusive Lista de los resultados de un

experimento con las probabilidades que se esperariacutean ver asociadas con cada

resultado

Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores

diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12

En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica

Para el caso de 1 solo dado donde todos los valores tienen la misma

probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme

Prueba de aleatoriedad

Con frecuencia se supone que los datos recopilados constituyen una

muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la

utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash

Wolfowitz de corridas de una muestra para aleatoriedadrdquo

Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o

la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos

siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la

partida tiene una propiedad en particular o de la cantidad o magnitud en que se

posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la

sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con

distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente

de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que

la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las

partidas que la preceden o las que la suceden en forma tal que la probabilidad de

su ocurrencia varia de una posicioacuten a otra el proceso no se considera como

aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando

esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en

forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico

Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el

tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico

de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una

prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede

rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la

sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de

una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2

exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por

consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis de aleatoriedad

U

UUZ

donde

U = numero total de corridas

U = valor medio de U 12 21

n

nnU

U = desviacioacuten estaacutendar de U 1

222

2121

nn

nnnnnU

n1 = numero de eacutexitos en la muestra

n2 = numero de fracasos en la muestra

n = tamantildeo de la muestra n = n1 + n2

PRUEBA DE McNEMAR

Suele darse el caso en que se desean comparar las proporciones de los

datos de muestras tomados de poblaciones relacionadas En este caso se quisiera

determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a

alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea

determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y

otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede

utilizar la prueba desarrollada por McNemar

El principal intereacutes es determinar si hay diferencia entre las dos

proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta

que el otro (prueba de una cola)

La prueba estadiacutestica para la prueba de McNemar es

CB

CBZ

PRUEBA U DE MANN ndash WHITNEY

Es una alternativa no parametrica a la prueba t de dos muestras para la

diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula

μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos

la forma de distribuciones normales de hecho la prueba solo requiere que las

poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no

importa si se cumple o no esta suposicioacuten

Estadiacutesticos U1 y U2

111

2112

1 W

nnnnU

222

2122

1 W

nnnnU

PRUEBA DE RACHAS

Son todas las diferencias que tiene el mismo signo y se presentan en una

misma fila Una serie de n diferencias puede tener solamente una racha (toda

positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las

rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de

poblaciones con la misma distribucioacuten de frecuencias Colocamos las

observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces

contamos el numero de rachas item de cada una de las muestras Si hay menos

rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales

rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten

La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de

que las observaciones se han sacado aleatoriamente de una sola poblacioacuten

Para hacer esto se halla la mediana de la muestra y se designa las

observaciones situadas por debajo de la mediana por un signo menos (-) y las

observaciones situadas por encima de la mediana por un signo (+) Si el numero

de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado

rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el

numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10

puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la

tabla normal con

u

uu

z

2

1

12

21

21

NN

NNu

)1()(

2(2

21

2

21

2121212

NNNN

NNNNNNu

DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES

DISTRIBUCIONES DE EJEMPLO Y USO

DISTRIBUCIOacuteN NORMAL O GAUSSIANA

Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que

multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal

Esta distribucioacuten de caracteriza porque los valores se distribuyen formando

una campana de Gauss en torno a un valor central que coincide con el valor

medio de la distribucioacuten

Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a

la izquierda

Esta distribucioacuten viene definida por dos paraacutemetros

X N (m S2)

m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro

de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores

estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores

estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de

ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten

estaacutendar

Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina

normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo

que permiten obtener esos mismos valores donde se recoge la probabilidad

acumulada para cada punto de la curva de esta distribucioacuten

Ademaacutes toda distribucioacuten normal se puede transformar en una normal

tipificada

Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con

media 10 y varianza 4 Transformarla en una normal tipificada

X N (10 4)

Para transformarla en una normal tipificada se crea una nueva variable (Y)

que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica

(que es la raiacutez cuadrada de la varianza)

En el ejemplo la nueva variable seriacutea

Esta nueva variable se distribuye como una normal tipificada

permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor

Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos

indicado de que las probabilidades para cada valor de la curva se encuentran

recogidas en una tabla

MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)

La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten

normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta

distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros

y lo que representamos del modo si su funcioacuten de densidad

es

Observacioacuten

Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y

la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes

adelante65

La forma de la funcioacuten de densidad es la llamada campana de Gauss

Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten

normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1

Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un

uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto

con lo cual en coinciden la media la mediana

y la moda y por uacuteltimo calcular sus puntos de inflexioacuten

El soporte de la distribucioacuten es todo de modo que la mayor parte de la

masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se

encuentra concentrado alrededor de la media y las ramas de la curva se extienden

asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la

media es posible (aunque poco probable)

La forma de la campana de Gauss depende de los paraacutemetros y

indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)

Figura Distribuciones gaussianas con diferentes medias e igual

dispersioacuten

(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor

sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor

de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea

``maacutes aplastado seraacute

Figura Distribuciones gaussianas con igual media pero varianza

diferente

La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes

adelante que es

Como consecuencia la distribucioacuten normal es reproductiva con respecto a

los paraacutemetros y ya que

Observacioacuten

Como se ha mencionado anteriormente la ley de probabilidad gaussiana la

encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza

por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el

de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que

apuntar un hecho negativo para esta ley de probabilidad

La funcioacuten no posee primitiva66

conocida67

Las consecuencias desde el punto de vista praacutectico son importantes ya que

eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de

la normal y nos tenemos que limitar a decir que

sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente

esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho

puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto

se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en

problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde

se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie

limitada de valores xi dados Normalmente F se encuentra tabulada para una

distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten

normal tipificada

En el caso de que tengamos una distribucioacuten diferente se

obtiene Z haciendo el siguiente cambio

De manera general se tiene

Proposicioacuten (Cambio de origen y escala)

Sean Entonces

Este resultado puede ser utilizado del siguiente modo Si y nos

interesa calcular

1 Hacemos el cambio y calculamos

2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de

modo aproximado) Como

tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada

Ejemplo

Supongamos que cierto fenoacutemeno pueda ser representado mediante una

va y queremos calcular la probabilidad de que Xtome un valor

entre 39 y 48 es decir

Comenzamos haciendo el cambio de variable

de modo que

Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que

hemos mencionado anteriormente

Proposicioacuten

Sea Entonces

Demostracioacuten

Por ser la normal una ley de probabilidad se tiene que

es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con

respecto a se obtiene el valor 0

luego

Para demostrar la igualdad entre la y basta con aplicar la misma

teacutecnica pero esta vez derivando con respecto a

Luego

Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en

primer lugar la va tipificada de X

y calculamos

Como por la proposicioacuten 5 deducimos que

CURVA NORMAL ESTANDARIZADA

Una variable numeacuterica puede clasificarse como discreta o continua Las

variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas

con la idea de contar Las variables continuas se pueden asociar con la idea de

medir utilizando fracciones y decimales Cuando la variable es continua el

modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal

El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten

normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran

cantidad de variables continuas

El modelo matemaacutetico

La funcioacuten matemaacutetica que se usa como modelo es

e = 271

π = 314

μx = media de la poblacioacuten

σx = desviacioacuten estaacutendar de la poblacioacuten

x = un valor de la variable continua

Como e y π son constantes la forma de la curva normal depende

solamente de los dos parametros de la distribucioacuten normal la media μx y la

desviacioacuten estaacutendar σx

Las diferentes curvas normales van a variar dependiendo de esos dos

paraacutemetros

En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar

visualmente como una curva en forma de campana El aacuterea debajo de esta curva se

halla por medio del integral de la funcioacuten y corresponde al por ciento o la

proporcioacuten de puntuaciones que se encuentran en el intervalo dado

Propiedades de las distribuciones normales

a Son simeacutetricas y tienen forma de campana

b Al ser simeacutetricas la media la moda y la mediana coinciden

c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea

de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media

d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la

curva se encuentra a tres desviaciones estaacutendar de la media

En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral

de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de

diferentes secciones de la curva o se utiliza la computadora para calcular ese valor

del aacuterea

La distribucioacuten normal estandarizada

Puesto que hay un nuacutemero infinito de combinaciones para los dos

paraacutemetros hay un nuacutemero infinito de curvas normales diferentes

Este problema se ha resuelto praacutecticamente al transformar los valores de

todas las distribuciones normales a los valores de una distribucioacuten normal

estandarizada representada por la curva normal estandarizada (standard normal

curve)

Las puntuaciones estandarizadas se logran restando la media a cada

observacioacuten y dividiendo entre la desviacioacuten estaacutendar

donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar

Propiedades de la distribucioacuten normal estandarizada

μ z = 0

σ z = 1

En muchas ocasiones se quieren comparar puntuaciones que pertenecen a

dos distribuciones normales diferentes La diferencia entre las dos distribuciones

radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo

la comparacioacuten se hace posible si se convierten las puntuaciones de ambas

distribuciones a puntuaciones z que corresponden a la distribucioacuten normal

estandarizada

Percentiles y rangos percentiles de una distribucioacuten normal estandarizada

Si se desea hallar la percentiles o el rango percentil en una distribucioacuten

normal no estandarizada se recurre al procedimiento de convertir las puntuaciones

de la distribucioacuten normal dada a puntuaciones z que corresponden a la

distribucioacuten normal estandarizada

Estos valores en la distribucioacuten normal estandarizada se pueden obtener

por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en

las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el

intervalo dado

Es necesario visualizar siempre el aacuterea debajo de la curva como el por

ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo

dado

Cuando una distribucioacuten de puntuaciones es normal estandarizada la

pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar

en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o

cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten

dada

DISTRIBUCIOacuteN GAMMA

Una variable aleatoria X asociada a un experimento aleatorio tiene una

distribucioacuten GAMMA si se caracteriza por las siguientes propiedades

Algunas alternativas de funciones de densidad se pueden ver en la graacutefica

del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)

respectivamente =1

=1

La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo

III

El modelo Gamma se ha utilizado frecuentemente en variables tales como

ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el

intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson

ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900

ndash Flujos maacuteximos MARKOVIC 1965

ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965

ndash Altura de la precipitacioacuten mensual WHITCOMB 1940

ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia

infin

ndash Ingresos familiares

ndash Edad del hombre al contraer matrimonio por primera vez

ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en

subestaciones a una frecuencia part

Ejemplo

Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos

de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia

promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo

de tiempo se encuentre hasta que ocurre el segundo ciclo

a Dentro de una desviacioacuten con respecto del tiempo promedio

b A maacutes de dos desviaciones por encima de la media

Solucioacuten

X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en

horas

Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)

= 2

Y Nuacutemero de ciclos hora ---------Y~P( =002)

E(Y) = 002 =

X ~ G(2 002)

Ejemplo

En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de

kilovatios por hora puede considerarse como una variable aleatoria con

distribucioacuten GAMMA de paraacutemetros = 3 y

= 05

La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de

KWhora

iquestCuaacutel es la probabilidad de que este abastecimientos sea

a Insuficiente en un diacutea cualquiera

b Se consuman entre 3 y 8 millones de K WHora

c c Encuentre E(x) y V(x)

SOLUCIOacuteN

DISTRIBUCIOacuteN PARETO

En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad

continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores

es

Su funcioacuten de distribucioacuten es

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto

son

El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (

DISTRIBUCIOacuteN T DE STUDENT

Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una

distribucioacuten t con n grados de libertad

Cuando n--gtinfinito a curva t coincide com la normal estandarizada

FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX

MOMENTOS

La distribucioacuten -Student se construye como un cociente entre una normal

y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-

Student con n grados de libertad a la de una va T

donde Este tipo de distribuciones aparece cuando

tenemos n+1 va independientes

y nos interesa la distribucioacuten de

La funcioacuten de densidad de es

Figura Funcioacuten de densidad de una de Student

La distribucioacuten de Student tiene propiedades parecidas a

Es de media cero y simeacutetrica con respecto a la misma

Es algo maacutes dispersa que la normal pero la varianza decrece hasta

1 cuando el nuacutemero de grados de libertad aumenta

Figura Comparacioacuten entre las funciones de densidad de y

Para un nuacutemero alto de grados de libertad se puede aproximar la

distribucioacuten de Student por la normal es decir

Figura Cuando aumentan los grados de libertad la distribucioacuten de

Student se aproxima a la distribucioacuten normal tipificada

Para calcular

DISTRIBUCIOacuteN BETA

Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede

representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un

intervalo de longitud finita Tales como

Proporcioacuten de impurezas en un producto quiacutemico

La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten

La proporcioacuten vendida de un lote durante un tiempo t

La humedad relativa medida en cierto lugar

Porcentaje del costo total destinado a reparacioacuten de maquinaria

Porcentaje de costo adicional destinado a reparacioacuten de maquinaria

La distribucioacuten del tiempo necesario para completar una fase del proyecto

PERT

Evaluacioacuten de programas y teacutecnicas de revisioacuten

Ejemplo

La proporcioacuten de tramos de una autopista que requieren repararse

semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros

= 3 y =2

a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten

b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista

requieren reparacioacuten en un antildeo cualquiera

DISTRIBUCIOacuteN CAUCHY

En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de

Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es

donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene

valor esperado ni varianza

Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V

2 lt 1 el

numero U V tiene la distribucioacuten Cauchy

La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un

grado de libertad

Ejemplo

Sean y dos observaciones independientes de una distribucioacuten

Cauchy con funcioacuten de densidad

Puede demostrarse que si y son tales que entonces la

funcioacuten de verosimilitud de es bimodal

Sean y Supongamos que se desea hacer inferencias sobre el

valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa

Especiacuteficamente interesa encontrar la distribucioacuten final de

Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la

distribucioacuten final de tiene una forma complicada Es conveniente notar sin

embargo que corresponde a la densidad marginal de respecto a la

densidad conjunta

DISTRIBUCIOacuteN BERNOULLI

Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto

suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el

que no lo sea (fracaso) En realidad no se trata maacutes que de una variable

dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello

que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas

obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la

situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este

experimento mediante una va discreta Xque toma los valores X=0 si el suceso no

ocurre y X=1 en caso contrario y que se denota

Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar

una moneda al aire y considerar la va

Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de

probabilidad es

y su funcioacuten de distribucioacuten

Su funcioacuten caracteriacutestica es

Los principales momentos de la X los podemos calcular directamente

o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina

Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)

cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de

intentos

CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE

BERNOULLI

Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la

probabilidad y asegurar que se cumplen las tres condiciones necesarias en

particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del

resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3

requiere que los ensayos o intentos de un proceso de Bernoulli sean

estadiacutesticamente independientes es decir que el resultado de un intento no puede

afectar de ninguacuten modo el resultado de cualquier otro intento

DISTRIBUCIOacuteN EXPONENCIAL

Modelo para variable aleatoria continua que permite representar variables

del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos

Componentes

En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de

probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para

valores x gt 0 es

f(x) = λe - λx

Su funcioacuten de distribucioacuten es

Aqui e significa el nuacutemero e

El valor esperado y la varianza de una variable aleatoria X con

distribucioacuten exponencial son

E[X] = 1 λ

V(X) = 1 λ2

Ejemplo

Ejemplos para la distribucioacuten exponencial son los tiempos dentro

accidentes con probabilidad invariable

La funcioacuten de densidad para λ igual 05 10 y 15

DISTRIBUCIOacuteN MULTINOMIAL

La distribucioacuten multinomial es similar a la distribucioacuten binomial con la

diferencia de que en lugar de dos posibles resultados en cada ensayo

La distribucioacuten multinomial sigue el siguiente modelo

Donde

X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo

que el partido POPO lo hayan votado 3 personas)

n indica el nuacutemero de veces que se ha repetido el suceso (en el

ejemplo 5 veces)

n es factorial de n (en el ejemplo 5 4 3 2 1)

p1 es la probabilidad del suceso X1 (en el ejemplo el 40)

Veamos el ejemplo

Luego

P = 00256

Es decir que la probabilidad de que las 5 personas elegidas hayan votado

de esta manera es tan soacutelo del 256

Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1

Veamos otro ejemplo

En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el

40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4

invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos

Aplicamos el modelo

LuegoP = 00384

Por lo tanto la probabilidad de que el grupo esteacute formado por personas de

estos paiacuteses es tan soacutelo del 384

DISTRIBUCIOacuteN UNIFORME

En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de

probabilidad cuyos valores tienen la misma probabilidad

Caso discreto

Su funcioacuten de probabilidad es en el caso discreto con valores posibles

p(xi) = 1 n

Su funcioacuten de distribucioacuten es en el caso discreto

Su media estadiacutestica es

Caso continuo

Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b

La funcioacuten de densidad en el caso continuo entre a y b es

Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12

Ejemplos

Para un dado perfecto todos los resultados tienen la misma probabilidad 1

6

Calcular variables aleatorias

Las variables aleatorias de probabilidad uniforme pueden calcularse con un

generador de variables aleatorias

DISTRIBUCIOacuteN BINOMIAL

En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad

discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con

probabilidad p de un eacutexito

Su funcioacuten de densidad es

Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)

posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos

((1 - p)n - x

)

El valor esperado de una variable aleatoria de probabilidad binominal es

E[x] = np y su varianza V[x] = np(1 - p)

DISTRIBUCIOacuteN BINOMIAL NEGATIVA

Sobre una sucesioacuten de va de Bernouilli independientes

Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r

eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de

distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo

Su ley de probabilidad se deduce siguiendo el esquema

De nuevo el conjunto de posibles valores de esta va discreta es

Su funcioacuten caracteriacutestica es

y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima

Ejemplo

Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en

operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal

que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda

definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para

intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus

5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones

que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se

necesiten 10 intervenciones

Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por

una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan

4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso

Identificando los paraacutemetros se tiene

Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el

nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy

simple

Y=X+r

Luego

Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente

es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de

que X=10-4=6 Por tanto

La distribucioacuten binomial negativa tambieacuten se puede definir como el

nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas

contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que

DISTRIBUCIOacuteN DE POISSON

Modelo para variable aleatoria discreta que permite calcular la

probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten

discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo

muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos

o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual

a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es

independiente de cuaacutendo se presenta dicho periacuteodo

En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de

probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos

es

Aquiacute e significa el nuacutemero e y x significa el factorial de x

La distribucion de Poisson describe el nuacutemero de sucesos en una unidad

de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un

proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens

en una carrera

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten

Poisson son

E[X] = V[X] = λ

La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos

entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un

conmutador la demanda (necesidades) de los pacientes que requieren servicio en

una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el

nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos

ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una

variable aleatoria discreta que toma valores enteros (0 1 2)

Caacutelculo de la probabilidad de Poisson

La letra X por lo general representa a una variable discreta y puede tomar

valores enteros Utilizamos la letra X para representar a la variable aleatoria y la

letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La

probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson

se calcula con la foacutermula

LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA

DISTRIBUCIOacuteN BINOMIAL

La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la

binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan

cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es

grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan

con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena

aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es

igual o menor que 005 En los casos en que se cumplen estas condiciones

podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media

de la distribucioacuten de Poisson

DISTRIBUCIOacuteN GEOMEacuteTRICA

En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten

probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores

discretos es

P(X = x) = p(1 - p)x - 1

Su funcioacuten de distribucioacuten es

El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media

estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2

Ejemplo

El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es

una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6

DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA

En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de

probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de

masa para valores es

Aqui (a sobre b) es el coeficiente binomial

El valor esperado de una variable aleatoria X de distribucioacuten

hipergeomeacutetrica es

Y su varianza

DISTRIBUCIOacuteN ZETA

En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad

discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos

es

Aqui ζ(s) es la funcioacuten zeta de Rieman con

El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto

DISTRIBUCION CHI CUADRADO

El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una

comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es

diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con

ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno

es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario

estas dos frecuencias acusan una diferencia significativa para por ejemplo un

nivel de significacioacuten del 5

El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la

asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada

por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito

bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor

del famoso libro Statistical Methods for Research Workers (1925) donde se

marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con

Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde

estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y

el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las

pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba

exacta de Fisher

Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico

publicitario presentado a grupos de clientes comparar la rentabilidad de un

proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos

de los turistas por determinados espacios geograacuteficos o por determinados

servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las

frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las

frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o

tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o

de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2

x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos

turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han

ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han

tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula

que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido

en los sitios A y B

Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es

independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo

A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces

alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este

anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos

empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de

las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51

La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten

igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es

2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del

Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del

5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206

podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para

suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B

Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias

observadas empiacutericamente de dos muestras con las frecuencias esperadas o

teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el

Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de

las materias primas perecederas Los resultados son seguacuten atributos cualitativos

los siguientes Primero veremos las frecuencias empiacutericas u observadas

Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten

Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son

131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas

Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y

fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres

columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta

maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x

120 260 = 6046 b2 = 129 x 120 260 = 5954

Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten

igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de

2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de

libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La

diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna

conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten

Es una medida de la discrepancia existente entre las frecuencias

observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso

de frecuencias () debido a que permite determinar las desviaciones entre ellas

ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la

expresioacuten

E

EOX

2

2

Donde

O frecuencia observada

E frecuencia teoacuterica esperada

TEST DE CHI-CUADRADO DE CONTINGENCIA

Un caso particular del test de chi-cuadrado que permite hacer un test sobre

la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-

cuadrado de contingencia Los dos caracteres observados en una misma

poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases

de se denotan las de por Tambieacuten vamos a

denotar

el efectivo conjunto de y es el nuacutemero de individuos para los

cuales toma el valor e el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

Estos valores se representan en una tabla de doble entrada conocida como

tabla de contingencia

Cada fila y cada columna corresponden a una submuestra particular La

fila de iacutendice es la distribucioacuten en las clases de los individuos para

los cuales el caraacutecter toma el valor La columna de iacutendice es la

distribucioacuten en las clases de los individuos para los cuales el caraacutecter

toma el valor Dividiendo las filas y las columnas por su suma se obtienen

frecuencias condicionales para cada una de las distribuciones empiacutericas Para

y las denotaremos por

y

Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y

los perfiles columna Para el modelo probabilista las observaciones provienen de

una muestra

de una ley bidimensional La hipoacutetesis a comprobar

es que los dos marginales de esta ley son independientes Si este es el caso los

perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna

de la de

y

Es equivalente a decir que las frecuencias conjuntas deben estar cerca de

los productos de las frecuencias marginales

Las frecuencias conjuntas por un lado (distribucioacuten observada) y los

productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen

dos distribuciones de probabilidad sobre el conjunto producto

Podemos por tanto calcular la distancia de

chi-cuadrado de una con respecto a la otra

Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la

distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale

Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la

definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado

Por lo dicho anteriormente para suficientemente grande podemos

aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el

nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados

a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las

que han sido estimadas Hay para el caraacutecter y para el caraacutecter

(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley

chi-cuadrado seraacute por tanto

Vamos a presentar un ejemplo de dos caracteres binarios que tienen que

ver con enfermos para los cuales se ha observado si tienen o no una tendencia al

suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y

neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las

tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla

de contingencia observada es

Tendencia Sin tendencia Total

Psicosis 20 180 200

Nneurosis 60 140 200

Total 80 320 400

La distancia de chi-cuadrado de contingencia calculada a partir de esta

tabla es de El valor tomado por el estadiacutegrafo es el cual

debemos comparar con la ley El p-valor es de

Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre

la tendencia al suicidio y la clasificacioacuten de las enfermedades

El test no precisa el sentido de esta dependencia Para describirla hay que

comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre

los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten

PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS

Los investigadores se interesan constantemente en las diferencias entre dos

poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado

civil profesioacuten color de ojos preferencia por una marca etc)

Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de

contingenciardquo

Se puede realizar una prueba para la diferencia entre dos proporciones

sobre la base de muestras independientes usaacutendose como instrumento la prueba

de chi cuadrado

El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es

la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se

podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda

Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la

ecuacioacuten

n

nnE CR

donde

nR nuacutemero total en el rengloacuten

nC nuacutemero total en la columna

n tamantildeo total de la muestra

El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado

entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia

al cuadrado se divide entre la frecuencia esperada de la celda

La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se

rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el

valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados

de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el

tamantildeo de la muestra

CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD

Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a

las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se

puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la

distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado

siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal

Por consiguiente al probar la diferencia entre las dos proporciones la

distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes

Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia

direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten

normal

La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede

ilustrar mediante el siguiente ejemplo

Cuartos de bantildeos modernos

Cocina moderna Caren

cia

existenc

ia

totales

Carencia 72 8 80

Existencia 7 146 153

La hipoacutetesis nula y alternativa seriacutean

YN ppH 0

YN ppH 0

Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de

significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute

Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H

A partir de la informacioacuten del cuadro

10080

8

N

NSN

n

Xp 95420

153

146

Y

YSY

n

Xp

A partir de la expresioacuten

21

21

111

nnpp

pPZ SS

donde

661015380

1468

p

por lo tanto

0813

153

1

80

133906610

95420100

Z

Totales 79 154 223

Dado que 1960813 Z se rechaza la 0H por lo tanto hay

diferencia entre las dos proporciones

Usando la prueba de chi cuadrado y la tabla de contingencia de este

ejemplo se tiene

Las frecuencias teoacutericas se pueden obtener a partir de la siguiente

ecuacioacuten

n

nnE CR

Por lo tanto se tiene

1227233

7980E 8852

233

15480E

8851233

79153E 12101

233

154153E

Chi cuadrado se obtiene a partir de la expresioacuten

E

EOX

2

2

A partir de la tabla se tiene

O E (O ndash E) (O ndash E)2

(O ndash E)2E

7

2

2

712

+4488 20142144 742704

7 5

188

- 4488 20142144 388245

8 5 -4488 20142144 380903

288

1

46

1

0112

+4488 20142144 199191

1711043

10431712 CALCULADOX

Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el

84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo

tanto hay diferencia entre las dos proporciones

Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la

distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos

distribuciones que a un nivel de significancia de 005 el valor de 196 es el

cuadrado de 3 841 es decir 22 ZX

CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA

La afirmacioacuten de que no existen diferencias entre proporciones significa

que las dos variables son independientes Cuando las conclusiones se presentan en

esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo

Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que

no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la

hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos

variables Independientemente de que la prueba de chi cuadrado se considera una

prueba de diferencia entre dos proporciones o una prueba de independencia los

caacutelculos y resultados son exactamente los mismos

CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE

Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o

intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que

ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de

probabilidades

Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que

seguir varios pasos Primero se tiene que establecer la distribucioacuten de

probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada

paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la

media) se deben establecer mediante hipoacutetesis o estimarlos con base a la

informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para

determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o

intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado

para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la

informacioacuten

BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON

La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de

Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la

cantidad de automoacuteviles estacionados en una cochera cubierta siguen una

distribucioacuten de Poisson 0H

En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero

de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una

muestra aleatoria de 233 casas

Numero de automoacuteviles Frecuencia

0 61

1 151

2 21

233

Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados

de la distribucioacuten de frecuencia

No de automoacuteviles Frecuencia observada On

0 61 0

1 151 151

2 21 42

233 193

808280233

193

1

n

On

X

n

i por lo tanto 80X

El valor de la media muestral se utilizara como el estimado de X

Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)

y se obtiene la frecuencia teoacuterica para cada una

Automoacutevil

n

Frecuencia

O

Probabilidad

XP

Frecuencia (E)

XPn

0 61 04493 104687

1 151 03595 87764

2 21 01438 33505

Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de

significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX

El valor calculado de chi cuadrado es

50679

2

2

K

CALCULADO

E

EOX

Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de

automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una

distribucioacuten de Poisson

CORRECCIOacuteN DE YATES

Cuando se aplican a datos discretos los resultados para distribuciones

continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres

comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de

Yates la cual viene dada mediante la expresioacuten

E

EOX CALCULADO

502

2

En general la correccioacuten se hace solamente cuando el numero de grados

de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos

resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en

relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia

esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi

cuadrado corregido y no corregido Si ambos valores conducen a la misma

conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se

presentan dificultades Si conducen a conclusiones diferentes se puede o bien

incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear

meacutetodos de probabilidad exactos

El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente

ejemplo

En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces

Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de

significancia del 005

No de caras Frecuencia Probabilidad Frecuencia (E)

Cara 115 05 100

cruce 85 05 100

2054

100

0510085

100

0510011522

2

CALCULADOX

Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado

con correccioacuten de Yates es

8432 TABULADOX

Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha

PRUEBA EXACTA DE FISHER

Para examinar la igualdad de las varianzas de dos poblaciones

independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de

las varianzas de las dos muestras Suponiendo que la informacioacuten de cada

poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2

2

2

1 SS sigue una

distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso

estadiacutestico RA Fisher

Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de

grados de libertad los grados de libertad en el numerador y en el denominador

la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea

2

2

2

111 21

S

SF nn

donde

n1 = tamantildeo de muestra en el grupo 1

n2 = tamantildeo de muestra en el grupo 2

n1 ndash 1 = grados de libertad en el grupo 1

n2 ndash 1 = grados de libertad en el grupo 2

2

1S varianza de la muestra en el grupo 1

2

2S varianza de la muestra en el grupo 2

Al probar la igualdad de dos varianzas se pueden emplear pruebas de una

cola o de dos colas

El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente

ejemplo

Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas

alta en la planta A que en la planta B Para determinar la variabilidad se puede

establecer una prueba de una cola en la forma siguiente

22 BAOH

22

1 BAH

Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta

A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta

ubicada en la cola superior de la distribucioacuten

Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de

libertad en el numerador y 19 en el denominador a un nivel de significancia de

001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene

71162 AS y 20142 BS por lo tanto

38512014

71162

2

1924 F como 1385 lt

292 no se rechaza la hipoacutetesis nula ( OH )

CONCLUSIOacuteN

La conclusioacuten que los resultados de una medida variable es la causa de

variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten

estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero

no puede reclamar legitimidad

La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en

describir la distribucioacuten de las variables estudiadas y en particular de los datos

numeacutericos Ademaacutes de las medidas descriptivas correspondientes el

comportamiento de estas variables puede explorarse graacuteficamente de un modo

muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro

organizador de las ciencias computarizadas y el modelo que nos dota de un

mejor razonamiento para implementar programas eficientes En este sentido la

combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un

reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en

colegios y universidades

Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de

combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y

evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras

loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre

operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten

juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la

teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones

simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades

que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea

BIBLIOGRAFIacuteA

AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis

Third Edition Texts in Statistical Science Chapman and Hall

BOXG E P HUNTER W G HUNTER JS (1978) Statistics for

Experimenters John Wiley amp Sons

BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores

Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de

Modelos Ed Revertsbquo SA

Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed

Piraacutemide

Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten

(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica

Matemaacutetica I Universidad de Antioquia

Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma

Madrid

Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill

Meacutexico

Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten

yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico

Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw

ndashHill 4ta Edicioacuten Colombia

CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana

Meacutexico

COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas

COX DR (1958) Planning of experiments New York John Wiley amp Sons

DANIEL C Applications of Statistics to Industrial Experimentation Willey

DAVIES OL The Design and Analysis of Industrial Experiments Hafner

(McMillan)

DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias

Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico

SA de CV Meacutexico

De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H

(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico

Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta

Estadiacutestica Editorial Microsoft corporation USA

ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial

Limusa SA Meacutexico

EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis

Arnold

FEDERER W (1965) Experimental design Oxford Publ Co

GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la

Varianza Grupo Editorial Universitario

FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico

McGraw Hill

FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque

ModernoEditorial SA Meacutexico

George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y

Meacutetodosrdquo Ed McGraw-Hill

GILL JL (1978) Design and Analysis of Experiments in the Animal and

Medical Sciences Iowa State University Press

JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression

and Experimental Design Springer-Verlag

Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor

Caracas

GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining

Institute

GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data

Mining Institute

Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial

Bourgeoacuten Caracas

Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la

EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute

Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial

BourgeoacutenCA Caracas ndash Venezuela

HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis

Multivariante 5ordf Edicioacuten Prentice Hall

JOBSON JD (1992) Applied Multivariate Data Analysis Volume II

Categorical and Multivariate Methods Springer-Verlag

KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial

Hispanoamericana Meacutexico

KIRK RE Experimental Design Procedures for the Behavioral Sciencies

BrooksCole Publishing Company

LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e

inferencia Estadiacutestica Editorial Limusa Meacutexico

LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV

Grupo Noriega Editores Meacutexico

LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial

HARLA Meacutexico

LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta

edicioacuten Editorial McGaw-Hill Usa

Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial

Hispanoameacuterica VI edicioacuten Meacutexico

LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire

Multidimensionnelle 3ordf Edition DUNOD

LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e

Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB

Caracas- Venezuela

LORENZEN T J Anderson V L (1993) Design of experiments A No-Name

Approach Marcel Dekker Inc

Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc

(1999) SPSS 90 Manual de Usuario SPSS Chicago

MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis

Academic Press

Enfocados hacia SPSS

Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de

wwwspssparatodoscom 2005

MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten

Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla

Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea

Ediciones Alfaomega SAN Meacutexico

MASON RL Statistical Design and Analysis of Experiments with Applications

to Engineering and Science John Wiley amp Sons New York

MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y

Economiacutea Editorial Iberoamericana Meacutexico

MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in

agriculture and experimental biology Second edition Chapman amp Hall

MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo

Editorial Iberoameacuterica

MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers

John Wiley amp Sons

Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial

Reverte Mejicana Meacutexico

Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da

Edicioacuten Meacutexico

Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc

Graw Hill

PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones

Editorial Limusa Meacutexico

NETER J et al Applied Linear Statistical Models Regression Analysis of

Variance and Experimental Designs Library of Congress Cataloging Publication

Data

OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp

RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo

Editorial Universitario

PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos

Lineales y Series Temporales Vol 1 y 2 Alianza Editorial

Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores

Spain SA Espantildea 2005

PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial

Mir Moscuacute

RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed

McGraw-Hill

Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca

UCV Caracas ndash Venezuela

RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE

Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en

Psicologiacuteardquo p 1

SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons

Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti

Caracas ndash Venezuela

Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores

deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico

Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica

Editorial Harla Meacutexico

STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y

procedimientos Segunda edicioacuten McGraw Hill

SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas

Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1

Ediciones UNESR Caracas

URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante

Coartiacuteculo Plan Nuevo Editorial AC

VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II

Anaacutelisis Multivariante) Mc-Graw Hill

Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows

Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea

2002

WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros

Editorial Interamericana Meacutexico

Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8

Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage

Learning Editores p 364 ISBN 9706861947

Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea

Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea

Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de

CV Meacutexico

Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para

Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico

DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR

httpesmwikipediaorgwikiSPSS

httpwwwbuenastareascomensayosque-es-el-SPSS1465478html

httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-

del-software-estadistico-integral-spss-base-160

httpesanswersyahoocomquestionindexqid=20070727073908aatuamw

httpwwwslidesharenetleticiagpestructura-de-spss-3126476

httpwwwehowenespanolcomprograma-spss-sobre_48697

httpwwwugres~bioestmedicinamanual_spsspdf

httpwwwmonografiascomtrabajos12tutortutorshtml

httpwwwspsscom

wwwspssparatodoscom

httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html

httpwwwspssfreecomcapitulotreshtml

httpwwwuvesRELIEVEemail relieveuves

httpwwwscribdcomdochellipspss-introduccioacuten

httpeswikipediaorgwikiSPSS

httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd

f

httpwwwspsscomaressuccessargentinashtml

httpeswikipediaorgwikiSPSS

httpwww-01ibmcomsoftwareesanalyticsspss

httppsicofcepurvesspssindex0htm

httpssitesgooglecomsiteestadisticaconelspss

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpe-stadisticabioucmesweb_spssindice_spsshtml

httpwwwquimicaurvesquimiogeneralanovacastpdf

httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da

tosyMultivariable14anova1_SPSSpdf

httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800

20AnE1lisis20de20Varianzaspdf

httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-

pearson

httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf

httpwwwuoceduin3emathdocsRegresionLinealpdf

httpeswikipediaorgwikiRegresiC3B3n_lineal

httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES

ION_LINEAL_CON_SPSSpdf

httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN

EAL20SIMPLE20CON20SPSSpdf

httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE

SION_LINEAL_CON_SPSSpdf

httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm

httpeswikipediaorgwikiNivel_de_medida

httphtmlrincondelvagocomregresion-lineal-simplehtml

httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp

lepdf

httpwwwvitutorcomestadisticabi8html

httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf

httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-

Martinez_1pdf

httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml

httpesslidesharenetpatolinkecuacin-de-regresin-lineal

httpeswikipediaorgwikiMC3ADnimos_cuadrados

httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios

httpwwwwordreferencecomdefinicioncorrelaciC3B3n

httpwwwditutorcomestadistica_2correlacion_estadisticahtml

httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson

httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n

httpeswikipediaorgwikiMatriz_de_correlaciC3B3n

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpwwwinfecepiunizares

httpwwwltbioestadisticaumaes

httpwwwuaqmxmatematicasestadisticasxu3html

httpwwwmembers-americastripodcom

httpwwwmsiplceorg

httpwwwbnvcocrsesionnotaaspg

httpwwwaltavistacom

httpwwwauyantepuycom

httpwwwinees

httpwwwudeccl

httpwwwrincondelvagocom

httpwwwmonografiascom

httpwwwfestadisticafguamesindicadoresiprihtml

httpwwwuaqmxmatematicasestadisticaxu3html

httpwwwinegoboiwd0801htmlE

httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm

httpwwwitlpedumx

httpwwweclaevespanovestadisticasna93nnsnann7eshtml

httpw3moritesmmx~cmendozamaestestoohtml

httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml

httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion

httpwwwunleduarfaveseiencuestasindexhtml

httpwwwmonografiascomtrabajos11operaoperashtml

httpwwwmonografiascomtrabajos6hisohisoshtml

httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos

httpwwwmonografiascomtrabajos16sistema-operativosistema-

operativoshtmlTIPPOS

httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-

operativoshtml

httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei

httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml

httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-

operativo

httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software

httpwwwsscccoclinformaticaconceptoshtml

httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr

httpwwwcadcommxhistoria_de_la_computacionhtm

httpwwweswikipediaorgwikiBus_(informC3A1tica)

httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla

httpwwwcavsicompreguntasrespuestasque-es-el-teclado

httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm

Page 11: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,

Prueba de suma de rangos

Se puede utilizar cuando se desea probar una hipoacutetesis relacionada a un

paraacutemetro que refleje una tendencia central Cuando no se cumplen las premisas

de la prueba t el procedimiento de Wilcoxon es probable que sea mas potente

para detectar la existencia de diferencias importantes que su contraparte

correspondiente

Para llevar a cabo la prueba de rangos y signos de Wilcoxon se puede

aplicar el siguiente procedimiento de seis pasos

1 para cada partiacutecula en una muestra de n partidas se obtiene un

resultado de diferencia Di

2 despueacutes no se toman en cuenta los signos + y ndash y se obtiene un

grupo de n diferencias absolutas iD

3 se omite de cualquier anaacutelisis adicional cualquier diferencia

absoluta con resultados de 0 con lo cual se obtiene un grupo de n resultados de

diferencias absolutas que no sean cero donde n

4 despueacutes se asignan rangos Ri desde uno hasta n a cada una de las

iD de modo que el resultado de diferencia absoluta mas pequentildeo obtiene una

clasificacioacuten de uno y el mayor de n Por la falta de precisioacuten en el proceso de

medicioacuten si dos o mas iD son iguales a cada una se asigna el ldquorango promediordquo

de los rangos que de lo contrario se les hubieran asignado individualmente si no

hubiera ocurrido la igualdad de los datos

5 ahora se asignan de nuevo el siacutembolo + o el signo ndash a cada uno de

los n rangos de Ri dependiendo de si originalmente Di era positiva o negativa

6 la prueba estadiacutestica de Wilcoxon W se obtiene como la suma de

las clasificaciones +

n

i

iRW1

Para muestras de n 20 se puede utilizar tablas para obtener los valores

criacuteticos de la prueba estadiacutestica W tanto para las pruebas de una cola como de dos

a diversos niveles de significacioacuten Se rechaza la hipoacutetesis nula en una prueba de

dos colas si el valor observado W es igual o excede al valor critico superior o es

igual o inferior al valor critico inferior Se rechaza la hipoacutetesis nula en una prueba

de una cola en direccioacuten positiva si el valor observado W es igual o excede el

valor critico superior Se rechaza la hipoacutetesis nula para una prueba de una cola en

direccioacuten negativa si el valor observado de w es inferior o igual al valor critico

inferior

Para nge20 la prueba estadiacutestica W tiene distribucioacuten aproximadamente

normal y se puede utilizar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis nula

W

WWZ

VARIABLES ALEATORIA Y COMO SE DIVIDEN

Una variable es aleatoria si toma diferentes valores como resultado de un

experimento aleatorio Puede ser discreta o continua Si puede tomar soacutelo un

nuacutemero limitado de valores entonces es una variable aleatoria discreta En el otro

extremo si puede tomar cualquier valor dentro de un intervalo dado entonces se

trata de una variable aleatoria continua

Se puede pensar en una variable aleatoria como un valor o una magnitud

que cambia de una presentacioacuten a otra sin seguir una secuencia predecible Los

valores de una variable aleatoria son los valores numeacutericos correspondientes a

cada posible resultado de un experimento aleatorio

La distribucioacuten de probabilidad de una variable aleatoria proporciona una

probabilidad para cada valor posible y estas probabilidades deben sumar 1

VALOR ESPERADO DE UNA VARIABLE ALEATORIA

El valor esperado es una idea fundamental en el estudio de las distribuciones de

probabilidad

Para obtener el valor esperado de una variable aleatoria discreta se

multiplica cada valor que la variable puede tomar por la probabilidad de

presentacioacuten de ese valor y luego se suman esos productos Es un promedio

pesado de los resultados que se esperan en el futuro El valor esperado pesa cada

resultado posible con respecto a la frecuencia con que se espera se que presente

En consecuencia las presentaciones maacutes comunes tienen asignadas un peso

mayor que las menos comunes

El valor esperado tambieacuten puede ser obtenido a partir de estimaciones

subjetivas En ese caso el valor esperado no es maacutes que la representacioacuten de las

convicciones personales acerca del resultado posible

VARIABLES ALEATORIAS DISCRETAS

Variable que toma un nuacutemero finito o infinito de valores numerables

Sean x1 x2 x3 xn los distintos valores que puede tomar la variable

aleatoria

Y p(x1) p(x2) p(xn) su probabilidad

Los pares de valores (xj p(xj)) constituyen la distribucioacuten de probabilidades de la

variable aleatoria

p(x) se denomina funcioacuten de probabilidad y debe cumplir con las siguientes

propiedades

0 lt p(xj) lt 1 (p(x) es una probabilidad y por lo tanto debe tomar valores

entre 0 y 1)

1)( jxP (la suma de probabilidades repartidas entre todos los valores

de la variable debe ser igual a 1)

De la misma manera que calculamos frecuencias acumuladas podemos acumular

probabilidades obteniendo la funcioacuten de distribucioacuten de probabilidades

Esta funcioacuten representa la probabilidad de que la variable aleatoria sea menor o

igual que un determinado valor

F(xj) = P (X lt xj)

Graacuteficamente la funcioacuten aumenta de a saltos ya que entre dos valores

consecutivos de una variable discreta no puede tomar valores intermedios

VARIABLES ALEATORIAS CONTINUAS

En este caso en lugar de trabajar con la probabilidad de valores

particulares de la variable resulta maacutes apropiado calcular probabilidades

asociadas a intervalos Para distribuir propiedades se usa una funcioacuten que mide

concentracioacuten de probabilidades alrededor de un punto que se denomina

funcioacuten de densidad de probabilidad (fdp) y se denota como f(x)

Una funcioacuten de densidad de probabilidad debe cumplir con las siguientes

propiedades

F(x) gt 0 (la funcioacuten es no negativa para cualquier valor de x f(x) no es

una probabilidad y puede valer maacutes de 1)

el aacuterea bajo la curva de la funcioacuten vale 1)

La funcioacuten de distribucioacuten para una variable aleatoria continua se calcula

F(a) = P(X lt

La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula

P (alt x lt b) = F(b) - F(a)

La probabilidad de que la variable tome un valor particular se puede expresar

como

F(c) - F(c) = 0

DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO

Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia

valores de una variable aleatoria con sus respectivas probabilidades es

decir Probabilidad de x = Funcioacuten de x

Las distribuciones se caracterizan por una foacutermula que determina el tipo de

distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio

muestral

En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una

funcioacuten de la probabilidad que representa los resultados que se van obteniendo en

un experimento aleatorio

Asiacute para un nuacutemero dado x la probabilidad es

A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la

variable X y representa la probabilidad de que la variable tome el valor desde

hasta x

Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de

probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad

Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos

y seraacuten mutuamente excluyentes y su suma es el

suceso por lo que tenemos entonces que

y finalmente

Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos

los valores de la variable aleatoria x conoceremos completamente la distribucioacuten

de probabilidad de la variable

Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten

de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente

Es decir la probabilidad de todo el espacio muestral es 1 tal y como

establece la teoriacutea de la probabilidad y por otra parte

Es decir la probabilidad del suceso nulo es cero

Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de

probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes

praacutectico el uso de la funcioacuten de densidad

En el caso de una variable discreta la distribucioacuten puede describirse

mediante una funcioacuten de probabilidad que para cada valor de x de la variable X

determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de

una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de

distribucioacuten la que para cada valor provee la probabilidad de no ser superado

evidentemente el valor de la funcioacuten de distribucioacuten es igual

a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo

inferior del dominio de la variable hasta x inclusive Lista de los resultados de un

experimento con las probabilidades que se esperariacutean ver asociadas con cada

resultado

Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores

diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12

En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica

Para el caso de 1 solo dado donde todos los valores tienen la misma

probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme

Prueba de aleatoriedad

Con frecuencia se supone que los datos recopilados constituyen una

muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la

utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash

Wolfowitz de corridas de una muestra para aleatoriedadrdquo

Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o

la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos

siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la

partida tiene una propiedad en particular o de la cantidad o magnitud en que se

posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la

sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con

distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente

de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que

la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las

partidas que la preceden o las que la suceden en forma tal que la probabilidad de

su ocurrencia varia de una posicioacuten a otra el proceso no se considera como

aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando

esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en

forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico

Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el

tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico

de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una

prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede

rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la

sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de

una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2

exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por

consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis de aleatoriedad

U

UUZ

donde

U = numero total de corridas

U = valor medio de U 12 21

n

nnU

U = desviacioacuten estaacutendar de U 1

222

2121

nn

nnnnnU

n1 = numero de eacutexitos en la muestra

n2 = numero de fracasos en la muestra

n = tamantildeo de la muestra n = n1 + n2

PRUEBA DE McNEMAR

Suele darse el caso en que se desean comparar las proporciones de los

datos de muestras tomados de poblaciones relacionadas En este caso se quisiera

determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a

alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea

determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y

otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede

utilizar la prueba desarrollada por McNemar

El principal intereacutes es determinar si hay diferencia entre las dos

proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta

que el otro (prueba de una cola)

La prueba estadiacutestica para la prueba de McNemar es

CB

CBZ

PRUEBA U DE MANN ndash WHITNEY

Es una alternativa no parametrica a la prueba t de dos muestras para la

diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula

μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos

la forma de distribuciones normales de hecho la prueba solo requiere que las

poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no

importa si se cumple o no esta suposicioacuten

Estadiacutesticos U1 y U2

111

2112

1 W

nnnnU

222

2122

1 W

nnnnU

PRUEBA DE RACHAS

Son todas las diferencias que tiene el mismo signo y se presentan en una

misma fila Una serie de n diferencias puede tener solamente una racha (toda

positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las

rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de

poblaciones con la misma distribucioacuten de frecuencias Colocamos las

observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces

contamos el numero de rachas item de cada una de las muestras Si hay menos

rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales

rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten

La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de

que las observaciones se han sacado aleatoriamente de una sola poblacioacuten

Para hacer esto se halla la mediana de la muestra y se designa las

observaciones situadas por debajo de la mediana por un signo menos (-) y las

observaciones situadas por encima de la mediana por un signo (+) Si el numero

de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado

rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el

numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10

puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la

tabla normal con

u

uu

z

2

1

12

21

21

NN

NNu

)1()(

2(2

21

2

21

2121212

NNNN

NNNNNNu

DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES

DISTRIBUCIONES DE EJEMPLO Y USO

DISTRIBUCIOacuteN NORMAL O GAUSSIANA

Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que

multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal

Esta distribucioacuten de caracteriza porque los valores se distribuyen formando

una campana de Gauss en torno a un valor central que coincide con el valor

medio de la distribucioacuten

Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a

la izquierda

Esta distribucioacuten viene definida por dos paraacutemetros

X N (m S2)

m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro

de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores

estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores

estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de

ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten

estaacutendar

Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina

normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo

que permiten obtener esos mismos valores donde se recoge la probabilidad

acumulada para cada punto de la curva de esta distribucioacuten

Ademaacutes toda distribucioacuten normal se puede transformar en una normal

tipificada

Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con

media 10 y varianza 4 Transformarla en una normal tipificada

X N (10 4)

Para transformarla en una normal tipificada se crea una nueva variable (Y)

que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica

(que es la raiacutez cuadrada de la varianza)

En el ejemplo la nueva variable seriacutea

Esta nueva variable se distribuye como una normal tipificada

permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor

Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos

indicado de que las probabilidades para cada valor de la curva se encuentran

recogidas en una tabla

MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)

La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten

normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta

distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros

y lo que representamos del modo si su funcioacuten de densidad

es

Observacioacuten

Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y

la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes

adelante65

La forma de la funcioacuten de densidad es la llamada campana de Gauss

Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten

normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1

Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un

uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto

con lo cual en coinciden la media la mediana

y la moda y por uacuteltimo calcular sus puntos de inflexioacuten

El soporte de la distribucioacuten es todo de modo que la mayor parte de la

masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se

encuentra concentrado alrededor de la media y las ramas de la curva se extienden

asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la

media es posible (aunque poco probable)

La forma de la campana de Gauss depende de los paraacutemetros y

indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)

Figura Distribuciones gaussianas con diferentes medias e igual

dispersioacuten

(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor

sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor

de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea

``maacutes aplastado seraacute

Figura Distribuciones gaussianas con igual media pero varianza

diferente

La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes

adelante que es

Como consecuencia la distribucioacuten normal es reproductiva con respecto a

los paraacutemetros y ya que

Observacioacuten

Como se ha mencionado anteriormente la ley de probabilidad gaussiana la

encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza

por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el

de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que

apuntar un hecho negativo para esta ley de probabilidad

La funcioacuten no posee primitiva66

conocida67

Las consecuencias desde el punto de vista praacutectico son importantes ya que

eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de

la normal y nos tenemos que limitar a decir que

sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente

esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho

puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto

se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en

problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde

se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie

limitada de valores xi dados Normalmente F se encuentra tabulada para una

distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten

normal tipificada

En el caso de que tengamos una distribucioacuten diferente se

obtiene Z haciendo el siguiente cambio

De manera general se tiene

Proposicioacuten (Cambio de origen y escala)

Sean Entonces

Este resultado puede ser utilizado del siguiente modo Si y nos

interesa calcular

1 Hacemos el cambio y calculamos

2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de

modo aproximado) Como

tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada

Ejemplo

Supongamos que cierto fenoacutemeno pueda ser representado mediante una

va y queremos calcular la probabilidad de que Xtome un valor

entre 39 y 48 es decir

Comenzamos haciendo el cambio de variable

de modo que

Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que

hemos mencionado anteriormente

Proposicioacuten

Sea Entonces

Demostracioacuten

Por ser la normal una ley de probabilidad se tiene que

es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con

respecto a se obtiene el valor 0

luego

Para demostrar la igualdad entre la y basta con aplicar la misma

teacutecnica pero esta vez derivando con respecto a

Luego

Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en

primer lugar la va tipificada de X

y calculamos

Como por la proposicioacuten 5 deducimos que

CURVA NORMAL ESTANDARIZADA

Una variable numeacuterica puede clasificarse como discreta o continua Las

variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas

con la idea de contar Las variables continuas se pueden asociar con la idea de

medir utilizando fracciones y decimales Cuando la variable es continua el

modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal

El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten

normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran

cantidad de variables continuas

El modelo matemaacutetico

La funcioacuten matemaacutetica que se usa como modelo es

e = 271

π = 314

μx = media de la poblacioacuten

σx = desviacioacuten estaacutendar de la poblacioacuten

x = un valor de la variable continua

Como e y π son constantes la forma de la curva normal depende

solamente de los dos parametros de la distribucioacuten normal la media μx y la

desviacioacuten estaacutendar σx

Las diferentes curvas normales van a variar dependiendo de esos dos

paraacutemetros

En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar

visualmente como una curva en forma de campana El aacuterea debajo de esta curva se

halla por medio del integral de la funcioacuten y corresponde al por ciento o la

proporcioacuten de puntuaciones que se encuentran en el intervalo dado

Propiedades de las distribuciones normales

a Son simeacutetricas y tienen forma de campana

b Al ser simeacutetricas la media la moda y la mediana coinciden

c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea

de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media

d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la

curva se encuentra a tres desviaciones estaacutendar de la media

En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral

de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de

diferentes secciones de la curva o se utiliza la computadora para calcular ese valor

del aacuterea

La distribucioacuten normal estandarizada

Puesto que hay un nuacutemero infinito de combinaciones para los dos

paraacutemetros hay un nuacutemero infinito de curvas normales diferentes

Este problema se ha resuelto praacutecticamente al transformar los valores de

todas las distribuciones normales a los valores de una distribucioacuten normal

estandarizada representada por la curva normal estandarizada (standard normal

curve)

Las puntuaciones estandarizadas se logran restando la media a cada

observacioacuten y dividiendo entre la desviacioacuten estaacutendar

donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar

Propiedades de la distribucioacuten normal estandarizada

μ z = 0

σ z = 1

En muchas ocasiones se quieren comparar puntuaciones que pertenecen a

dos distribuciones normales diferentes La diferencia entre las dos distribuciones

radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo

la comparacioacuten se hace posible si se convierten las puntuaciones de ambas

distribuciones a puntuaciones z que corresponden a la distribucioacuten normal

estandarizada

Percentiles y rangos percentiles de una distribucioacuten normal estandarizada

Si se desea hallar la percentiles o el rango percentil en una distribucioacuten

normal no estandarizada se recurre al procedimiento de convertir las puntuaciones

de la distribucioacuten normal dada a puntuaciones z que corresponden a la

distribucioacuten normal estandarizada

Estos valores en la distribucioacuten normal estandarizada se pueden obtener

por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en

las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el

intervalo dado

Es necesario visualizar siempre el aacuterea debajo de la curva como el por

ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo

dado

Cuando una distribucioacuten de puntuaciones es normal estandarizada la

pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar

en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o

cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten

dada

DISTRIBUCIOacuteN GAMMA

Una variable aleatoria X asociada a un experimento aleatorio tiene una

distribucioacuten GAMMA si se caracteriza por las siguientes propiedades

Algunas alternativas de funciones de densidad se pueden ver en la graacutefica

del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)

respectivamente =1

=1

La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo

III

El modelo Gamma se ha utilizado frecuentemente en variables tales como

ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el

intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson

ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900

ndash Flujos maacuteximos MARKOVIC 1965

ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965

ndash Altura de la precipitacioacuten mensual WHITCOMB 1940

ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia

infin

ndash Ingresos familiares

ndash Edad del hombre al contraer matrimonio por primera vez

ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en

subestaciones a una frecuencia part

Ejemplo

Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos

de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia

promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo

de tiempo se encuentre hasta que ocurre el segundo ciclo

a Dentro de una desviacioacuten con respecto del tiempo promedio

b A maacutes de dos desviaciones por encima de la media

Solucioacuten

X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en

horas

Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)

= 2

Y Nuacutemero de ciclos hora ---------Y~P( =002)

E(Y) = 002 =

X ~ G(2 002)

Ejemplo

En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de

kilovatios por hora puede considerarse como una variable aleatoria con

distribucioacuten GAMMA de paraacutemetros = 3 y

= 05

La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de

KWhora

iquestCuaacutel es la probabilidad de que este abastecimientos sea

a Insuficiente en un diacutea cualquiera

b Se consuman entre 3 y 8 millones de K WHora

c c Encuentre E(x) y V(x)

SOLUCIOacuteN

DISTRIBUCIOacuteN PARETO

En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad

continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores

es

Su funcioacuten de distribucioacuten es

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto

son

El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (

DISTRIBUCIOacuteN T DE STUDENT

Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una

distribucioacuten t con n grados de libertad

Cuando n--gtinfinito a curva t coincide com la normal estandarizada

FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX

MOMENTOS

La distribucioacuten -Student se construye como un cociente entre una normal

y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-

Student con n grados de libertad a la de una va T

donde Este tipo de distribuciones aparece cuando

tenemos n+1 va independientes

y nos interesa la distribucioacuten de

La funcioacuten de densidad de es

Figura Funcioacuten de densidad de una de Student

La distribucioacuten de Student tiene propiedades parecidas a

Es de media cero y simeacutetrica con respecto a la misma

Es algo maacutes dispersa que la normal pero la varianza decrece hasta

1 cuando el nuacutemero de grados de libertad aumenta

Figura Comparacioacuten entre las funciones de densidad de y

Para un nuacutemero alto de grados de libertad se puede aproximar la

distribucioacuten de Student por la normal es decir

Figura Cuando aumentan los grados de libertad la distribucioacuten de

Student se aproxima a la distribucioacuten normal tipificada

Para calcular

DISTRIBUCIOacuteN BETA

Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede

representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un

intervalo de longitud finita Tales como

Proporcioacuten de impurezas en un producto quiacutemico

La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten

La proporcioacuten vendida de un lote durante un tiempo t

La humedad relativa medida en cierto lugar

Porcentaje del costo total destinado a reparacioacuten de maquinaria

Porcentaje de costo adicional destinado a reparacioacuten de maquinaria

La distribucioacuten del tiempo necesario para completar una fase del proyecto

PERT

Evaluacioacuten de programas y teacutecnicas de revisioacuten

Ejemplo

La proporcioacuten de tramos de una autopista que requieren repararse

semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros

= 3 y =2

a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten

b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista

requieren reparacioacuten en un antildeo cualquiera

DISTRIBUCIOacuteN CAUCHY

En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de

Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es

donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene

valor esperado ni varianza

Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V

2 lt 1 el

numero U V tiene la distribucioacuten Cauchy

La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un

grado de libertad

Ejemplo

Sean y dos observaciones independientes de una distribucioacuten

Cauchy con funcioacuten de densidad

Puede demostrarse que si y son tales que entonces la

funcioacuten de verosimilitud de es bimodal

Sean y Supongamos que se desea hacer inferencias sobre el

valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa

Especiacuteficamente interesa encontrar la distribucioacuten final de

Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la

distribucioacuten final de tiene una forma complicada Es conveniente notar sin

embargo que corresponde a la densidad marginal de respecto a la

densidad conjunta

DISTRIBUCIOacuteN BERNOULLI

Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto

suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el

que no lo sea (fracaso) En realidad no se trata maacutes que de una variable

dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello

que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas

obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la

situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este

experimento mediante una va discreta Xque toma los valores X=0 si el suceso no

ocurre y X=1 en caso contrario y que se denota

Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar

una moneda al aire y considerar la va

Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de

probabilidad es

y su funcioacuten de distribucioacuten

Su funcioacuten caracteriacutestica es

Los principales momentos de la X los podemos calcular directamente

o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina

Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)

cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de

intentos

CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE

BERNOULLI

Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la

probabilidad y asegurar que se cumplen las tres condiciones necesarias en

particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del

resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3

requiere que los ensayos o intentos de un proceso de Bernoulli sean

estadiacutesticamente independientes es decir que el resultado de un intento no puede

afectar de ninguacuten modo el resultado de cualquier otro intento

DISTRIBUCIOacuteN EXPONENCIAL

Modelo para variable aleatoria continua que permite representar variables

del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos

Componentes

En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de

probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para

valores x gt 0 es

f(x) = λe - λx

Su funcioacuten de distribucioacuten es

Aqui e significa el nuacutemero e

El valor esperado y la varianza de una variable aleatoria X con

distribucioacuten exponencial son

E[X] = 1 λ

V(X) = 1 λ2

Ejemplo

Ejemplos para la distribucioacuten exponencial son los tiempos dentro

accidentes con probabilidad invariable

La funcioacuten de densidad para λ igual 05 10 y 15

DISTRIBUCIOacuteN MULTINOMIAL

La distribucioacuten multinomial es similar a la distribucioacuten binomial con la

diferencia de que en lugar de dos posibles resultados en cada ensayo

La distribucioacuten multinomial sigue el siguiente modelo

Donde

X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo

que el partido POPO lo hayan votado 3 personas)

n indica el nuacutemero de veces que se ha repetido el suceso (en el

ejemplo 5 veces)

n es factorial de n (en el ejemplo 5 4 3 2 1)

p1 es la probabilidad del suceso X1 (en el ejemplo el 40)

Veamos el ejemplo

Luego

P = 00256

Es decir que la probabilidad de que las 5 personas elegidas hayan votado

de esta manera es tan soacutelo del 256

Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1

Veamos otro ejemplo

En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el

40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4

invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos

Aplicamos el modelo

LuegoP = 00384

Por lo tanto la probabilidad de que el grupo esteacute formado por personas de

estos paiacuteses es tan soacutelo del 384

DISTRIBUCIOacuteN UNIFORME

En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de

probabilidad cuyos valores tienen la misma probabilidad

Caso discreto

Su funcioacuten de probabilidad es en el caso discreto con valores posibles

p(xi) = 1 n

Su funcioacuten de distribucioacuten es en el caso discreto

Su media estadiacutestica es

Caso continuo

Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b

La funcioacuten de densidad en el caso continuo entre a y b es

Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12

Ejemplos

Para un dado perfecto todos los resultados tienen la misma probabilidad 1

6

Calcular variables aleatorias

Las variables aleatorias de probabilidad uniforme pueden calcularse con un

generador de variables aleatorias

DISTRIBUCIOacuteN BINOMIAL

En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad

discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con

probabilidad p de un eacutexito

Su funcioacuten de densidad es

Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)

posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos

((1 - p)n - x

)

El valor esperado de una variable aleatoria de probabilidad binominal es

E[x] = np y su varianza V[x] = np(1 - p)

DISTRIBUCIOacuteN BINOMIAL NEGATIVA

Sobre una sucesioacuten de va de Bernouilli independientes

Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r

eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de

distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo

Su ley de probabilidad se deduce siguiendo el esquema

De nuevo el conjunto de posibles valores de esta va discreta es

Su funcioacuten caracteriacutestica es

y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima

Ejemplo

Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en

operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal

que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda

definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para

intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus

5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones

que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se

necesiten 10 intervenciones

Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por

una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan

4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso

Identificando los paraacutemetros se tiene

Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el

nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy

simple

Y=X+r

Luego

Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente

es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de

que X=10-4=6 Por tanto

La distribucioacuten binomial negativa tambieacuten se puede definir como el

nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas

contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que

DISTRIBUCIOacuteN DE POISSON

Modelo para variable aleatoria discreta que permite calcular la

probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten

discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo

muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos

o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual

a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es

independiente de cuaacutendo se presenta dicho periacuteodo

En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de

probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos

es

Aquiacute e significa el nuacutemero e y x significa el factorial de x

La distribucion de Poisson describe el nuacutemero de sucesos en una unidad

de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un

proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens

en una carrera

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten

Poisson son

E[X] = V[X] = λ

La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos

entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un

conmutador la demanda (necesidades) de los pacientes que requieren servicio en

una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el

nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos

ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una

variable aleatoria discreta que toma valores enteros (0 1 2)

Caacutelculo de la probabilidad de Poisson

La letra X por lo general representa a una variable discreta y puede tomar

valores enteros Utilizamos la letra X para representar a la variable aleatoria y la

letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La

probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson

se calcula con la foacutermula

LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA

DISTRIBUCIOacuteN BINOMIAL

La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la

binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan

cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es

grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan

con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena

aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es

igual o menor que 005 En los casos en que se cumplen estas condiciones

podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media

de la distribucioacuten de Poisson

DISTRIBUCIOacuteN GEOMEacuteTRICA

En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten

probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores

discretos es

P(X = x) = p(1 - p)x - 1

Su funcioacuten de distribucioacuten es

El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media

estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2

Ejemplo

El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es

una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6

DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA

En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de

probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de

masa para valores es

Aqui (a sobre b) es el coeficiente binomial

El valor esperado de una variable aleatoria X de distribucioacuten

hipergeomeacutetrica es

Y su varianza

DISTRIBUCIOacuteN ZETA

En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad

discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos

es

Aqui ζ(s) es la funcioacuten zeta de Rieman con

El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto

DISTRIBUCION CHI CUADRADO

El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una

comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es

diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con

ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno

es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario

estas dos frecuencias acusan una diferencia significativa para por ejemplo un

nivel de significacioacuten del 5

El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la

asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada

por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito

bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor

del famoso libro Statistical Methods for Research Workers (1925) donde se

marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con

Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde

estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y

el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las

pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba

exacta de Fisher

Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico

publicitario presentado a grupos de clientes comparar la rentabilidad de un

proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos

de los turistas por determinados espacios geograacuteficos o por determinados

servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las

frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las

frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o

tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o

de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2

x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos

turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han

ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han

tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula

que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido

en los sitios A y B

Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es

independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo

A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces

alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este

anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos

empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de

las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51

La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten

igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es

2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del

Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del

5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206

podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para

suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B

Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias

observadas empiacutericamente de dos muestras con las frecuencias esperadas o

teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el

Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de

las materias primas perecederas Los resultados son seguacuten atributos cualitativos

los siguientes Primero veremos las frecuencias empiacutericas u observadas

Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten

Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son

131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas

Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y

fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres

columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta

maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x

120 260 = 6046 b2 = 129 x 120 260 = 5954

Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten

igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de

2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de

libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La

diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna

conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten

Es una medida de la discrepancia existente entre las frecuencias

observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso

de frecuencias () debido a que permite determinar las desviaciones entre ellas

ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la

expresioacuten

E

EOX

2

2

Donde

O frecuencia observada

E frecuencia teoacuterica esperada

TEST DE CHI-CUADRADO DE CONTINGENCIA

Un caso particular del test de chi-cuadrado que permite hacer un test sobre

la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-

cuadrado de contingencia Los dos caracteres observados en una misma

poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases

de se denotan las de por Tambieacuten vamos a

denotar

el efectivo conjunto de y es el nuacutemero de individuos para los

cuales toma el valor e el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

Estos valores se representan en una tabla de doble entrada conocida como

tabla de contingencia

Cada fila y cada columna corresponden a una submuestra particular La

fila de iacutendice es la distribucioacuten en las clases de los individuos para

los cuales el caraacutecter toma el valor La columna de iacutendice es la

distribucioacuten en las clases de los individuos para los cuales el caraacutecter

toma el valor Dividiendo las filas y las columnas por su suma se obtienen

frecuencias condicionales para cada una de las distribuciones empiacutericas Para

y las denotaremos por

y

Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y

los perfiles columna Para el modelo probabilista las observaciones provienen de

una muestra

de una ley bidimensional La hipoacutetesis a comprobar

es que los dos marginales de esta ley son independientes Si este es el caso los

perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna

de la de

y

Es equivalente a decir que las frecuencias conjuntas deben estar cerca de

los productos de las frecuencias marginales

Las frecuencias conjuntas por un lado (distribucioacuten observada) y los

productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen

dos distribuciones de probabilidad sobre el conjunto producto

Podemos por tanto calcular la distancia de

chi-cuadrado de una con respecto a la otra

Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la

distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale

Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la

definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado

Por lo dicho anteriormente para suficientemente grande podemos

aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el

nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados

a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las

que han sido estimadas Hay para el caraacutecter y para el caraacutecter

(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley

chi-cuadrado seraacute por tanto

Vamos a presentar un ejemplo de dos caracteres binarios que tienen que

ver con enfermos para los cuales se ha observado si tienen o no una tendencia al

suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y

neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las

tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla

de contingencia observada es

Tendencia Sin tendencia Total

Psicosis 20 180 200

Nneurosis 60 140 200

Total 80 320 400

La distancia de chi-cuadrado de contingencia calculada a partir de esta

tabla es de El valor tomado por el estadiacutegrafo es el cual

debemos comparar con la ley El p-valor es de

Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre

la tendencia al suicidio y la clasificacioacuten de las enfermedades

El test no precisa el sentido de esta dependencia Para describirla hay que

comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre

los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten

PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS

Los investigadores se interesan constantemente en las diferencias entre dos

poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado

civil profesioacuten color de ojos preferencia por una marca etc)

Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de

contingenciardquo

Se puede realizar una prueba para la diferencia entre dos proporciones

sobre la base de muestras independientes usaacutendose como instrumento la prueba

de chi cuadrado

El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es

la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se

podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda

Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la

ecuacioacuten

n

nnE CR

donde

nR nuacutemero total en el rengloacuten

nC nuacutemero total en la columna

n tamantildeo total de la muestra

El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado

entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia

al cuadrado se divide entre la frecuencia esperada de la celda

La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se

rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el

valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados

de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el

tamantildeo de la muestra

CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD

Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a

las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se

puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la

distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado

siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal

Por consiguiente al probar la diferencia entre las dos proporciones la

distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes

Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia

direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten

normal

La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede

ilustrar mediante el siguiente ejemplo

Cuartos de bantildeos modernos

Cocina moderna Caren

cia

existenc

ia

totales

Carencia 72 8 80

Existencia 7 146 153

La hipoacutetesis nula y alternativa seriacutean

YN ppH 0

YN ppH 0

Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de

significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute

Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H

A partir de la informacioacuten del cuadro

10080

8

N

NSN

n

Xp 95420

153

146

Y

YSY

n

Xp

A partir de la expresioacuten

21

21

111

nnpp

pPZ SS

donde

661015380

1468

p

por lo tanto

0813

153

1

80

133906610

95420100

Z

Totales 79 154 223

Dado que 1960813 Z se rechaza la 0H por lo tanto hay

diferencia entre las dos proporciones

Usando la prueba de chi cuadrado y la tabla de contingencia de este

ejemplo se tiene

Las frecuencias teoacutericas se pueden obtener a partir de la siguiente

ecuacioacuten

n

nnE CR

Por lo tanto se tiene

1227233

7980E 8852

233

15480E

8851233

79153E 12101

233

154153E

Chi cuadrado se obtiene a partir de la expresioacuten

E

EOX

2

2

A partir de la tabla se tiene

O E (O ndash E) (O ndash E)2

(O ndash E)2E

7

2

2

712

+4488 20142144 742704

7 5

188

- 4488 20142144 388245

8 5 -4488 20142144 380903

288

1

46

1

0112

+4488 20142144 199191

1711043

10431712 CALCULADOX

Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el

84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo

tanto hay diferencia entre las dos proporciones

Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la

distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos

distribuciones que a un nivel de significancia de 005 el valor de 196 es el

cuadrado de 3 841 es decir 22 ZX

CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA

La afirmacioacuten de que no existen diferencias entre proporciones significa

que las dos variables son independientes Cuando las conclusiones se presentan en

esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo

Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que

no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la

hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos

variables Independientemente de que la prueba de chi cuadrado se considera una

prueba de diferencia entre dos proporciones o una prueba de independencia los

caacutelculos y resultados son exactamente los mismos

CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE

Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o

intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que

ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de

probabilidades

Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que

seguir varios pasos Primero se tiene que establecer la distribucioacuten de

probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada

paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la

media) se deben establecer mediante hipoacutetesis o estimarlos con base a la

informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para

determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o

intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado

para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la

informacioacuten

BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON

La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de

Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la

cantidad de automoacuteviles estacionados en una cochera cubierta siguen una

distribucioacuten de Poisson 0H

En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero

de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una

muestra aleatoria de 233 casas

Numero de automoacuteviles Frecuencia

0 61

1 151

2 21

233

Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados

de la distribucioacuten de frecuencia

No de automoacuteviles Frecuencia observada On

0 61 0

1 151 151

2 21 42

233 193

808280233

193

1

n

On

X

n

i por lo tanto 80X

El valor de la media muestral se utilizara como el estimado de X

Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)

y se obtiene la frecuencia teoacuterica para cada una

Automoacutevil

n

Frecuencia

O

Probabilidad

XP

Frecuencia (E)

XPn

0 61 04493 104687

1 151 03595 87764

2 21 01438 33505

Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de

significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX

El valor calculado de chi cuadrado es

50679

2

2

K

CALCULADO

E

EOX

Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de

automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una

distribucioacuten de Poisson

CORRECCIOacuteN DE YATES

Cuando se aplican a datos discretos los resultados para distribuciones

continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres

comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de

Yates la cual viene dada mediante la expresioacuten

E

EOX CALCULADO

502

2

En general la correccioacuten se hace solamente cuando el numero de grados

de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos

resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en

relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia

esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi

cuadrado corregido y no corregido Si ambos valores conducen a la misma

conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se

presentan dificultades Si conducen a conclusiones diferentes se puede o bien

incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear

meacutetodos de probabilidad exactos

El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente

ejemplo

En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces

Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de

significancia del 005

No de caras Frecuencia Probabilidad Frecuencia (E)

Cara 115 05 100

cruce 85 05 100

2054

100

0510085

100

0510011522

2

CALCULADOX

Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado

con correccioacuten de Yates es

8432 TABULADOX

Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha

PRUEBA EXACTA DE FISHER

Para examinar la igualdad de las varianzas de dos poblaciones

independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de

las varianzas de las dos muestras Suponiendo que la informacioacuten de cada

poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2

2

2

1 SS sigue una

distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso

estadiacutestico RA Fisher

Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de

grados de libertad los grados de libertad en el numerador y en el denominador

la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea

2

2

2

111 21

S

SF nn

donde

n1 = tamantildeo de muestra en el grupo 1

n2 = tamantildeo de muestra en el grupo 2

n1 ndash 1 = grados de libertad en el grupo 1

n2 ndash 1 = grados de libertad en el grupo 2

2

1S varianza de la muestra en el grupo 1

2

2S varianza de la muestra en el grupo 2

Al probar la igualdad de dos varianzas se pueden emplear pruebas de una

cola o de dos colas

El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente

ejemplo

Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas

alta en la planta A que en la planta B Para determinar la variabilidad se puede

establecer una prueba de una cola en la forma siguiente

22 BAOH

22

1 BAH

Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta

A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta

ubicada en la cola superior de la distribucioacuten

Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de

libertad en el numerador y 19 en el denominador a un nivel de significancia de

001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene

71162 AS y 20142 BS por lo tanto

38512014

71162

2

1924 F como 1385 lt

292 no se rechaza la hipoacutetesis nula ( OH )

CONCLUSIOacuteN

La conclusioacuten que los resultados de una medida variable es la causa de

variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten

estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero

no puede reclamar legitimidad

La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en

describir la distribucioacuten de las variables estudiadas y en particular de los datos

numeacutericos Ademaacutes de las medidas descriptivas correspondientes el

comportamiento de estas variables puede explorarse graacuteficamente de un modo

muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro

organizador de las ciencias computarizadas y el modelo que nos dota de un

mejor razonamiento para implementar programas eficientes En este sentido la

combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un

reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en

colegios y universidades

Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de

combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y

evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras

loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre

operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten

juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la

teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones

simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades

que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea

BIBLIOGRAFIacuteA

AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis

Third Edition Texts in Statistical Science Chapman and Hall

BOXG E P HUNTER W G HUNTER JS (1978) Statistics for

Experimenters John Wiley amp Sons

BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores

Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de

Modelos Ed Revertsbquo SA

Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed

Piraacutemide

Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten

(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica

Matemaacutetica I Universidad de Antioquia

Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma

Madrid

Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill

Meacutexico

Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten

yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico

Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw

ndashHill 4ta Edicioacuten Colombia

CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana

Meacutexico

COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas

COX DR (1958) Planning of experiments New York John Wiley amp Sons

DANIEL C Applications of Statistics to Industrial Experimentation Willey

DAVIES OL The Design and Analysis of Industrial Experiments Hafner

(McMillan)

DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias

Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico

SA de CV Meacutexico

De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H

(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico

Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta

Estadiacutestica Editorial Microsoft corporation USA

ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial

Limusa SA Meacutexico

EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis

Arnold

FEDERER W (1965) Experimental design Oxford Publ Co

GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la

Varianza Grupo Editorial Universitario

FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico

McGraw Hill

FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque

ModernoEditorial SA Meacutexico

George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y

Meacutetodosrdquo Ed McGraw-Hill

GILL JL (1978) Design and Analysis of Experiments in the Animal and

Medical Sciences Iowa State University Press

JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression

and Experimental Design Springer-Verlag

Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor

Caracas

GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining

Institute

GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data

Mining Institute

Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial

Bourgeoacuten Caracas

Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la

EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute

Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial

BourgeoacutenCA Caracas ndash Venezuela

HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis

Multivariante 5ordf Edicioacuten Prentice Hall

JOBSON JD (1992) Applied Multivariate Data Analysis Volume II

Categorical and Multivariate Methods Springer-Verlag

KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial

Hispanoamericana Meacutexico

KIRK RE Experimental Design Procedures for the Behavioral Sciencies

BrooksCole Publishing Company

LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e

inferencia Estadiacutestica Editorial Limusa Meacutexico

LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV

Grupo Noriega Editores Meacutexico

LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial

HARLA Meacutexico

LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta

edicioacuten Editorial McGaw-Hill Usa

Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial

Hispanoameacuterica VI edicioacuten Meacutexico

LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire

Multidimensionnelle 3ordf Edition DUNOD

LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e

Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB

Caracas- Venezuela

LORENZEN T J Anderson V L (1993) Design of experiments A No-Name

Approach Marcel Dekker Inc

Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc

(1999) SPSS 90 Manual de Usuario SPSS Chicago

MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis

Academic Press

Enfocados hacia SPSS

Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de

wwwspssparatodoscom 2005

MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten

Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla

Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea

Ediciones Alfaomega SAN Meacutexico

MASON RL Statistical Design and Analysis of Experiments with Applications

to Engineering and Science John Wiley amp Sons New York

MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y

Economiacutea Editorial Iberoamericana Meacutexico

MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in

agriculture and experimental biology Second edition Chapman amp Hall

MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo

Editorial Iberoameacuterica

MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers

John Wiley amp Sons

Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial

Reverte Mejicana Meacutexico

Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da

Edicioacuten Meacutexico

Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc

Graw Hill

PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones

Editorial Limusa Meacutexico

NETER J et al Applied Linear Statistical Models Regression Analysis of

Variance and Experimental Designs Library of Congress Cataloging Publication

Data

OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp

RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo

Editorial Universitario

PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos

Lineales y Series Temporales Vol 1 y 2 Alianza Editorial

Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores

Spain SA Espantildea 2005

PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial

Mir Moscuacute

RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed

McGraw-Hill

Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca

UCV Caracas ndash Venezuela

RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE

Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en

Psicologiacuteardquo p 1

SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons

Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti

Caracas ndash Venezuela

Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores

deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico

Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica

Editorial Harla Meacutexico

STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y

procedimientos Segunda edicioacuten McGraw Hill

SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas

Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1

Ediciones UNESR Caracas

URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante

Coartiacuteculo Plan Nuevo Editorial AC

VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II

Anaacutelisis Multivariante) Mc-Graw Hill

Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows

Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea

2002

WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros

Editorial Interamericana Meacutexico

Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8

Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage

Learning Editores p 364 ISBN 9706861947

Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea

Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea

Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de

CV Meacutexico

Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para

Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico

DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR

httpesmwikipediaorgwikiSPSS

httpwwwbuenastareascomensayosque-es-el-SPSS1465478html

httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-

del-software-estadistico-integral-spss-base-160

httpesanswersyahoocomquestionindexqid=20070727073908aatuamw

httpwwwslidesharenetleticiagpestructura-de-spss-3126476

httpwwwehowenespanolcomprograma-spss-sobre_48697

httpwwwugres~bioestmedicinamanual_spsspdf

httpwwwmonografiascomtrabajos12tutortutorshtml

httpwwwspsscom

wwwspssparatodoscom

httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html

httpwwwspssfreecomcapitulotreshtml

httpwwwuvesRELIEVEemail relieveuves

httpwwwscribdcomdochellipspss-introduccioacuten

httpeswikipediaorgwikiSPSS

httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd

f

httpwwwspsscomaressuccessargentinashtml

httpeswikipediaorgwikiSPSS

httpwww-01ibmcomsoftwareesanalyticsspss

httppsicofcepurvesspssindex0htm

httpssitesgooglecomsiteestadisticaconelspss

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpe-stadisticabioucmesweb_spssindice_spsshtml

httpwwwquimicaurvesquimiogeneralanovacastpdf

httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da

tosyMultivariable14anova1_SPSSpdf

httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800

20AnE1lisis20de20Varianzaspdf

httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-

pearson

httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf

httpwwwuoceduin3emathdocsRegresionLinealpdf

httpeswikipediaorgwikiRegresiC3B3n_lineal

httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES

ION_LINEAL_CON_SPSSpdf

httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN

EAL20SIMPLE20CON20SPSSpdf

httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE

SION_LINEAL_CON_SPSSpdf

httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm

httpeswikipediaorgwikiNivel_de_medida

httphtmlrincondelvagocomregresion-lineal-simplehtml

httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp

lepdf

httpwwwvitutorcomestadisticabi8html

httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf

httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-

Martinez_1pdf

httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml

httpesslidesharenetpatolinkecuacin-de-regresin-lineal

httpeswikipediaorgwikiMC3ADnimos_cuadrados

httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios

httpwwwwordreferencecomdefinicioncorrelaciC3B3n

httpwwwditutorcomestadistica_2correlacion_estadisticahtml

httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson

httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n

httpeswikipediaorgwikiMatriz_de_correlaciC3B3n

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpwwwinfecepiunizares

httpwwwltbioestadisticaumaes

httpwwwuaqmxmatematicasestadisticasxu3html

httpwwwmembers-americastripodcom

httpwwwmsiplceorg

httpwwwbnvcocrsesionnotaaspg

httpwwwaltavistacom

httpwwwauyantepuycom

httpwwwinees

httpwwwudeccl

httpwwwrincondelvagocom

httpwwwmonografiascom

httpwwwfestadisticafguamesindicadoresiprihtml

httpwwwuaqmxmatematicasestadisticaxu3html

httpwwwinegoboiwd0801htmlE

httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm

httpwwwitlpedumx

httpwwweclaevespanovestadisticasna93nnsnann7eshtml

httpw3moritesmmx~cmendozamaestestoohtml

httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml

httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion

httpwwwunleduarfaveseiencuestasindexhtml

httpwwwmonografiascomtrabajos11operaoperashtml

httpwwwmonografiascomtrabajos6hisohisoshtml

httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos

httpwwwmonografiascomtrabajos16sistema-operativosistema-

operativoshtmlTIPPOS

httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-

operativoshtml

httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei

httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml

httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-

operativo

httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software

httpwwwsscccoclinformaticaconceptoshtml

httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr

httpwwwcadcommxhistoria_de_la_computacionhtm

httpwwweswikipediaorgwikiBus_(informC3A1tica)

httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla

httpwwwcavsicompreguntasrespuestasque-es-el-teclado

httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm

Page 12: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,

Para muestras de n 20 se puede utilizar tablas para obtener los valores

criacuteticos de la prueba estadiacutestica W tanto para las pruebas de una cola como de dos

a diversos niveles de significacioacuten Se rechaza la hipoacutetesis nula en una prueba de

dos colas si el valor observado W es igual o excede al valor critico superior o es

igual o inferior al valor critico inferior Se rechaza la hipoacutetesis nula en una prueba

de una cola en direccioacuten positiva si el valor observado W es igual o excede el

valor critico superior Se rechaza la hipoacutetesis nula para una prueba de una cola en

direccioacuten negativa si el valor observado de w es inferior o igual al valor critico

inferior

Para nge20 la prueba estadiacutestica W tiene distribucioacuten aproximadamente

normal y se puede utilizar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis nula

W

WWZ

VARIABLES ALEATORIA Y COMO SE DIVIDEN

Una variable es aleatoria si toma diferentes valores como resultado de un

experimento aleatorio Puede ser discreta o continua Si puede tomar soacutelo un

nuacutemero limitado de valores entonces es una variable aleatoria discreta En el otro

extremo si puede tomar cualquier valor dentro de un intervalo dado entonces se

trata de una variable aleatoria continua

Se puede pensar en una variable aleatoria como un valor o una magnitud

que cambia de una presentacioacuten a otra sin seguir una secuencia predecible Los

valores de una variable aleatoria son los valores numeacutericos correspondientes a

cada posible resultado de un experimento aleatorio

La distribucioacuten de probabilidad de una variable aleatoria proporciona una

probabilidad para cada valor posible y estas probabilidades deben sumar 1

VALOR ESPERADO DE UNA VARIABLE ALEATORIA

El valor esperado es una idea fundamental en el estudio de las distribuciones de

probabilidad

Para obtener el valor esperado de una variable aleatoria discreta se

multiplica cada valor que la variable puede tomar por la probabilidad de

presentacioacuten de ese valor y luego se suman esos productos Es un promedio

pesado de los resultados que se esperan en el futuro El valor esperado pesa cada

resultado posible con respecto a la frecuencia con que se espera se que presente

En consecuencia las presentaciones maacutes comunes tienen asignadas un peso

mayor que las menos comunes

El valor esperado tambieacuten puede ser obtenido a partir de estimaciones

subjetivas En ese caso el valor esperado no es maacutes que la representacioacuten de las

convicciones personales acerca del resultado posible

VARIABLES ALEATORIAS DISCRETAS

Variable que toma un nuacutemero finito o infinito de valores numerables

Sean x1 x2 x3 xn los distintos valores que puede tomar la variable

aleatoria

Y p(x1) p(x2) p(xn) su probabilidad

Los pares de valores (xj p(xj)) constituyen la distribucioacuten de probabilidades de la

variable aleatoria

p(x) se denomina funcioacuten de probabilidad y debe cumplir con las siguientes

propiedades

0 lt p(xj) lt 1 (p(x) es una probabilidad y por lo tanto debe tomar valores

entre 0 y 1)

1)( jxP (la suma de probabilidades repartidas entre todos los valores

de la variable debe ser igual a 1)

De la misma manera que calculamos frecuencias acumuladas podemos acumular

probabilidades obteniendo la funcioacuten de distribucioacuten de probabilidades

Esta funcioacuten representa la probabilidad de que la variable aleatoria sea menor o

igual que un determinado valor

F(xj) = P (X lt xj)

Graacuteficamente la funcioacuten aumenta de a saltos ya que entre dos valores

consecutivos de una variable discreta no puede tomar valores intermedios

VARIABLES ALEATORIAS CONTINUAS

En este caso en lugar de trabajar con la probabilidad de valores

particulares de la variable resulta maacutes apropiado calcular probabilidades

asociadas a intervalos Para distribuir propiedades se usa una funcioacuten que mide

concentracioacuten de probabilidades alrededor de un punto que se denomina

funcioacuten de densidad de probabilidad (fdp) y se denota como f(x)

Una funcioacuten de densidad de probabilidad debe cumplir con las siguientes

propiedades

F(x) gt 0 (la funcioacuten es no negativa para cualquier valor de x f(x) no es

una probabilidad y puede valer maacutes de 1)

el aacuterea bajo la curva de la funcioacuten vale 1)

La funcioacuten de distribucioacuten para una variable aleatoria continua se calcula

F(a) = P(X lt

La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula

P (alt x lt b) = F(b) - F(a)

La probabilidad de que la variable tome un valor particular se puede expresar

como

F(c) - F(c) = 0

DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO

Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia

valores de una variable aleatoria con sus respectivas probabilidades es

decir Probabilidad de x = Funcioacuten de x

Las distribuciones se caracterizan por una foacutermula que determina el tipo de

distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio

muestral

En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una

funcioacuten de la probabilidad que representa los resultados que se van obteniendo en

un experimento aleatorio

Asiacute para un nuacutemero dado x la probabilidad es

A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la

variable X y representa la probabilidad de que la variable tome el valor desde

hasta x

Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de

probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad

Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos

y seraacuten mutuamente excluyentes y su suma es el

suceso por lo que tenemos entonces que

y finalmente

Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos

los valores de la variable aleatoria x conoceremos completamente la distribucioacuten

de probabilidad de la variable

Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten

de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente

Es decir la probabilidad de todo el espacio muestral es 1 tal y como

establece la teoriacutea de la probabilidad y por otra parte

Es decir la probabilidad del suceso nulo es cero

Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de

probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes

praacutectico el uso de la funcioacuten de densidad

En el caso de una variable discreta la distribucioacuten puede describirse

mediante una funcioacuten de probabilidad que para cada valor de x de la variable X

determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de

una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de

distribucioacuten la que para cada valor provee la probabilidad de no ser superado

evidentemente el valor de la funcioacuten de distribucioacuten es igual

a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo

inferior del dominio de la variable hasta x inclusive Lista de los resultados de un

experimento con las probabilidades que se esperariacutean ver asociadas con cada

resultado

Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores

diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12

En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica

Para el caso de 1 solo dado donde todos los valores tienen la misma

probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme

Prueba de aleatoriedad

Con frecuencia se supone que los datos recopilados constituyen una

muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la

utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash

Wolfowitz de corridas de una muestra para aleatoriedadrdquo

Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o

la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos

siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la

partida tiene una propiedad en particular o de la cantidad o magnitud en que se

posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la

sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con

distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente

de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que

la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las

partidas que la preceden o las que la suceden en forma tal que la probabilidad de

su ocurrencia varia de una posicioacuten a otra el proceso no se considera como

aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando

esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en

forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico

Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el

tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico

de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una

prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede

rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la

sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de

una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2

exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por

consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis de aleatoriedad

U

UUZ

donde

U = numero total de corridas

U = valor medio de U 12 21

n

nnU

U = desviacioacuten estaacutendar de U 1

222

2121

nn

nnnnnU

n1 = numero de eacutexitos en la muestra

n2 = numero de fracasos en la muestra

n = tamantildeo de la muestra n = n1 + n2

PRUEBA DE McNEMAR

Suele darse el caso en que se desean comparar las proporciones de los

datos de muestras tomados de poblaciones relacionadas En este caso se quisiera

determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a

alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea

determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y

otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede

utilizar la prueba desarrollada por McNemar

El principal intereacutes es determinar si hay diferencia entre las dos

proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta

que el otro (prueba de una cola)

La prueba estadiacutestica para la prueba de McNemar es

CB

CBZ

PRUEBA U DE MANN ndash WHITNEY

Es una alternativa no parametrica a la prueba t de dos muestras para la

diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula

μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos

la forma de distribuciones normales de hecho la prueba solo requiere que las

poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no

importa si se cumple o no esta suposicioacuten

Estadiacutesticos U1 y U2

111

2112

1 W

nnnnU

222

2122

1 W

nnnnU

PRUEBA DE RACHAS

Son todas las diferencias que tiene el mismo signo y se presentan en una

misma fila Una serie de n diferencias puede tener solamente una racha (toda

positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las

rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de

poblaciones con la misma distribucioacuten de frecuencias Colocamos las

observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces

contamos el numero de rachas item de cada una de las muestras Si hay menos

rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales

rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten

La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de

que las observaciones se han sacado aleatoriamente de una sola poblacioacuten

Para hacer esto se halla la mediana de la muestra y se designa las

observaciones situadas por debajo de la mediana por un signo menos (-) y las

observaciones situadas por encima de la mediana por un signo (+) Si el numero

de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado

rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el

numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10

puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la

tabla normal con

u

uu

z

2

1

12

21

21

NN

NNu

)1()(

2(2

21

2

21

2121212

NNNN

NNNNNNu

DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES

DISTRIBUCIONES DE EJEMPLO Y USO

DISTRIBUCIOacuteN NORMAL O GAUSSIANA

Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que

multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal

Esta distribucioacuten de caracteriza porque los valores se distribuyen formando

una campana de Gauss en torno a un valor central que coincide con el valor

medio de la distribucioacuten

Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a

la izquierda

Esta distribucioacuten viene definida por dos paraacutemetros

X N (m S2)

m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro

de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores

estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores

estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de

ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten

estaacutendar

Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina

normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo

que permiten obtener esos mismos valores donde se recoge la probabilidad

acumulada para cada punto de la curva de esta distribucioacuten

Ademaacutes toda distribucioacuten normal se puede transformar en una normal

tipificada

Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con

media 10 y varianza 4 Transformarla en una normal tipificada

X N (10 4)

Para transformarla en una normal tipificada se crea una nueva variable (Y)

que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica

(que es la raiacutez cuadrada de la varianza)

En el ejemplo la nueva variable seriacutea

Esta nueva variable se distribuye como una normal tipificada

permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor

Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos

indicado de que las probabilidades para cada valor de la curva se encuentran

recogidas en una tabla

MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)

La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten

normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta

distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros

y lo que representamos del modo si su funcioacuten de densidad

es

Observacioacuten

Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y

la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes

adelante65

La forma de la funcioacuten de densidad es la llamada campana de Gauss

Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten

normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1

Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un

uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto

con lo cual en coinciden la media la mediana

y la moda y por uacuteltimo calcular sus puntos de inflexioacuten

El soporte de la distribucioacuten es todo de modo que la mayor parte de la

masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se

encuentra concentrado alrededor de la media y las ramas de la curva se extienden

asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la

media es posible (aunque poco probable)

La forma de la campana de Gauss depende de los paraacutemetros y

indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)

Figura Distribuciones gaussianas con diferentes medias e igual

dispersioacuten

(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor

sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor

de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea

``maacutes aplastado seraacute

Figura Distribuciones gaussianas con igual media pero varianza

diferente

La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes

adelante que es

Como consecuencia la distribucioacuten normal es reproductiva con respecto a

los paraacutemetros y ya que

Observacioacuten

Como se ha mencionado anteriormente la ley de probabilidad gaussiana la

encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza

por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el

de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que

apuntar un hecho negativo para esta ley de probabilidad

La funcioacuten no posee primitiva66

conocida67

Las consecuencias desde el punto de vista praacutectico son importantes ya que

eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de

la normal y nos tenemos que limitar a decir que

sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente

esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho

puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto

se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en

problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde

se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie

limitada de valores xi dados Normalmente F se encuentra tabulada para una

distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten

normal tipificada

En el caso de que tengamos una distribucioacuten diferente se

obtiene Z haciendo el siguiente cambio

De manera general se tiene

Proposicioacuten (Cambio de origen y escala)

Sean Entonces

Este resultado puede ser utilizado del siguiente modo Si y nos

interesa calcular

1 Hacemos el cambio y calculamos

2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de

modo aproximado) Como

tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada

Ejemplo

Supongamos que cierto fenoacutemeno pueda ser representado mediante una

va y queremos calcular la probabilidad de que Xtome un valor

entre 39 y 48 es decir

Comenzamos haciendo el cambio de variable

de modo que

Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que

hemos mencionado anteriormente

Proposicioacuten

Sea Entonces

Demostracioacuten

Por ser la normal una ley de probabilidad se tiene que

es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con

respecto a se obtiene el valor 0

luego

Para demostrar la igualdad entre la y basta con aplicar la misma

teacutecnica pero esta vez derivando con respecto a

Luego

Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en

primer lugar la va tipificada de X

y calculamos

Como por la proposicioacuten 5 deducimos que

CURVA NORMAL ESTANDARIZADA

Una variable numeacuterica puede clasificarse como discreta o continua Las

variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas

con la idea de contar Las variables continuas se pueden asociar con la idea de

medir utilizando fracciones y decimales Cuando la variable es continua el

modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal

El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten

normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran

cantidad de variables continuas

El modelo matemaacutetico

La funcioacuten matemaacutetica que se usa como modelo es

e = 271

π = 314

μx = media de la poblacioacuten

σx = desviacioacuten estaacutendar de la poblacioacuten

x = un valor de la variable continua

Como e y π son constantes la forma de la curva normal depende

solamente de los dos parametros de la distribucioacuten normal la media μx y la

desviacioacuten estaacutendar σx

Las diferentes curvas normales van a variar dependiendo de esos dos

paraacutemetros

En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar

visualmente como una curva en forma de campana El aacuterea debajo de esta curva se

halla por medio del integral de la funcioacuten y corresponde al por ciento o la

proporcioacuten de puntuaciones que se encuentran en el intervalo dado

Propiedades de las distribuciones normales

a Son simeacutetricas y tienen forma de campana

b Al ser simeacutetricas la media la moda y la mediana coinciden

c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea

de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media

d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la

curva se encuentra a tres desviaciones estaacutendar de la media

En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral

de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de

diferentes secciones de la curva o se utiliza la computadora para calcular ese valor

del aacuterea

La distribucioacuten normal estandarizada

Puesto que hay un nuacutemero infinito de combinaciones para los dos

paraacutemetros hay un nuacutemero infinito de curvas normales diferentes

Este problema se ha resuelto praacutecticamente al transformar los valores de

todas las distribuciones normales a los valores de una distribucioacuten normal

estandarizada representada por la curva normal estandarizada (standard normal

curve)

Las puntuaciones estandarizadas se logran restando la media a cada

observacioacuten y dividiendo entre la desviacioacuten estaacutendar

donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar

Propiedades de la distribucioacuten normal estandarizada

μ z = 0

σ z = 1

En muchas ocasiones se quieren comparar puntuaciones que pertenecen a

dos distribuciones normales diferentes La diferencia entre las dos distribuciones

radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo

la comparacioacuten se hace posible si se convierten las puntuaciones de ambas

distribuciones a puntuaciones z que corresponden a la distribucioacuten normal

estandarizada

Percentiles y rangos percentiles de una distribucioacuten normal estandarizada

Si se desea hallar la percentiles o el rango percentil en una distribucioacuten

normal no estandarizada se recurre al procedimiento de convertir las puntuaciones

de la distribucioacuten normal dada a puntuaciones z que corresponden a la

distribucioacuten normal estandarizada

Estos valores en la distribucioacuten normal estandarizada se pueden obtener

por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en

las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el

intervalo dado

Es necesario visualizar siempre el aacuterea debajo de la curva como el por

ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo

dado

Cuando una distribucioacuten de puntuaciones es normal estandarizada la

pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar

en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o

cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten

dada

DISTRIBUCIOacuteN GAMMA

Una variable aleatoria X asociada a un experimento aleatorio tiene una

distribucioacuten GAMMA si se caracteriza por las siguientes propiedades

Algunas alternativas de funciones de densidad se pueden ver en la graacutefica

del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)

respectivamente =1

=1

La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo

III

El modelo Gamma se ha utilizado frecuentemente en variables tales como

ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el

intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson

ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900

ndash Flujos maacuteximos MARKOVIC 1965

ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965

ndash Altura de la precipitacioacuten mensual WHITCOMB 1940

ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia

infin

ndash Ingresos familiares

ndash Edad del hombre al contraer matrimonio por primera vez

ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en

subestaciones a una frecuencia part

Ejemplo

Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos

de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia

promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo

de tiempo se encuentre hasta que ocurre el segundo ciclo

a Dentro de una desviacioacuten con respecto del tiempo promedio

b A maacutes de dos desviaciones por encima de la media

Solucioacuten

X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en

horas

Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)

= 2

Y Nuacutemero de ciclos hora ---------Y~P( =002)

E(Y) = 002 =

X ~ G(2 002)

Ejemplo

En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de

kilovatios por hora puede considerarse como una variable aleatoria con

distribucioacuten GAMMA de paraacutemetros = 3 y

= 05

La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de

KWhora

iquestCuaacutel es la probabilidad de que este abastecimientos sea

a Insuficiente en un diacutea cualquiera

b Se consuman entre 3 y 8 millones de K WHora

c c Encuentre E(x) y V(x)

SOLUCIOacuteN

DISTRIBUCIOacuteN PARETO

En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad

continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores

es

Su funcioacuten de distribucioacuten es

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto

son

El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (

DISTRIBUCIOacuteN T DE STUDENT

Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una

distribucioacuten t con n grados de libertad

Cuando n--gtinfinito a curva t coincide com la normal estandarizada

FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX

MOMENTOS

La distribucioacuten -Student se construye como un cociente entre una normal

y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-

Student con n grados de libertad a la de una va T

donde Este tipo de distribuciones aparece cuando

tenemos n+1 va independientes

y nos interesa la distribucioacuten de

La funcioacuten de densidad de es

Figura Funcioacuten de densidad de una de Student

La distribucioacuten de Student tiene propiedades parecidas a

Es de media cero y simeacutetrica con respecto a la misma

Es algo maacutes dispersa que la normal pero la varianza decrece hasta

1 cuando el nuacutemero de grados de libertad aumenta

Figura Comparacioacuten entre las funciones de densidad de y

Para un nuacutemero alto de grados de libertad se puede aproximar la

distribucioacuten de Student por la normal es decir

Figura Cuando aumentan los grados de libertad la distribucioacuten de

Student se aproxima a la distribucioacuten normal tipificada

Para calcular

DISTRIBUCIOacuteN BETA

Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede

representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un

intervalo de longitud finita Tales como

Proporcioacuten de impurezas en un producto quiacutemico

La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten

La proporcioacuten vendida de un lote durante un tiempo t

La humedad relativa medida en cierto lugar

Porcentaje del costo total destinado a reparacioacuten de maquinaria

Porcentaje de costo adicional destinado a reparacioacuten de maquinaria

La distribucioacuten del tiempo necesario para completar una fase del proyecto

PERT

Evaluacioacuten de programas y teacutecnicas de revisioacuten

Ejemplo

La proporcioacuten de tramos de una autopista que requieren repararse

semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros

= 3 y =2

a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten

b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista

requieren reparacioacuten en un antildeo cualquiera

DISTRIBUCIOacuteN CAUCHY

En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de

Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es

donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene

valor esperado ni varianza

Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V

2 lt 1 el

numero U V tiene la distribucioacuten Cauchy

La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un

grado de libertad

Ejemplo

Sean y dos observaciones independientes de una distribucioacuten

Cauchy con funcioacuten de densidad

Puede demostrarse que si y son tales que entonces la

funcioacuten de verosimilitud de es bimodal

Sean y Supongamos que se desea hacer inferencias sobre el

valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa

Especiacuteficamente interesa encontrar la distribucioacuten final de

Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la

distribucioacuten final de tiene una forma complicada Es conveniente notar sin

embargo que corresponde a la densidad marginal de respecto a la

densidad conjunta

DISTRIBUCIOacuteN BERNOULLI

Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto

suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el

que no lo sea (fracaso) En realidad no se trata maacutes que de una variable

dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello

que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas

obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la

situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este

experimento mediante una va discreta Xque toma los valores X=0 si el suceso no

ocurre y X=1 en caso contrario y que se denota

Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar

una moneda al aire y considerar la va

Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de

probabilidad es

y su funcioacuten de distribucioacuten

Su funcioacuten caracteriacutestica es

Los principales momentos de la X los podemos calcular directamente

o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina

Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)

cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de

intentos

CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE

BERNOULLI

Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la

probabilidad y asegurar que se cumplen las tres condiciones necesarias en

particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del

resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3

requiere que los ensayos o intentos de un proceso de Bernoulli sean

estadiacutesticamente independientes es decir que el resultado de un intento no puede

afectar de ninguacuten modo el resultado de cualquier otro intento

DISTRIBUCIOacuteN EXPONENCIAL

Modelo para variable aleatoria continua que permite representar variables

del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos

Componentes

En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de

probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para

valores x gt 0 es

f(x) = λe - λx

Su funcioacuten de distribucioacuten es

Aqui e significa el nuacutemero e

El valor esperado y la varianza de una variable aleatoria X con

distribucioacuten exponencial son

E[X] = 1 λ

V(X) = 1 λ2

Ejemplo

Ejemplos para la distribucioacuten exponencial son los tiempos dentro

accidentes con probabilidad invariable

La funcioacuten de densidad para λ igual 05 10 y 15

DISTRIBUCIOacuteN MULTINOMIAL

La distribucioacuten multinomial es similar a la distribucioacuten binomial con la

diferencia de que en lugar de dos posibles resultados en cada ensayo

La distribucioacuten multinomial sigue el siguiente modelo

Donde

X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo

que el partido POPO lo hayan votado 3 personas)

n indica el nuacutemero de veces que se ha repetido el suceso (en el

ejemplo 5 veces)

n es factorial de n (en el ejemplo 5 4 3 2 1)

p1 es la probabilidad del suceso X1 (en el ejemplo el 40)

Veamos el ejemplo

Luego

P = 00256

Es decir que la probabilidad de que las 5 personas elegidas hayan votado

de esta manera es tan soacutelo del 256

Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1

Veamos otro ejemplo

En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el

40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4

invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos

Aplicamos el modelo

LuegoP = 00384

Por lo tanto la probabilidad de que el grupo esteacute formado por personas de

estos paiacuteses es tan soacutelo del 384

DISTRIBUCIOacuteN UNIFORME

En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de

probabilidad cuyos valores tienen la misma probabilidad

Caso discreto

Su funcioacuten de probabilidad es en el caso discreto con valores posibles

p(xi) = 1 n

Su funcioacuten de distribucioacuten es en el caso discreto

Su media estadiacutestica es

Caso continuo

Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b

La funcioacuten de densidad en el caso continuo entre a y b es

Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12

Ejemplos

Para un dado perfecto todos los resultados tienen la misma probabilidad 1

6

Calcular variables aleatorias

Las variables aleatorias de probabilidad uniforme pueden calcularse con un

generador de variables aleatorias

DISTRIBUCIOacuteN BINOMIAL

En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad

discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con

probabilidad p de un eacutexito

Su funcioacuten de densidad es

Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)

posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos

((1 - p)n - x

)

El valor esperado de una variable aleatoria de probabilidad binominal es

E[x] = np y su varianza V[x] = np(1 - p)

DISTRIBUCIOacuteN BINOMIAL NEGATIVA

Sobre una sucesioacuten de va de Bernouilli independientes

Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r

eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de

distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo

Su ley de probabilidad se deduce siguiendo el esquema

De nuevo el conjunto de posibles valores de esta va discreta es

Su funcioacuten caracteriacutestica es

y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima

Ejemplo

Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en

operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal

que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda

definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para

intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus

5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones

que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se

necesiten 10 intervenciones

Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por

una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan

4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso

Identificando los paraacutemetros se tiene

Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el

nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy

simple

Y=X+r

Luego

Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente

es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de

que X=10-4=6 Por tanto

La distribucioacuten binomial negativa tambieacuten se puede definir como el

nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas

contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que

DISTRIBUCIOacuteN DE POISSON

Modelo para variable aleatoria discreta que permite calcular la

probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten

discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo

muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos

o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual

a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es

independiente de cuaacutendo se presenta dicho periacuteodo

En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de

probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos

es

Aquiacute e significa el nuacutemero e y x significa el factorial de x

La distribucion de Poisson describe el nuacutemero de sucesos en una unidad

de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un

proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens

en una carrera

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten

Poisson son

E[X] = V[X] = λ

La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos

entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un

conmutador la demanda (necesidades) de los pacientes que requieren servicio en

una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el

nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos

ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una

variable aleatoria discreta que toma valores enteros (0 1 2)

Caacutelculo de la probabilidad de Poisson

La letra X por lo general representa a una variable discreta y puede tomar

valores enteros Utilizamos la letra X para representar a la variable aleatoria y la

letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La

probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson

se calcula con la foacutermula

LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA

DISTRIBUCIOacuteN BINOMIAL

La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la

binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan

cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es

grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan

con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena

aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es

igual o menor que 005 En los casos en que se cumplen estas condiciones

podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media

de la distribucioacuten de Poisson

DISTRIBUCIOacuteN GEOMEacuteTRICA

En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten

probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores

discretos es

P(X = x) = p(1 - p)x - 1

Su funcioacuten de distribucioacuten es

El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media

estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2

Ejemplo

El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es

una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6

DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA

En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de

probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de

masa para valores es

Aqui (a sobre b) es el coeficiente binomial

El valor esperado de una variable aleatoria X de distribucioacuten

hipergeomeacutetrica es

Y su varianza

DISTRIBUCIOacuteN ZETA

En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad

discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos

es

Aqui ζ(s) es la funcioacuten zeta de Rieman con

El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto

DISTRIBUCION CHI CUADRADO

El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una

comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es

diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con

ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno

es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario

estas dos frecuencias acusan una diferencia significativa para por ejemplo un

nivel de significacioacuten del 5

El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la

asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada

por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito

bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor

del famoso libro Statistical Methods for Research Workers (1925) donde se

marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con

Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde

estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y

el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las

pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba

exacta de Fisher

Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico

publicitario presentado a grupos de clientes comparar la rentabilidad de un

proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos

de los turistas por determinados espacios geograacuteficos o por determinados

servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las

frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las

frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o

tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o

de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2

x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos

turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han

ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han

tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula

que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido

en los sitios A y B

Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es

independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo

A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces

alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este

anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos

empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de

las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51

La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten

igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es

2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del

Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del

5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206

podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para

suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B

Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias

observadas empiacutericamente de dos muestras con las frecuencias esperadas o

teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el

Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de

las materias primas perecederas Los resultados son seguacuten atributos cualitativos

los siguientes Primero veremos las frecuencias empiacutericas u observadas

Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten

Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son

131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas

Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y

fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres

columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta

maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x

120 260 = 6046 b2 = 129 x 120 260 = 5954

Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten

igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de

2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de

libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La

diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna

conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten

Es una medida de la discrepancia existente entre las frecuencias

observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso

de frecuencias () debido a que permite determinar las desviaciones entre ellas

ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la

expresioacuten

E

EOX

2

2

Donde

O frecuencia observada

E frecuencia teoacuterica esperada

TEST DE CHI-CUADRADO DE CONTINGENCIA

Un caso particular del test de chi-cuadrado que permite hacer un test sobre

la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-

cuadrado de contingencia Los dos caracteres observados en una misma

poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases

de se denotan las de por Tambieacuten vamos a

denotar

el efectivo conjunto de y es el nuacutemero de individuos para los

cuales toma el valor e el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

Estos valores se representan en una tabla de doble entrada conocida como

tabla de contingencia

Cada fila y cada columna corresponden a una submuestra particular La

fila de iacutendice es la distribucioacuten en las clases de los individuos para

los cuales el caraacutecter toma el valor La columna de iacutendice es la

distribucioacuten en las clases de los individuos para los cuales el caraacutecter

toma el valor Dividiendo las filas y las columnas por su suma se obtienen

frecuencias condicionales para cada una de las distribuciones empiacutericas Para

y las denotaremos por

y

Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y

los perfiles columna Para el modelo probabilista las observaciones provienen de

una muestra

de una ley bidimensional La hipoacutetesis a comprobar

es que los dos marginales de esta ley son independientes Si este es el caso los

perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna

de la de

y

Es equivalente a decir que las frecuencias conjuntas deben estar cerca de

los productos de las frecuencias marginales

Las frecuencias conjuntas por un lado (distribucioacuten observada) y los

productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen

dos distribuciones de probabilidad sobre el conjunto producto

Podemos por tanto calcular la distancia de

chi-cuadrado de una con respecto a la otra

Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la

distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale

Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la

definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado

Por lo dicho anteriormente para suficientemente grande podemos

aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el

nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados

a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las

que han sido estimadas Hay para el caraacutecter y para el caraacutecter

(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley

chi-cuadrado seraacute por tanto

Vamos a presentar un ejemplo de dos caracteres binarios que tienen que

ver con enfermos para los cuales se ha observado si tienen o no una tendencia al

suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y

neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las

tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla

de contingencia observada es

Tendencia Sin tendencia Total

Psicosis 20 180 200

Nneurosis 60 140 200

Total 80 320 400

La distancia de chi-cuadrado de contingencia calculada a partir de esta

tabla es de El valor tomado por el estadiacutegrafo es el cual

debemos comparar con la ley El p-valor es de

Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre

la tendencia al suicidio y la clasificacioacuten de las enfermedades

El test no precisa el sentido de esta dependencia Para describirla hay que

comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre

los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten

PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS

Los investigadores se interesan constantemente en las diferencias entre dos

poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado

civil profesioacuten color de ojos preferencia por una marca etc)

Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de

contingenciardquo

Se puede realizar una prueba para la diferencia entre dos proporciones

sobre la base de muestras independientes usaacutendose como instrumento la prueba

de chi cuadrado

El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es

la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se

podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda

Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la

ecuacioacuten

n

nnE CR

donde

nR nuacutemero total en el rengloacuten

nC nuacutemero total en la columna

n tamantildeo total de la muestra

El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado

entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia

al cuadrado se divide entre la frecuencia esperada de la celda

La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se

rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el

valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados

de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el

tamantildeo de la muestra

CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD

Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a

las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se

puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la

distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado

siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal

Por consiguiente al probar la diferencia entre las dos proporciones la

distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes

Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia

direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten

normal

La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede

ilustrar mediante el siguiente ejemplo

Cuartos de bantildeos modernos

Cocina moderna Caren

cia

existenc

ia

totales

Carencia 72 8 80

Existencia 7 146 153

La hipoacutetesis nula y alternativa seriacutean

YN ppH 0

YN ppH 0

Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de

significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute

Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H

A partir de la informacioacuten del cuadro

10080

8

N

NSN

n

Xp 95420

153

146

Y

YSY

n

Xp

A partir de la expresioacuten

21

21

111

nnpp

pPZ SS

donde

661015380

1468

p

por lo tanto

0813

153

1

80

133906610

95420100

Z

Totales 79 154 223

Dado que 1960813 Z se rechaza la 0H por lo tanto hay

diferencia entre las dos proporciones

Usando la prueba de chi cuadrado y la tabla de contingencia de este

ejemplo se tiene

Las frecuencias teoacutericas se pueden obtener a partir de la siguiente

ecuacioacuten

n

nnE CR

Por lo tanto se tiene

1227233

7980E 8852

233

15480E

8851233

79153E 12101

233

154153E

Chi cuadrado se obtiene a partir de la expresioacuten

E

EOX

2

2

A partir de la tabla se tiene

O E (O ndash E) (O ndash E)2

(O ndash E)2E

7

2

2

712

+4488 20142144 742704

7 5

188

- 4488 20142144 388245

8 5 -4488 20142144 380903

288

1

46

1

0112

+4488 20142144 199191

1711043

10431712 CALCULADOX

Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el

84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo

tanto hay diferencia entre las dos proporciones

Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la

distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos

distribuciones que a un nivel de significancia de 005 el valor de 196 es el

cuadrado de 3 841 es decir 22 ZX

CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA

La afirmacioacuten de que no existen diferencias entre proporciones significa

que las dos variables son independientes Cuando las conclusiones se presentan en

esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo

Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que

no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la

hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos

variables Independientemente de que la prueba de chi cuadrado se considera una

prueba de diferencia entre dos proporciones o una prueba de independencia los

caacutelculos y resultados son exactamente los mismos

CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE

Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o

intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que

ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de

probabilidades

Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que

seguir varios pasos Primero se tiene que establecer la distribucioacuten de

probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada

paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la

media) se deben establecer mediante hipoacutetesis o estimarlos con base a la

informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para

determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o

intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado

para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la

informacioacuten

BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON

La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de

Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la

cantidad de automoacuteviles estacionados en una cochera cubierta siguen una

distribucioacuten de Poisson 0H

En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero

de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una

muestra aleatoria de 233 casas

Numero de automoacuteviles Frecuencia

0 61

1 151

2 21

233

Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados

de la distribucioacuten de frecuencia

No de automoacuteviles Frecuencia observada On

0 61 0

1 151 151

2 21 42

233 193

808280233

193

1

n

On

X

n

i por lo tanto 80X

El valor de la media muestral se utilizara como el estimado de X

Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)

y se obtiene la frecuencia teoacuterica para cada una

Automoacutevil

n

Frecuencia

O

Probabilidad

XP

Frecuencia (E)

XPn

0 61 04493 104687

1 151 03595 87764

2 21 01438 33505

Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de

significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX

El valor calculado de chi cuadrado es

50679

2

2

K

CALCULADO

E

EOX

Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de

automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una

distribucioacuten de Poisson

CORRECCIOacuteN DE YATES

Cuando se aplican a datos discretos los resultados para distribuciones

continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres

comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de

Yates la cual viene dada mediante la expresioacuten

E

EOX CALCULADO

502

2

En general la correccioacuten se hace solamente cuando el numero de grados

de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos

resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en

relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia

esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi

cuadrado corregido y no corregido Si ambos valores conducen a la misma

conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se

presentan dificultades Si conducen a conclusiones diferentes se puede o bien

incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear

meacutetodos de probabilidad exactos

El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente

ejemplo

En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces

Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de

significancia del 005

No de caras Frecuencia Probabilidad Frecuencia (E)

Cara 115 05 100

cruce 85 05 100

2054

100

0510085

100

0510011522

2

CALCULADOX

Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado

con correccioacuten de Yates es

8432 TABULADOX

Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha

PRUEBA EXACTA DE FISHER

Para examinar la igualdad de las varianzas de dos poblaciones

independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de

las varianzas de las dos muestras Suponiendo que la informacioacuten de cada

poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2

2

2

1 SS sigue una

distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso

estadiacutestico RA Fisher

Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de

grados de libertad los grados de libertad en el numerador y en el denominador

la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea

2

2

2

111 21

S

SF nn

donde

n1 = tamantildeo de muestra en el grupo 1

n2 = tamantildeo de muestra en el grupo 2

n1 ndash 1 = grados de libertad en el grupo 1

n2 ndash 1 = grados de libertad en el grupo 2

2

1S varianza de la muestra en el grupo 1

2

2S varianza de la muestra en el grupo 2

Al probar la igualdad de dos varianzas se pueden emplear pruebas de una

cola o de dos colas

El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente

ejemplo

Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas

alta en la planta A que en la planta B Para determinar la variabilidad se puede

establecer una prueba de una cola en la forma siguiente

22 BAOH

22

1 BAH

Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta

A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta

ubicada en la cola superior de la distribucioacuten

Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de

libertad en el numerador y 19 en el denominador a un nivel de significancia de

001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene

71162 AS y 20142 BS por lo tanto

38512014

71162

2

1924 F como 1385 lt

292 no se rechaza la hipoacutetesis nula ( OH )

CONCLUSIOacuteN

La conclusioacuten que los resultados de una medida variable es la causa de

variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten

estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero

no puede reclamar legitimidad

La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en

describir la distribucioacuten de las variables estudiadas y en particular de los datos

numeacutericos Ademaacutes de las medidas descriptivas correspondientes el

comportamiento de estas variables puede explorarse graacuteficamente de un modo

muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro

organizador de las ciencias computarizadas y el modelo que nos dota de un

mejor razonamiento para implementar programas eficientes En este sentido la

combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un

reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en

colegios y universidades

Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de

combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y

evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras

loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre

operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten

juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la

teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones

simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades

que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea

BIBLIOGRAFIacuteA

AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis

Third Edition Texts in Statistical Science Chapman and Hall

BOXG E P HUNTER W G HUNTER JS (1978) Statistics for

Experimenters John Wiley amp Sons

BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores

Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de

Modelos Ed Revertsbquo SA

Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed

Piraacutemide

Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten

(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica

Matemaacutetica I Universidad de Antioquia

Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma

Madrid

Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill

Meacutexico

Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten

yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico

Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw

ndashHill 4ta Edicioacuten Colombia

CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana

Meacutexico

COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas

COX DR (1958) Planning of experiments New York John Wiley amp Sons

DANIEL C Applications of Statistics to Industrial Experimentation Willey

DAVIES OL The Design and Analysis of Industrial Experiments Hafner

(McMillan)

DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias

Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico

SA de CV Meacutexico

De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H

(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico

Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta

Estadiacutestica Editorial Microsoft corporation USA

ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial

Limusa SA Meacutexico

EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis

Arnold

FEDERER W (1965) Experimental design Oxford Publ Co

GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la

Varianza Grupo Editorial Universitario

FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico

McGraw Hill

FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque

ModernoEditorial SA Meacutexico

George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y

Meacutetodosrdquo Ed McGraw-Hill

GILL JL (1978) Design and Analysis of Experiments in the Animal and

Medical Sciences Iowa State University Press

JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression

and Experimental Design Springer-Verlag

Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor

Caracas

GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining

Institute

GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data

Mining Institute

Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial

Bourgeoacuten Caracas

Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la

EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute

Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial

BourgeoacutenCA Caracas ndash Venezuela

HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis

Multivariante 5ordf Edicioacuten Prentice Hall

JOBSON JD (1992) Applied Multivariate Data Analysis Volume II

Categorical and Multivariate Methods Springer-Verlag

KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial

Hispanoamericana Meacutexico

KIRK RE Experimental Design Procedures for the Behavioral Sciencies

BrooksCole Publishing Company

LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e

inferencia Estadiacutestica Editorial Limusa Meacutexico

LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV

Grupo Noriega Editores Meacutexico

LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial

HARLA Meacutexico

LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta

edicioacuten Editorial McGaw-Hill Usa

Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial

Hispanoameacuterica VI edicioacuten Meacutexico

LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire

Multidimensionnelle 3ordf Edition DUNOD

LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e

Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB

Caracas- Venezuela

LORENZEN T J Anderson V L (1993) Design of experiments A No-Name

Approach Marcel Dekker Inc

Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc

(1999) SPSS 90 Manual de Usuario SPSS Chicago

MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis

Academic Press

Enfocados hacia SPSS

Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de

wwwspssparatodoscom 2005

MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten

Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla

Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea

Ediciones Alfaomega SAN Meacutexico

MASON RL Statistical Design and Analysis of Experiments with Applications

to Engineering and Science John Wiley amp Sons New York

MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y

Economiacutea Editorial Iberoamericana Meacutexico

MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in

agriculture and experimental biology Second edition Chapman amp Hall

MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo

Editorial Iberoameacuterica

MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers

John Wiley amp Sons

Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial

Reverte Mejicana Meacutexico

Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da

Edicioacuten Meacutexico

Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc

Graw Hill

PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones

Editorial Limusa Meacutexico

NETER J et al Applied Linear Statistical Models Regression Analysis of

Variance and Experimental Designs Library of Congress Cataloging Publication

Data

OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp

RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo

Editorial Universitario

PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos

Lineales y Series Temporales Vol 1 y 2 Alianza Editorial

Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores

Spain SA Espantildea 2005

PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial

Mir Moscuacute

RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed

McGraw-Hill

Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca

UCV Caracas ndash Venezuela

RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE

Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en

Psicologiacuteardquo p 1

SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons

Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti

Caracas ndash Venezuela

Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores

deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico

Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica

Editorial Harla Meacutexico

STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y

procedimientos Segunda edicioacuten McGraw Hill

SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas

Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1

Ediciones UNESR Caracas

URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante

Coartiacuteculo Plan Nuevo Editorial AC

VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II

Anaacutelisis Multivariante) Mc-Graw Hill

Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows

Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea

2002

WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros

Editorial Interamericana Meacutexico

Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8

Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage

Learning Editores p 364 ISBN 9706861947

Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea

Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea

Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de

CV Meacutexico

Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para

Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico

DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR

httpesmwikipediaorgwikiSPSS

httpwwwbuenastareascomensayosque-es-el-SPSS1465478html

httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-

del-software-estadistico-integral-spss-base-160

httpesanswersyahoocomquestionindexqid=20070727073908aatuamw

httpwwwslidesharenetleticiagpestructura-de-spss-3126476

httpwwwehowenespanolcomprograma-spss-sobre_48697

httpwwwugres~bioestmedicinamanual_spsspdf

httpwwwmonografiascomtrabajos12tutortutorshtml

httpwwwspsscom

wwwspssparatodoscom

httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html

httpwwwspssfreecomcapitulotreshtml

httpwwwuvesRELIEVEemail relieveuves

httpwwwscribdcomdochellipspss-introduccioacuten

httpeswikipediaorgwikiSPSS

httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd

f

httpwwwspsscomaressuccessargentinashtml

httpeswikipediaorgwikiSPSS

httpwww-01ibmcomsoftwareesanalyticsspss

httppsicofcepurvesspssindex0htm

httpssitesgooglecomsiteestadisticaconelspss

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpe-stadisticabioucmesweb_spssindice_spsshtml

httpwwwquimicaurvesquimiogeneralanovacastpdf

httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da

tosyMultivariable14anova1_SPSSpdf

httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800

20AnE1lisis20de20Varianzaspdf

httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-

pearson

httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf

httpwwwuoceduin3emathdocsRegresionLinealpdf

httpeswikipediaorgwikiRegresiC3B3n_lineal

httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES

ION_LINEAL_CON_SPSSpdf

httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN

EAL20SIMPLE20CON20SPSSpdf

httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE

SION_LINEAL_CON_SPSSpdf

httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm

httpeswikipediaorgwikiNivel_de_medida

httphtmlrincondelvagocomregresion-lineal-simplehtml

httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp

lepdf

httpwwwvitutorcomestadisticabi8html

httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf

httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-

Martinez_1pdf

httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml

httpesslidesharenetpatolinkecuacin-de-regresin-lineal

httpeswikipediaorgwikiMC3ADnimos_cuadrados

httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios

httpwwwwordreferencecomdefinicioncorrelaciC3B3n

httpwwwditutorcomestadistica_2correlacion_estadisticahtml

httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson

httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n

httpeswikipediaorgwikiMatriz_de_correlaciC3B3n

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpwwwinfecepiunizares

httpwwwltbioestadisticaumaes

httpwwwuaqmxmatematicasestadisticasxu3html

httpwwwmembers-americastripodcom

httpwwwmsiplceorg

httpwwwbnvcocrsesionnotaaspg

httpwwwaltavistacom

httpwwwauyantepuycom

httpwwwinees

httpwwwudeccl

httpwwwrincondelvagocom

httpwwwmonografiascom

httpwwwfestadisticafguamesindicadoresiprihtml

httpwwwuaqmxmatematicasestadisticaxu3html

httpwwwinegoboiwd0801htmlE

httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm

httpwwwitlpedumx

httpwwweclaevespanovestadisticasna93nnsnann7eshtml

httpw3moritesmmx~cmendozamaestestoohtml

httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml

httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion

httpwwwunleduarfaveseiencuestasindexhtml

httpwwwmonografiascomtrabajos11operaoperashtml

httpwwwmonografiascomtrabajos6hisohisoshtml

httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos

httpwwwmonografiascomtrabajos16sistema-operativosistema-

operativoshtmlTIPPOS

httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-

operativoshtml

httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei

httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml

httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-

operativo

httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software

httpwwwsscccoclinformaticaconceptoshtml

httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr

httpwwwcadcommxhistoria_de_la_computacionhtm

httpwwweswikipediaorgwikiBus_(informC3A1tica)

httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla

httpwwwcavsicompreguntasrespuestasque-es-el-teclado

httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm

Page 13: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,

VALOR ESPERADO DE UNA VARIABLE ALEATORIA

El valor esperado es una idea fundamental en el estudio de las distribuciones de

probabilidad

Para obtener el valor esperado de una variable aleatoria discreta se

multiplica cada valor que la variable puede tomar por la probabilidad de

presentacioacuten de ese valor y luego se suman esos productos Es un promedio

pesado de los resultados que se esperan en el futuro El valor esperado pesa cada

resultado posible con respecto a la frecuencia con que se espera se que presente

En consecuencia las presentaciones maacutes comunes tienen asignadas un peso

mayor que las menos comunes

El valor esperado tambieacuten puede ser obtenido a partir de estimaciones

subjetivas En ese caso el valor esperado no es maacutes que la representacioacuten de las

convicciones personales acerca del resultado posible

VARIABLES ALEATORIAS DISCRETAS

Variable que toma un nuacutemero finito o infinito de valores numerables

Sean x1 x2 x3 xn los distintos valores que puede tomar la variable

aleatoria

Y p(x1) p(x2) p(xn) su probabilidad

Los pares de valores (xj p(xj)) constituyen la distribucioacuten de probabilidades de la

variable aleatoria

p(x) se denomina funcioacuten de probabilidad y debe cumplir con las siguientes

propiedades

0 lt p(xj) lt 1 (p(x) es una probabilidad y por lo tanto debe tomar valores

entre 0 y 1)

1)( jxP (la suma de probabilidades repartidas entre todos los valores

de la variable debe ser igual a 1)

De la misma manera que calculamos frecuencias acumuladas podemos acumular

probabilidades obteniendo la funcioacuten de distribucioacuten de probabilidades

Esta funcioacuten representa la probabilidad de que la variable aleatoria sea menor o

igual que un determinado valor

F(xj) = P (X lt xj)

Graacuteficamente la funcioacuten aumenta de a saltos ya que entre dos valores

consecutivos de una variable discreta no puede tomar valores intermedios

VARIABLES ALEATORIAS CONTINUAS

En este caso en lugar de trabajar con la probabilidad de valores

particulares de la variable resulta maacutes apropiado calcular probabilidades

asociadas a intervalos Para distribuir propiedades se usa una funcioacuten que mide

concentracioacuten de probabilidades alrededor de un punto que se denomina

funcioacuten de densidad de probabilidad (fdp) y se denota como f(x)

Una funcioacuten de densidad de probabilidad debe cumplir con las siguientes

propiedades

F(x) gt 0 (la funcioacuten es no negativa para cualquier valor de x f(x) no es

una probabilidad y puede valer maacutes de 1)

el aacuterea bajo la curva de la funcioacuten vale 1)

La funcioacuten de distribucioacuten para una variable aleatoria continua se calcula

F(a) = P(X lt

La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula

P (alt x lt b) = F(b) - F(a)

La probabilidad de que la variable tome un valor particular se puede expresar

como

F(c) - F(c) = 0

DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO

Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia

valores de una variable aleatoria con sus respectivas probabilidades es

decir Probabilidad de x = Funcioacuten de x

Las distribuciones se caracterizan por una foacutermula que determina el tipo de

distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio

muestral

En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una

funcioacuten de la probabilidad que representa los resultados que se van obteniendo en

un experimento aleatorio

Asiacute para un nuacutemero dado x la probabilidad es

A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la

variable X y representa la probabilidad de que la variable tome el valor desde

hasta x

Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de

probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad

Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos

y seraacuten mutuamente excluyentes y su suma es el

suceso por lo que tenemos entonces que

y finalmente

Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos

los valores de la variable aleatoria x conoceremos completamente la distribucioacuten

de probabilidad de la variable

Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten

de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente

Es decir la probabilidad de todo el espacio muestral es 1 tal y como

establece la teoriacutea de la probabilidad y por otra parte

Es decir la probabilidad del suceso nulo es cero

Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de

probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes

praacutectico el uso de la funcioacuten de densidad

En el caso de una variable discreta la distribucioacuten puede describirse

mediante una funcioacuten de probabilidad que para cada valor de x de la variable X

determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de

una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de

distribucioacuten la que para cada valor provee la probabilidad de no ser superado

evidentemente el valor de la funcioacuten de distribucioacuten es igual

a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo

inferior del dominio de la variable hasta x inclusive Lista de los resultados de un

experimento con las probabilidades que se esperariacutean ver asociadas con cada

resultado

Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores

diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12

En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica

Para el caso de 1 solo dado donde todos los valores tienen la misma

probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme

Prueba de aleatoriedad

Con frecuencia se supone que los datos recopilados constituyen una

muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la

utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash

Wolfowitz de corridas de una muestra para aleatoriedadrdquo

Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o

la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos

siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la

partida tiene una propiedad en particular o de la cantidad o magnitud en que se

posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la

sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con

distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente

de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que

la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las

partidas que la preceden o las que la suceden en forma tal que la probabilidad de

su ocurrencia varia de una posicioacuten a otra el proceso no se considera como

aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando

esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en

forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico

Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el

tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico

de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una

prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede

rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la

sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de

una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2

exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por

consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis de aleatoriedad

U

UUZ

donde

U = numero total de corridas

U = valor medio de U 12 21

n

nnU

U = desviacioacuten estaacutendar de U 1

222

2121

nn

nnnnnU

n1 = numero de eacutexitos en la muestra

n2 = numero de fracasos en la muestra

n = tamantildeo de la muestra n = n1 + n2

PRUEBA DE McNEMAR

Suele darse el caso en que se desean comparar las proporciones de los

datos de muestras tomados de poblaciones relacionadas En este caso se quisiera

determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a

alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea

determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y

otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede

utilizar la prueba desarrollada por McNemar

El principal intereacutes es determinar si hay diferencia entre las dos

proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta

que el otro (prueba de una cola)

La prueba estadiacutestica para la prueba de McNemar es

CB

CBZ

PRUEBA U DE MANN ndash WHITNEY

Es una alternativa no parametrica a la prueba t de dos muestras para la

diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula

μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos

la forma de distribuciones normales de hecho la prueba solo requiere que las

poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no

importa si se cumple o no esta suposicioacuten

Estadiacutesticos U1 y U2

111

2112

1 W

nnnnU

222

2122

1 W

nnnnU

PRUEBA DE RACHAS

Son todas las diferencias que tiene el mismo signo y se presentan en una

misma fila Una serie de n diferencias puede tener solamente una racha (toda

positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las

rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de

poblaciones con la misma distribucioacuten de frecuencias Colocamos las

observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces

contamos el numero de rachas item de cada una de las muestras Si hay menos

rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales

rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten

La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de

que las observaciones se han sacado aleatoriamente de una sola poblacioacuten

Para hacer esto se halla la mediana de la muestra y se designa las

observaciones situadas por debajo de la mediana por un signo menos (-) y las

observaciones situadas por encima de la mediana por un signo (+) Si el numero

de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado

rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el

numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10

puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la

tabla normal con

u

uu

z

2

1

12

21

21

NN

NNu

)1()(

2(2

21

2

21

2121212

NNNN

NNNNNNu

DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES

DISTRIBUCIONES DE EJEMPLO Y USO

DISTRIBUCIOacuteN NORMAL O GAUSSIANA

Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que

multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal

Esta distribucioacuten de caracteriza porque los valores se distribuyen formando

una campana de Gauss en torno a un valor central que coincide con el valor

medio de la distribucioacuten

Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a

la izquierda

Esta distribucioacuten viene definida por dos paraacutemetros

X N (m S2)

m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro

de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores

estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores

estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de

ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten

estaacutendar

Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina

normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo

que permiten obtener esos mismos valores donde se recoge la probabilidad

acumulada para cada punto de la curva de esta distribucioacuten

Ademaacutes toda distribucioacuten normal se puede transformar en una normal

tipificada

Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con

media 10 y varianza 4 Transformarla en una normal tipificada

X N (10 4)

Para transformarla en una normal tipificada se crea una nueva variable (Y)

que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica

(que es la raiacutez cuadrada de la varianza)

En el ejemplo la nueva variable seriacutea

Esta nueva variable se distribuye como una normal tipificada

permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor

Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos

indicado de que las probabilidades para cada valor de la curva se encuentran

recogidas en una tabla

MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)

La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten

normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta

distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros

y lo que representamos del modo si su funcioacuten de densidad

es

Observacioacuten

Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y

la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes

adelante65

La forma de la funcioacuten de densidad es la llamada campana de Gauss

Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten

normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1

Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un

uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto

con lo cual en coinciden la media la mediana

y la moda y por uacuteltimo calcular sus puntos de inflexioacuten

El soporte de la distribucioacuten es todo de modo que la mayor parte de la

masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se

encuentra concentrado alrededor de la media y las ramas de la curva se extienden

asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la

media es posible (aunque poco probable)

La forma de la campana de Gauss depende de los paraacutemetros y

indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)

Figura Distribuciones gaussianas con diferentes medias e igual

dispersioacuten

(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor

sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor

de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea

``maacutes aplastado seraacute

Figura Distribuciones gaussianas con igual media pero varianza

diferente

La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes

adelante que es

Como consecuencia la distribucioacuten normal es reproductiva con respecto a

los paraacutemetros y ya que

Observacioacuten

Como se ha mencionado anteriormente la ley de probabilidad gaussiana la

encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza

por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el

de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que

apuntar un hecho negativo para esta ley de probabilidad

La funcioacuten no posee primitiva66

conocida67

Las consecuencias desde el punto de vista praacutectico son importantes ya que

eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de

la normal y nos tenemos que limitar a decir que

sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente

esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho

puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto

se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en

problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde

se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie

limitada de valores xi dados Normalmente F se encuentra tabulada para una

distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten

normal tipificada

En el caso de que tengamos una distribucioacuten diferente se

obtiene Z haciendo el siguiente cambio

De manera general se tiene

Proposicioacuten (Cambio de origen y escala)

Sean Entonces

Este resultado puede ser utilizado del siguiente modo Si y nos

interesa calcular

1 Hacemos el cambio y calculamos

2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de

modo aproximado) Como

tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada

Ejemplo

Supongamos que cierto fenoacutemeno pueda ser representado mediante una

va y queremos calcular la probabilidad de que Xtome un valor

entre 39 y 48 es decir

Comenzamos haciendo el cambio de variable

de modo que

Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que

hemos mencionado anteriormente

Proposicioacuten

Sea Entonces

Demostracioacuten

Por ser la normal una ley de probabilidad se tiene que

es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con

respecto a se obtiene el valor 0

luego

Para demostrar la igualdad entre la y basta con aplicar la misma

teacutecnica pero esta vez derivando con respecto a

Luego

Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en

primer lugar la va tipificada de X

y calculamos

Como por la proposicioacuten 5 deducimos que

CURVA NORMAL ESTANDARIZADA

Una variable numeacuterica puede clasificarse como discreta o continua Las

variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas

con la idea de contar Las variables continuas se pueden asociar con la idea de

medir utilizando fracciones y decimales Cuando la variable es continua el

modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal

El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten

normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran

cantidad de variables continuas

El modelo matemaacutetico

La funcioacuten matemaacutetica que se usa como modelo es

e = 271

π = 314

μx = media de la poblacioacuten

σx = desviacioacuten estaacutendar de la poblacioacuten

x = un valor de la variable continua

Como e y π son constantes la forma de la curva normal depende

solamente de los dos parametros de la distribucioacuten normal la media μx y la

desviacioacuten estaacutendar σx

Las diferentes curvas normales van a variar dependiendo de esos dos

paraacutemetros

En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar

visualmente como una curva en forma de campana El aacuterea debajo de esta curva se

halla por medio del integral de la funcioacuten y corresponde al por ciento o la

proporcioacuten de puntuaciones que se encuentran en el intervalo dado

Propiedades de las distribuciones normales

a Son simeacutetricas y tienen forma de campana

b Al ser simeacutetricas la media la moda y la mediana coinciden

c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea

de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media

d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la

curva se encuentra a tres desviaciones estaacutendar de la media

En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral

de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de

diferentes secciones de la curva o se utiliza la computadora para calcular ese valor

del aacuterea

La distribucioacuten normal estandarizada

Puesto que hay un nuacutemero infinito de combinaciones para los dos

paraacutemetros hay un nuacutemero infinito de curvas normales diferentes

Este problema se ha resuelto praacutecticamente al transformar los valores de

todas las distribuciones normales a los valores de una distribucioacuten normal

estandarizada representada por la curva normal estandarizada (standard normal

curve)

Las puntuaciones estandarizadas se logran restando la media a cada

observacioacuten y dividiendo entre la desviacioacuten estaacutendar

donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar

Propiedades de la distribucioacuten normal estandarizada

μ z = 0

σ z = 1

En muchas ocasiones se quieren comparar puntuaciones que pertenecen a

dos distribuciones normales diferentes La diferencia entre las dos distribuciones

radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo

la comparacioacuten se hace posible si se convierten las puntuaciones de ambas

distribuciones a puntuaciones z que corresponden a la distribucioacuten normal

estandarizada

Percentiles y rangos percentiles de una distribucioacuten normal estandarizada

Si se desea hallar la percentiles o el rango percentil en una distribucioacuten

normal no estandarizada se recurre al procedimiento de convertir las puntuaciones

de la distribucioacuten normal dada a puntuaciones z que corresponden a la

distribucioacuten normal estandarizada

Estos valores en la distribucioacuten normal estandarizada se pueden obtener

por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en

las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el

intervalo dado

Es necesario visualizar siempre el aacuterea debajo de la curva como el por

ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo

dado

Cuando una distribucioacuten de puntuaciones es normal estandarizada la

pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar

en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o

cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten

dada

DISTRIBUCIOacuteN GAMMA

Una variable aleatoria X asociada a un experimento aleatorio tiene una

distribucioacuten GAMMA si se caracteriza por las siguientes propiedades

Algunas alternativas de funciones de densidad se pueden ver en la graacutefica

del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)

respectivamente =1

=1

La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo

III

El modelo Gamma se ha utilizado frecuentemente en variables tales como

ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el

intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson

ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900

ndash Flujos maacuteximos MARKOVIC 1965

ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965

ndash Altura de la precipitacioacuten mensual WHITCOMB 1940

ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia

infin

ndash Ingresos familiares

ndash Edad del hombre al contraer matrimonio por primera vez

ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en

subestaciones a una frecuencia part

Ejemplo

Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos

de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia

promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo

de tiempo se encuentre hasta que ocurre el segundo ciclo

a Dentro de una desviacioacuten con respecto del tiempo promedio

b A maacutes de dos desviaciones por encima de la media

Solucioacuten

X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en

horas

Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)

= 2

Y Nuacutemero de ciclos hora ---------Y~P( =002)

E(Y) = 002 =

X ~ G(2 002)

Ejemplo

En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de

kilovatios por hora puede considerarse como una variable aleatoria con

distribucioacuten GAMMA de paraacutemetros = 3 y

= 05

La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de

KWhora

iquestCuaacutel es la probabilidad de que este abastecimientos sea

a Insuficiente en un diacutea cualquiera

b Se consuman entre 3 y 8 millones de K WHora

c c Encuentre E(x) y V(x)

SOLUCIOacuteN

DISTRIBUCIOacuteN PARETO

En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad

continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores

es

Su funcioacuten de distribucioacuten es

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto

son

El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (

DISTRIBUCIOacuteN T DE STUDENT

Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una

distribucioacuten t con n grados de libertad

Cuando n--gtinfinito a curva t coincide com la normal estandarizada

FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX

MOMENTOS

La distribucioacuten -Student se construye como un cociente entre una normal

y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-

Student con n grados de libertad a la de una va T

donde Este tipo de distribuciones aparece cuando

tenemos n+1 va independientes

y nos interesa la distribucioacuten de

La funcioacuten de densidad de es

Figura Funcioacuten de densidad de una de Student

La distribucioacuten de Student tiene propiedades parecidas a

Es de media cero y simeacutetrica con respecto a la misma

Es algo maacutes dispersa que la normal pero la varianza decrece hasta

1 cuando el nuacutemero de grados de libertad aumenta

Figura Comparacioacuten entre las funciones de densidad de y

Para un nuacutemero alto de grados de libertad se puede aproximar la

distribucioacuten de Student por la normal es decir

Figura Cuando aumentan los grados de libertad la distribucioacuten de

Student se aproxima a la distribucioacuten normal tipificada

Para calcular

DISTRIBUCIOacuteN BETA

Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede

representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un

intervalo de longitud finita Tales como

Proporcioacuten de impurezas en un producto quiacutemico

La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten

La proporcioacuten vendida de un lote durante un tiempo t

La humedad relativa medida en cierto lugar

Porcentaje del costo total destinado a reparacioacuten de maquinaria

Porcentaje de costo adicional destinado a reparacioacuten de maquinaria

La distribucioacuten del tiempo necesario para completar una fase del proyecto

PERT

Evaluacioacuten de programas y teacutecnicas de revisioacuten

Ejemplo

La proporcioacuten de tramos de una autopista que requieren repararse

semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros

= 3 y =2

a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten

b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista

requieren reparacioacuten en un antildeo cualquiera

DISTRIBUCIOacuteN CAUCHY

En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de

Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es

donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene

valor esperado ni varianza

Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V

2 lt 1 el

numero U V tiene la distribucioacuten Cauchy

La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un

grado de libertad

Ejemplo

Sean y dos observaciones independientes de una distribucioacuten

Cauchy con funcioacuten de densidad

Puede demostrarse que si y son tales que entonces la

funcioacuten de verosimilitud de es bimodal

Sean y Supongamos que se desea hacer inferencias sobre el

valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa

Especiacuteficamente interesa encontrar la distribucioacuten final de

Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la

distribucioacuten final de tiene una forma complicada Es conveniente notar sin

embargo que corresponde a la densidad marginal de respecto a la

densidad conjunta

DISTRIBUCIOacuteN BERNOULLI

Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto

suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el

que no lo sea (fracaso) En realidad no se trata maacutes que de una variable

dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello

que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas

obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la

situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este

experimento mediante una va discreta Xque toma los valores X=0 si el suceso no

ocurre y X=1 en caso contrario y que se denota

Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar

una moneda al aire y considerar la va

Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de

probabilidad es

y su funcioacuten de distribucioacuten

Su funcioacuten caracteriacutestica es

Los principales momentos de la X los podemos calcular directamente

o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina

Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)

cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de

intentos

CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE

BERNOULLI

Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la

probabilidad y asegurar que se cumplen las tres condiciones necesarias en

particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del

resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3

requiere que los ensayos o intentos de un proceso de Bernoulli sean

estadiacutesticamente independientes es decir que el resultado de un intento no puede

afectar de ninguacuten modo el resultado de cualquier otro intento

DISTRIBUCIOacuteN EXPONENCIAL

Modelo para variable aleatoria continua que permite representar variables

del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos

Componentes

En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de

probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para

valores x gt 0 es

f(x) = λe - λx

Su funcioacuten de distribucioacuten es

Aqui e significa el nuacutemero e

El valor esperado y la varianza de una variable aleatoria X con

distribucioacuten exponencial son

E[X] = 1 λ

V(X) = 1 λ2

Ejemplo

Ejemplos para la distribucioacuten exponencial son los tiempos dentro

accidentes con probabilidad invariable

La funcioacuten de densidad para λ igual 05 10 y 15

DISTRIBUCIOacuteN MULTINOMIAL

La distribucioacuten multinomial es similar a la distribucioacuten binomial con la

diferencia de que en lugar de dos posibles resultados en cada ensayo

La distribucioacuten multinomial sigue el siguiente modelo

Donde

X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo

que el partido POPO lo hayan votado 3 personas)

n indica el nuacutemero de veces que se ha repetido el suceso (en el

ejemplo 5 veces)

n es factorial de n (en el ejemplo 5 4 3 2 1)

p1 es la probabilidad del suceso X1 (en el ejemplo el 40)

Veamos el ejemplo

Luego

P = 00256

Es decir que la probabilidad de que las 5 personas elegidas hayan votado

de esta manera es tan soacutelo del 256

Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1

Veamos otro ejemplo

En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el

40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4

invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos

Aplicamos el modelo

LuegoP = 00384

Por lo tanto la probabilidad de que el grupo esteacute formado por personas de

estos paiacuteses es tan soacutelo del 384

DISTRIBUCIOacuteN UNIFORME

En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de

probabilidad cuyos valores tienen la misma probabilidad

Caso discreto

Su funcioacuten de probabilidad es en el caso discreto con valores posibles

p(xi) = 1 n

Su funcioacuten de distribucioacuten es en el caso discreto

Su media estadiacutestica es

Caso continuo

Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b

La funcioacuten de densidad en el caso continuo entre a y b es

Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12

Ejemplos

Para un dado perfecto todos los resultados tienen la misma probabilidad 1

6

Calcular variables aleatorias

Las variables aleatorias de probabilidad uniforme pueden calcularse con un

generador de variables aleatorias

DISTRIBUCIOacuteN BINOMIAL

En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad

discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con

probabilidad p de un eacutexito

Su funcioacuten de densidad es

Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)

posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos

((1 - p)n - x

)

El valor esperado de una variable aleatoria de probabilidad binominal es

E[x] = np y su varianza V[x] = np(1 - p)

DISTRIBUCIOacuteN BINOMIAL NEGATIVA

Sobre una sucesioacuten de va de Bernouilli independientes

Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r

eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de

distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo

Su ley de probabilidad se deduce siguiendo el esquema

De nuevo el conjunto de posibles valores de esta va discreta es

Su funcioacuten caracteriacutestica es

y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima

Ejemplo

Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en

operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal

que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda

definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para

intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus

5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones

que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se

necesiten 10 intervenciones

Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por

una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan

4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso

Identificando los paraacutemetros se tiene

Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el

nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy

simple

Y=X+r

Luego

Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente

es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de

que X=10-4=6 Por tanto

La distribucioacuten binomial negativa tambieacuten se puede definir como el

nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas

contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que

DISTRIBUCIOacuteN DE POISSON

Modelo para variable aleatoria discreta que permite calcular la

probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten

discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo

muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos

o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual

a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es

independiente de cuaacutendo se presenta dicho periacuteodo

En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de

probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos

es

Aquiacute e significa el nuacutemero e y x significa el factorial de x

La distribucion de Poisson describe el nuacutemero de sucesos en una unidad

de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un

proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens

en una carrera

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten

Poisson son

E[X] = V[X] = λ

La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos

entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un

conmutador la demanda (necesidades) de los pacientes que requieren servicio en

una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el

nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos

ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una

variable aleatoria discreta que toma valores enteros (0 1 2)

Caacutelculo de la probabilidad de Poisson

La letra X por lo general representa a una variable discreta y puede tomar

valores enteros Utilizamos la letra X para representar a la variable aleatoria y la

letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La

probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson

se calcula con la foacutermula

LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA

DISTRIBUCIOacuteN BINOMIAL

La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la

binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan

cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es

grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan

con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena

aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es

igual o menor que 005 En los casos en que se cumplen estas condiciones

podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media

de la distribucioacuten de Poisson

DISTRIBUCIOacuteN GEOMEacuteTRICA

En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten

probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores

discretos es

P(X = x) = p(1 - p)x - 1

Su funcioacuten de distribucioacuten es

El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media

estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2

Ejemplo

El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es

una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6

DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA

En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de

probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de

masa para valores es

Aqui (a sobre b) es el coeficiente binomial

El valor esperado de una variable aleatoria X de distribucioacuten

hipergeomeacutetrica es

Y su varianza

DISTRIBUCIOacuteN ZETA

En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad

discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos

es

Aqui ζ(s) es la funcioacuten zeta de Rieman con

El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto

DISTRIBUCION CHI CUADRADO

El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una

comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es

diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con

ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno

es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario

estas dos frecuencias acusan una diferencia significativa para por ejemplo un

nivel de significacioacuten del 5

El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la

asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada

por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito

bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor

del famoso libro Statistical Methods for Research Workers (1925) donde se

marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con

Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde

estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y

el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las

pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba

exacta de Fisher

Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico

publicitario presentado a grupos de clientes comparar la rentabilidad de un

proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos

de los turistas por determinados espacios geograacuteficos o por determinados

servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las

frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las

frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o

tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o

de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2

x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos

turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han

ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han

tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula

que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido

en los sitios A y B

Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es

independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo

A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces

alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este

anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos

empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de

las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51

La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten

igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es

2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del

Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del

5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206

podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para

suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B

Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias

observadas empiacutericamente de dos muestras con las frecuencias esperadas o

teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el

Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de

las materias primas perecederas Los resultados son seguacuten atributos cualitativos

los siguientes Primero veremos las frecuencias empiacutericas u observadas

Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten

Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son

131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas

Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y

fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres

columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta

maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x

120 260 = 6046 b2 = 129 x 120 260 = 5954

Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten

igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de

2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de

libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La

diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna

conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten

Es una medida de la discrepancia existente entre las frecuencias

observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso

de frecuencias () debido a que permite determinar las desviaciones entre ellas

ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la

expresioacuten

E

EOX

2

2

Donde

O frecuencia observada

E frecuencia teoacuterica esperada

TEST DE CHI-CUADRADO DE CONTINGENCIA

Un caso particular del test de chi-cuadrado que permite hacer un test sobre

la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-

cuadrado de contingencia Los dos caracteres observados en una misma

poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases

de se denotan las de por Tambieacuten vamos a

denotar

el efectivo conjunto de y es el nuacutemero de individuos para los

cuales toma el valor e el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

Estos valores se representan en una tabla de doble entrada conocida como

tabla de contingencia

Cada fila y cada columna corresponden a una submuestra particular La

fila de iacutendice es la distribucioacuten en las clases de los individuos para

los cuales el caraacutecter toma el valor La columna de iacutendice es la

distribucioacuten en las clases de los individuos para los cuales el caraacutecter

toma el valor Dividiendo las filas y las columnas por su suma se obtienen

frecuencias condicionales para cada una de las distribuciones empiacutericas Para

y las denotaremos por

y

Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y

los perfiles columna Para el modelo probabilista las observaciones provienen de

una muestra

de una ley bidimensional La hipoacutetesis a comprobar

es que los dos marginales de esta ley son independientes Si este es el caso los

perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna

de la de

y

Es equivalente a decir que las frecuencias conjuntas deben estar cerca de

los productos de las frecuencias marginales

Las frecuencias conjuntas por un lado (distribucioacuten observada) y los

productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen

dos distribuciones de probabilidad sobre el conjunto producto

Podemos por tanto calcular la distancia de

chi-cuadrado de una con respecto a la otra

Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la

distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale

Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la

definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado

Por lo dicho anteriormente para suficientemente grande podemos

aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el

nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados

a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las

que han sido estimadas Hay para el caraacutecter y para el caraacutecter

(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley

chi-cuadrado seraacute por tanto

Vamos a presentar un ejemplo de dos caracteres binarios que tienen que

ver con enfermos para los cuales se ha observado si tienen o no una tendencia al

suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y

neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las

tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla

de contingencia observada es

Tendencia Sin tendencia Total

Psicosis 20 180 200

Nneurosis 60 140 200

Total 80 320 400

La distancia de chi-cuadrado de contingencia calculada a partir de esta

tabla es de El valor tomado por el estadiacutegrafo es el cual

debemos comparar con la ley El p-valor es de

Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre

la tendencia al suicidio y la clasificacioacuten de las enfermedades

El test no precisa el sentido de esta dependencia Para describirla hay que

comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre

los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten

PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS

Los investigadores se interesan constantemente en las diferencias entre dos

poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado

civil profesioacuten color de ojos preferencia por una marca etc)

Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de

contingenciardquo

Se puede realizar una prueba para la diferencia entre dos proporciones

sobre la base de muestras independientes usaacutendose como instrumento la prueba

de chi cuadrado

El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es

la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se

podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda

Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la

ecuacioacuten

n

nnE CR

donde

nR nuacutemero total en el rengloacuten

nC nuacutemero total en la columna

n tamantildeo total de la muestra

El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado

entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia

al cuadrado se divide entre la frecuencia esperada de la celda

La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se

rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el

valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados

de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el

tamantildeo de la muestra

CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD

Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a

las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se

puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la

distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado

siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal

Por consiguiente al probar la diferencia entre las dos proporciones la

distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes

Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia

direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten

normal

La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede

ilustrar mediante el siguiente ejemplo

Cuartos de bantildeos modernos

Cocina moderna Caren

cia

existenc

ia

totales

Carencia 72 8 80

Existencia 7 146 153

La hipoacutetesis nula y alternativa seriacutean

YN ppH 0

YN ppH 0

Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de

significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute

Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H

A partir de la informacioacuten del cuadro

10080

8

N

NSN

n

Xp 95420

153

146

Y

YSY

n

Xp

A partir de la expresioacuten

21

21

111

nnpp

pPZ SS

donde

661015380

1468

p

por lo tanto

0813

153

1

80

133906610

95420100

Z

Totales 79 154 223

Dado que 1960813 Z se rechaza la 0H por lo tanto hay

diferencia entre las dos proporciones

Usando la prueba de chi cuadrado y la tabla de contingencia de este

ejemplo se tiene

Las frecuencias teoacutericas se pueden obtener a partir de la siguiente

ecuacioacuten

n

nnE CR

Por lo tanto se tiene

1227233

7980E 8852

233

15480E

8851233

79153E 12101

233

154153E

Chi cuadrado se obtiene a partir de la expresioacuten

E

EOX

2

2

A partir de la tabla se tiene

O E (O ndash E) (O ndash E)2

(O ndash E)2E

7

2

2

712

+4488 20142144 742704

7 5

188

- 4488 20142144 388245

8 5 -4488 20142144 380903

288

1

46

1

0112

+4488 20142144 199191

1711043

10431712 CALCULADOX

Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el

84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo

tanto hay diferencia entre las dos proporciones

Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la

distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos

distribuciones que a un nivel de significancia de 005 el valor de 196 es el

cuadrado de 3 841 es decir 22 ZX

CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA

La afirmacioacuten de que no existen diferencias entre proporciones significa

que las dos variables son independientes Cuando las conclusiones se presentan en

esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo

Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que

no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la

hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos

variables Independientemente de que la prueba de chi cuadrado se considera una

prueba de diferencia entre dos proporciones o una prueba de independencia los

caacutelculos y resultados son exactamente los mismos

CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE

Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o

intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que

ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de

probabilidades

Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que

seguir varios pasos Primero se tiene que establecer la distribucioacuten de

probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada

paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la

media) se deben establecer mediante hipoacutetesis o estimarlos con base a la

informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para

determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o

intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado

para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la

informacioacuten

BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON

La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de

Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la

cantidad de automoacuteviles estacionados en una cochera cubierta siguen una

distribucioacuten de Poisson 0H

En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero

de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una

muestra aleatoria de 233 casas

Numero de automoacuteviles Frecuencia

0 61

1 151

2 21

233

Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados

de la distribucioacuten de frecuencia

No de automoacuteviles Frecuencia observada On

0 61 0

1 151 151

2 21 42

233 193

808280233

193

1

n

On

X

n

i por lo tanto 80X

El valor de la media muestral se utilizara como el estimado de X

Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)

y se obtiene la frecuencia teoacuterica para cada una

Automoacutevil

n

Frecuencia

O

Probabilidad

XP

Frecuencia (E)

XPn

0 61 04493 104687

1 151 03595 87764

2 21 01438 33505

Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de

significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX

El valor calculado de chi cuadrado es

50679

2

2

K

CALCULADO

E

EOX

Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de

automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una

distribucioacuten de Poisson

CORRECCIOacuteN DE YATES

Cuando se aplican a datos discretos los resultados para distribuciones

continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres

comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de

Yates la cual viene dada mediante la expresioacuten

E

EOX CALCULADO

502

2

En general la correccioacuten se hace solamente cuando el numero de grados

de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos

resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en

relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia

esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi

cuadrado corregido y no corregido Si ambos valores conducen a la misma

conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se

presentan dificultades Si conducen a conclusiones diferentes se puede o bien

incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear

meacutetodos de probabilidad exactos

El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente

ejemplo

En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces

Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de

significancia del 005

No de caras Frecuencia Probabilidad Frecuencia (E)

Cara 115 05 100

cruce 85 05 100

2054

100

0510085

100

0510011522

2

CALCULADOX

Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado

con correccioacuten de Yates es

8432 TABULADOX

Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha

PRUEBA EXACTA DE FISHER

Para examinar la igualdad de las varianzas de dos poblaciones

independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de

las varianzas de las dos muestras Suponiendo que la informacioacuten de cada

poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2

2

2

1 SS sigue una

distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso

estadiacutestico RA Fisher

Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de

grados de libertad los grados de libertad en el numerador y en el denominador

la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea

2

2

2

111 21

S

SF nn

donde

n1 = tamantildeo de muestra en el grupo 1

n2 = tamantildeo de muestra en el grupo 2

n1 ndash 1 = grados de libertad en el grupo 1

n2 ndash 1 = grados de libertad en el grupo 2

2

1S varianza de la muestra en el grupo 1

2

2S varianza de la muestra en el grupo 2

Al probar la igualdad de dos varianzas se pueden emplear pruebas de una

cola o de dos colas

El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente

ejemplo

Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas

alta en la planta A que en la planta B Para determinar la variabilidad se puede

establecer una prueba de una cola en la forma siguiente

22 BAOH

22

1 BAH

Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta

A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta

ubicada en la cola superior de la distribucioacuten

Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de

libertad en el numerador y 19 en el denominador a un nivel de significancia de

001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene

71162 AS y 20142 BS por lo tanto

38512014

71162

2

1924 F como 1385 lt

292 no se rechaza la hipoacutetesis nula ( OH )

CONCLUSIOacuteN

La conclusioacuten que los resultados de una medida variable es la causa de

variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten

estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero

no puede reclamar legitimidad

La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en

describir la distribucioacuten de las variables estudiadas y en particular de los datos

numeacutericos Ademaacutes de las medidas descriptivas correspondientes el

comportamiento de estas variables puede explorarse graacuteficamente de un modo

muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro

organizador de las ciencias computarizadas y el modelo que nos dota de un

mejor razonamiento para implementar programas eficientes En este sentido la

combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un

reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en

colegios y universidades

Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de

combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y

evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras

loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre

operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten

juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la

teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones

simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades

que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea

BIBLIOGRAFIacuteA

AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis

Third Edition Texts in Statistical Science Chapman and Hall

BOXG E P HUNTER W G HUNTER JS (1978) Statistics for

Experimenters John Wiley amp Sons

BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores

Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de

Modelos Ed Revertsbquo SA

Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed

Piraacutemide

Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten

(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica

Matemaacutetica I Universidad de Antioquia

Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma

Madrid

Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill

Meacutexico

Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten

yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico

Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw

ndashHill 4ta Edicioacuten Colombia

CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana

Meacutexico

COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas

COX DR (1958) Planning of experiments New York John Wiley amp Sons

DANIEL C Applications of Statistics to Industrial Experimentation Willey

DAVIES OL The Design and Analysis of Industrial Experiments Hafner

(McMillan)

DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias

Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico

SA de CV Meacutexico

De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H

(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico

Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta

Estadiacutestica Editorial Microsoft corporation USA

ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial

Limusa SA Meacutexico

EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis

Arnold

FEDERER W (1965) Experimental design Oxford Publ Co

GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la

Varianza Grupo Editorial Universitario

FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico

McGraw Hill

FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque

ModernoEditorial SA Meacutexico

George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y

Meacutetodosrdquo Ed McGraw-Hill

GILL JL (1978) Design and Analysis of Experiments in the Animal and

Medical Sciences Iowa State University Press

JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression

and Experimental Design Springer-Verlag

Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor

Caracas

GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining

Institute

GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data

Mining Institute

Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial

Bourgeoacuten Caracas

Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la

EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute

Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial

BourgeoacutenCA Caracas ndash Venezuela

HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis

Multivariante 5ordf Edicioacuten Prentice Hall

JOBSON JD (1992) Applied Multivariate Data Analysis Volume II

Categorical and Multivariate Methods Springer-Verlag

KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial

Hispanoamericana Meacutexico

KIRK RE Experimental Design Procedures for the Behavioral Sciencies

BrooksCole Publishing Company

LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e

inferencia Estadiacutestica Editorial Limusa Meacutexico

LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV

Grupo Noriega Editores Meacutexico

LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial

HARLA Meacutexico

LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta

edicioacuten Editorial McGaw-Hill Usa

Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial

Hispanoameacuterica VI edicioacuten Meacutexico

LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire

Multidimensionnelle 3ordf Edition DUNOD

LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e

Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB

Caracas- Venezuela

LORENZEN T J Anderson V L (1993) Design of experiments A No-Name

Approach Marcel Dekker Inc

Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc

(1999) SPSS 90 Manual de Usuario SPSS Chicago

MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis

Academic Press

Enfocados hacia SPSS

Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de

wwwspssparatodoscom 2005

MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten

Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla

Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea

Ediciones Alfaomega SAN Meacutexico

MASON RL Statistical Design and Analysis of Experiments with Applications

to Engineering and Science John Wiley amp Sons New York

MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y

Economiacutea Editorial Iberoamericana Meacutexico

MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in

agriculture and experimental biology Second edition Chapman amp Hall

MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo

Editorial Iberoameacuterica

MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers

John Wiley amp Sons

Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial

Reverte Mejicana Meacutexico

Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da

Edicioacuten Meacutexico

Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc

Graw Hill

PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones

Editorial Limusa Meacutexico

NETER J et al Applied Linear Statistical Models Regression Analysis of

Variance and Experimental Designs Library of Congress Cataloging Publication

Data

OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp

RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo

Editorial Universitario

PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos

Lineales y Series Temporales Vol 1 y 2 Alianza Editorial

Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores

Spain SA Espantildea 2005

PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial

Mir Moscuacute

RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed

McGraw-Hill

Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca

UCV Caracas ndash Venezuela

RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE

Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en

Psicologiacuteardquo p 1

SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons

Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti

Caracas ndash Venezuela

Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores

deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico

Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica

Editorial Harla Meacutexico

STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y

procedimientos Segunda edicioacuten McGraw Hill

SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas

Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1

Ediciones UNESR Caracas

URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante

Coartiacuteculo Plan Nuevo Editorial AC

VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II

Anaacutelisis Multivariante) Mc-Graw Hill

Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows

Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea

2002

WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros

Editorial Interamericana Meacutexico

Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8

Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage

Learning Editores p 364 ISBN 9706861947

Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea

Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea

Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de

CV Meacutexico

Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para

Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico

DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR

httpesmwikipediaorgwikiSPSS

httpwwwbuenastareascomensayosque-es-el-SPSS1465478html

httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-

del-software-estadistico-integral-spss-base-160

httpesanswersyahoocomquestionindexqid=20070727073908aatuamw

httpwwwslidesharenetleticiagpestructura-de-spss-3126476

httpwwwehowenespanolcomprograma-spss-sobre_48697

httpwwwugres~bioestmedicinamanual_spsspdf

httpwwwmonografiascomtrabajos12tutortutorshtml

httpwwwspsscom

wwwspssparatodoscom

httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html

httpwwwspssfreecomcapitulotreshtml

httpwwwuvesRELIEVEemail relieveuves

httpwwwscribdcomdochellipspss-introduccioacuten

httpeswikipediaorgwikiSPSS

httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd

f

httpwwwspsscomaressuccessargentinashtml

httpeswikipediaorgwikiSPSS

httpwww-01ibmcomsoftwareesanalyticsspss

httppsicofcepurvesspssindex0htm

httpssitesgooglecomsiteestadisticaconelspss

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpe-stadisticabioucmesweb_spssindice_spsshtml

httpwwwquimicaurvesquimiogeneralanovacastpdf

httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da

tosyMultivariable14anova1_SPSSpdf

httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800

20AnE1lisis20de20Varianzaspdf

httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-

pearson

httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf

httpwwwuoceduin3emathdocsRegresionLinealpdf

httpeswikipediaorgwikiRegresiC3B3n_lineal

httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES

ION_LINEAL_CON_SPSSpdf

httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN

EAL20SIMPLE20CON20SPSSpdf

httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE

SION_LINEAL_CON_SPSSpdf

httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm

httpeswikipediaorgwikiNivel_de_medida

httphtmlrincondelvagocomregresion-lineal-simplehtml

httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp

lepdf

httpwwwvitutorcomestadisticabi8html

httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf

httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-

Martinez_1pdf

httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml

httpesslidesharenetpatolinkecuacin-de-regresin-lineal

httpeswikipediaorgwikiMC3ADnimos_cuadrados

httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios

httpwwwwordreferencecomdefinicioncorrelaciC3B3n

httpwwwditutorcomestadistica_2correlacion_estadisticahtml

httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson

httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n

httpeswikipediaorgwikiMatriz_de_correlaciC3B3n

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpwwwinfecepiunizares

httpwwwltbioestadisticaumaes

httpwwwuaqmxmatematicasestadisticasxu3html

httpwwwmembers-americastripodcom

httpwwwmsiplceorg

httpwwwbnvcocrsesionnotaaspg

httpwwwaltavistacom

httpwwwauyantepuycom

httpwwwinees

httpwwwudeccl

httpwwwrincondelvagocom

httpwwwmonografiascom

httpwwwfestadisticafguamesindicadoresiprihtml

httpwwwuaqmxmatematicasestadisticaxu3html

httpwwwinegoboiwd0801htmlE

httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm

httpwwwitlpedumx

httpwwweclaevespanovestadisticasna93nnsnann7eshtml

httpw3moritesmmx~cmendozamaestestoohtml

httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml

httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion

httpwwwunleduarfaveseiencuestasindexhtml

httpwwwmonografiascomtrabajos11operaoperashtml

httpwwwmonografiascomtrabajos6hisohisoshtml

httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos

httpwwwmonografiascomtrabajos16sistema-operativosistema-

operativoshtmlTIPPOS

httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-

operativoshtml

httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei

httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml

httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-

operativo

httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software

httpwwwsscccoclinformaticaconceptoshtml

httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr

httpwwwcadcommxhistoria_de_la_computacionhtm

httpwwweswikipediaorgwikiBus_(informC3A1tica)

httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla

httpwwwcavsicompreguntasrespuestasque-es-el-teclado

httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm

Page 14: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,

1)( jxP (la suma de probabilidades repartidas entre todos los valores

de la variable debe ser igual a 1)

De la misma manera que calculamos frecuencias acumuladas podemos acumular

probabilidades obteniendo la funcioacuten de distribucioacuten de probabilidades

Esta funcioacuten representa la probabilidad de que la variable aleatoria sea menor o

igual que un determinado valor

F(xj) = P (X lt xj)

Graacuteficamente la funcioacuten aumenta de a saltos ya que entre dos valores

consecutivos de una variable discreta no puede tomar valores intermedios

VARIABLES ALEATORIAS CONTINUAS

En este caso en lugar de trabajar con la probabilidad de valores

particulares de la variable resulta maacutes apropiado calcular probabilidades

asociadas a intervalos Para distribuir propiedades se usa una funcioacuten que mide

concentracioacuten de probabilidades alrededor de un punto que se denomina

funcioacuten de densidad de probabilidad (fdp) y se denota como f(x)

Una funcioacuten de densidad de probabilidad debe cumplir con las siguientes

propiedades

F(x) gt 0 (la funcioacuten es no negativa para cualquier valor de x f(x) no es

una probabilidad y puede valer maacutes de 1)

el aacuterea bajo la curva de la funcioacuten vale 1)

La funcioacuten de distribucioacuten para una variable aleatoria continua se calcula

F(a) = P(X lt

La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula

P (alt x lt b) = F(b) - F(a)

La probabilidad de que la variable tome un valor particular se puede expresar

como

F(c) - F(c) = 0

DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO

Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia

valores de una variable aleatoria con sus respectivas probabilidades es

decir Probabilidad de x = Funcioacuten de x

Las distribuciones se caracterizan por una foacutermula que determina el tipo de

distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio

muestral

En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una

funcioacuten de la probabilidad que representa los resultados que se van obteniendo en

un experimento aleatorio

Asiacute para un nuacutemero dado x la probabilidad es

A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la

variable X y representa la probabilidad de que la variable tome el valor desde

hasta x

Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de

probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad

Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos

y seraacuten mutuamente excluyentes y su suma es el

suceso por lo que tenemos entonces que

y finalmente

Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos

los valores de la variable aleatoria x conoceremos completamente la distribucioacuten

de probabilidad de la variable

Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten

de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente

Es decir la probabilidad de todo el espacio muestral es 1 tal y como

establece la teoriacutea de la probabilidad y por otra parte

Es decir la probabilidad del suceso nulo es cero

Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de

probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes

praacutectico el uso de la funcioacuten de densidad

En el caso de una variable discreta la distribucioacuten puede describirse

mediante una funcioacuten de probabilidad que para cada valor de x de la variable X

determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de

una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de

distribucioacuten la que para cada valor provee la probabilidad de no ser superado

evidentemente el valor de la funcioacuten de distribucioacuten es igual

a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo

inferior del dominio de la variable hasta x inclusive Lista de los resultados de un

experimento con las probabilidades que se esperariacutean ver asociadas con cada

resultado

Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores

diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12

En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica

Para el caso de 1 solo dado donde todos los valores tienen la misma

probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme

Prueba de aleatoriedad

Con frecuencia se supone que los datos recopilados constituyen una

muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la

utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash

Wolfowitz de corridas de una muestra para aleatoriedadrdquo

Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o

la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos

siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la

partida tiene una propiedad en particular o de la cantidad o magnitud en que se

posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la

sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con

distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente

de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que

la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las

partidas que la preceden o las que la suceden en forma tal que la probabilidad de

su ocurrencia varia de una posicioacuten a otra el proceso no se considera como

aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando

esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en

forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico

Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el

tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico

de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una

prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede

rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la

sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de

una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2

exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por

consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis de aleatoriedad

U

UUZ

donde

U = numero total de corridas

U = valor medio de U 12 21

n

nnU

U = desviacioacuten estaacutendar de U 1

222

2121

nn

nnnnnU

n1 = numero de eacutexitos en la muestra

n2 = numero de fracasos en la muestra

n = tamantildeo de la muestra n = n1 + n2

PRUEBA DE McNEMAR

Suele darse el caso en que se desean comparar las proporciones de los

datos de muestras tomados de poblaciones relacionadas En este caso se quisiera

determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a

alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea

determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y

otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede

utilizar la prueba desarrollada por McNemar

El principal intereacutes es determinar si hay diferencia entre las dos

proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta

que el otro (prueba de una cola)

La prueba estadiacutestica para la prueba de McNemar es

CB

CBZ

PRUEBA U DE MANN ndash WHITNEY

Es una alternativa no parametrica a la prueba t de dos muestras para la

diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula

μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos

la forma de distribuciones normales de hecho la prueba solo requiere que las

poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no

importa si se cumple o no esta suposicioacuten

Estadiacutesticos U1 y U2

111

2112

1 W

nnnnU

222

2122

1 W

nnnnU

PRUEBA DE RACHAS

Son todas las diferencias que tiene el mismo signo y se presentan en una

misma fila Una serie de n diferencias puede tener solamente una racha (toda

positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las

rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de

poblaciones con la misma distribucioacuten de frecuencias Colocamos las

observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces

contamos el numero de rachas item de cada una de las muestras Si hay menos

rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales

rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten

La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de

que las observaciones se han sacado aleatoriamente de una sola poblacioacuten

Para hacer esto se halla la mediana de la muestra y se designa las

observaciones situadas por debajo de la mediana por un signo menos (-) y las

observaciones situadas por encima de la mediana por un signo (+) Si el numero

de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado

rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el

numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10

puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la

tabla normal con

u

uu

z

2

1

12

21

21

NN

NNu

)1()(

2(2

21

2

21

2121212

NNNN

NNNNNNu

DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES

DISTRIBUCIONES DE EJEMPLO Y USO

DISTRIBUCIOacuteN NORMAL O GAUSSIANA

Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que

multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal

Esta distribucioacuten de caracteriza porque los valores se distribuyen formando

una campana de Gauss en torno a un valor central que coincide con el valor

medio de la distribucioacuten

Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a

la izquierda

Esta distribucioacuten viene definida por dos paraacutemetros

X N (m S2)

m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro

de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores

estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores

estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de

ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten

estaacutendar

Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina

normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo

que permiten obtener esos mismos valores donde se recoge la probabilidad

acumulada para cada punto de la curva de esta distribucioacuten

Ademaacutes toda distribucioacuten normal se puede transformar en una normal

tipificada

Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con

media 10 y varianza 4 Transformarla en una normal tipificada

X N (10 4)

Para transformarla en una normal tipificada se crea una nueva variable (Y)

que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica

(que es la raiacutez cuadrada de la varianza)

En el ejemplo la nueva variable seriacutea

Esta nueva variable se distribuye como una normal tipificada

permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor

Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos

indicado de que las probabilidades para cada valor de la curva se encuentran

recogidas en una tabla

MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)

La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten

normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta

distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros

y lo que representamos del modo si su funcioacuten de densidad

es

Observacioacuten

Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y

la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes

adelante65

La forma de la funcioacuten de densidad es la llamada campana de Gauss

Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten

normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1

Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un

uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto

con lo cual en coinciden la media la mediana

y la moda y por uacuteltimo calcular sus puntos de inflexioacuten

El soporte de la distribucioacuten es todo de modo que la mayor parte de la

masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se

encuentra concentrado alrededor de la media y las ramas de la curva se extienden

asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la

media es posible (aunque poco probable)

La forma de la campana de Gauss depende de los paraacutemetros y

indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)

Figura Distribuciones gaussianas con diferentes medias e igual

dispersioacuten

(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor

sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor

de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea

``maacutes aplastado seraacute

Figura Distribuciones gaussianas con igual media pero varianza

diferente

La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes

adelante que es

Como consecuencia la distribucioacuten normal es reproductiva con respecto a

los paraacutemetros y ya que

Observacioacuten

Como se ha mencionado anteriormente la ley de probabilidad gaussiana la

encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza

por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el

de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que

apuntar un hecho negativo para esta ley de probabilidad

La funcioacuten no posee primitiva66

conocida67

Las consecuencias desde el punto de vista praacutectico son importantes ya que

eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de

la normal y nos tenemos que limitar a decir que

sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente

esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho

puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto

se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en

problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde

se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie

limitada de valores xi dados Normalmente F se encuentra tabulada para una

distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten

normal tipificada

En el caso de que tengamos una distribucioacuten diferente se

obtiene Z haciendo el siguiente cambio

De manera general se tiene

Proposicioacuten (Cambio de origen y escala)

Sean Entonces

Este resultado puede ser utilizado del siguiente modo Si y nos

interesa calcular

1 Hacemos el cambio y calculamos

2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de

modo aproximado) Como

tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada

Ejemplo

Supongamos que cierto fenoacutemeno pueda ser representado mediante una

va y queremos calcular la probabilidad de que Xtome un valor

entre 39 y 48 es decir

Comenzamos haciendo el cambio de variable

de modo que

Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que

hemos mencionado anteriormente

Proposicioacuten

Sea Entonces

Demostracioacuten

Por ser la normal una ley de probabilidad se tiene que

es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con

respecto a se obtiene el valor 0

luego

Para demostrar la igualdad entre la y basta con aplicar la misma

teacutecnica pero esta vez derivando con respecto a

Luego

Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en

primer lugar la va tipificada de X

y calculamos

Como por la proposicioacuten 5 deducimos que

CURVA NORMAL ESTANDARIZADA

Una variable numeacuterica puede clasificarse como discreta o continua Las

variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas

con la idea de contar Las variables continuas se pueden asociar con la idea de

medir utilizando fracciones y decimales Cuando la variable es continua el

modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal

El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten

normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran

cantidad de variables continuas

El modelo matemaacutetico

La funcioacuten matemaacutetica que se usa como modelo es

e = 271

π = 314

μx = media de la poblacioacuten

σx = desviacioacuten estaacutendar de la poblacioacuten

x = un valor de la variable continua

Como e y π son constantes la forma de la curva normal depende

solamente de los dos parametros de la distribucioacuten normal la media μx y la

desviacioacuten estaacutendar σx

Las diferentes curvas normales van a variar dependiendo de esos dos

paraacutemetros

En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar

visualmente como una curva en forma de campana El aacuterea debajo de esta curva se

halla por medio del integral de la funcioacuten y corresponde al por ciento o la

proporcioacuten de puntuaciones que se encuentran en el intervalo dado

Propiedades de las distribuciones normales

a Son simeacutetricas y tienen forma de campana

b Al ser simeacutetricas la media la moda y la mediana coinciden

c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea

de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media

d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la

curva se encuentra a tres desviaciones estaacutendar de la media

En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral

de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de

diferentes secciones de la curva o se utiliza la computadora para calcular ese valor

del aacuterea

La distribucioacuten normal estandarizada

Puesto que hay un nuacutemero infinito de combinaciones para los dos

paraacutemetros hay un nuacutemero infinito de curvas normales diferentes

Este problema se ha resuelto praacutecticamente al transformar los valores de

todas las distribuciones normales a los valores de una distribucioacuten normal

estandarizada representada por la curva normal estandarizada (standard normal

curve)

Las puntuaciones estandarizadas se logran restando la media a cada

observacioacuten y dividiendo entre la desviacioacuten estaacutendar

donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar

Propiedades de la distribucioacuten normal estandarizada

μ z = 0

σ z = 1

En muchas ocasiones se quieren comparar puntuaciones que pertenecen a

dos distribuciones normales diferentes La diferencia entre las dos distribuciones

radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo

la comparacioacuten se hace posible si se convierten las puntuaciones de ambas

distribuciones a puntuaciones z que corresponden a la distribucioacuten normal

estandarizada

Percentiles y rangos percentiles de una distribucioacuten normal estandarizada

Si se desea hallar la percentiles o el rango percentil en una distribucioacuten

normal no estandarizada se recurre al procedimiento de convertir las puntuaciones

de la distribucioacuten normal dada a puntuaciones z que corresponden a la

distribucioacuten normal estandarizada

Estos valores en la distribucioacuten normal estandarizada se pueden obtener

por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en

las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el

intervalo dado

Es necesario visualizar siempre el aacuterea debajo de la curva como el por

ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo

dado

Cuando una distribucioacuten de puntuaciones es normal estandarizada la

pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar

en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o

cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten

dada

DISTRIBUCIOacuteN GAMMA

Una variable aleatoria X asociada a un experimento aleatorio tiene una

distribucioacuten GAMMA si se caracteriza por las siguientes propiedades

Algunas alternativas de funciones de densidad se pueden ver en la graacutefica

del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)

respectivamente =1

=1

La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo

III

El modelo Gamma se ha utilizado frecuentemente en variables tales como

ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el

intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson

ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900

ndash Flujos maacuteximos MARKOVIC 1965

ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965

ndash Altura de la precipitacioacuten mensual WHITCOMB 1940

ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia

infin

ndash Ingresos familiares

ndash Edad del hombre al contraer matrimonio por primera vez

ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en

subestaciones a una frecuencia part

Ejemplo

Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos

de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia

promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo

de tiempo se encuentre hasta que ocurre el segundo ciclo

a Dentro de una desviacioacuten con respecto del tiempo promedio

b A maacutes de dos desviaciones por encima de la media

Solucioacuten

X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en

horas

Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)

= 2

Y Nuacutemero de ciclos hora ---------Y~P( =002)

E(Y) = 002 =

X ~ G(2 002)

Ejemplo

En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de

kilovatios por hora puede considerarse como una variable aleatoria con

distribucioacuten GAMMA de paraacutemetros = 3 y

= 05

La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de

KWhora

iquestCuaacutel es la probabilidad de que este abastecimientos sea

a Insuficiente en un diacutea cualquiera

b Se consuman entre 3 y 8 millones de K WHora

c c Encuentre E(x) y V(x)

SOLUCIOacuteN

DISTRIBUCIOacuteN PARETO

En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad

continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores

es

Su funcioacuten de distribucioacuten es

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto

son

El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (

DISTRIBUCIOacuteN T DE STUDENT

Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una

distribucioacuten t con n grados de libertad

Cuando n--gtinfinito a curva t coincide com la normal estandarizada

FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX

MOMENTOS

La distribucioacuten -Student se construye como un cociente entre una normal

y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-

Student con n grados de libertad a la de una va T

donde Este tipo de distribuciones aparece cuando

tenemos n+1 va independientes

y nos interesa la distribucioacuten de

La funcioacuten de densidad de es

Figura Funcioacuten de densidad de una de Student

La distribucioacuten de Student tiene propiedades parecidas a

Es de media cero y simeacutetrica con respecto a la misma

Es algo maacutes dispersa que la normal pero la varianza decrece hasta

1 cuando el nuacutemero de grados de libertad aumenta

Figura Comparacioacuten entre las funciones de densidad de y

Para un nuacutemero alto de grados de libertad se puede aproximar la

distribucioacuten de Student por la normal es decir

Figura Cuando aumentan los grados de libertad la distribucioacuten de

Student se aproxima a la distribucioacuten normal tipificada

Para calcular

DISTRIBUCIOacuteN BETA

Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede

representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un

intervalo de longitud finita Tales como

Proporcioacuten de impurezas en un producto quiacutemico

La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten

La proporcioacuten vendida de un lote durante un tiempo t

La humedad relativa medida en cierto lugar

Porcentaje del costo total destinado a reparacioacuten de maquinaria

Porcentaje de costo adicional destinado a reparacioacuten de maquinaria

La distribucioacuten del tiempo necesario para completar una fase del proyecto

PERT

Evaluacioacuten de programas y teacutecnicas de revisioacuten

Ejemplo

La proporcioacuten de tramos de una autopista que requieren repararse

semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros

= 3 y =2

a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten

b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista

requieren reparacioacuten en un antildeo cualquiera

DISTRIBUCIOacuteN CAUCHY

En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de

Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es

donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene

valor esperado ni varianza

Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V

2 lt 1 el

numero U V tiene la distribucioacuten Cauchy

La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un

grado de libertad

Ejemplo

Sean y dos observaciones independientes de una distribucioacuten

Cauchy con funcioacuten de densidad

Puede demostrarse que si y son tales que entonces la

funcioacuten de verosimilitud de es bimodal

Sean y Supongamos que se desea hacer inferencias sobre el

valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa

Especiacuteficamente interesa encontrar la distribucioacuten final de

Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la

distribucioacuten final de tiene una forma complicada Es conveniente notar sin

embargo que corresponde a la densidad marginal de respecto a la

densidad conjunta

DISTRIBUCIOacuteN BERNOULLI

Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto

suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el

que no lo sea (fracaso) En realidad no se trata maacutes que de una variable

dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello

que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas

obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la

situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este

experimento mediante una va discreta Xque toma los valores X=0 si el suceso no

ocurre y X=1 en caso contrario y que se denota

Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar

una moneda al aire y considerar la va

Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de

probabilidad es

y su funcioacuten de distribucioacuten

Su funcioacuten caracteriacutestica es

Los principales momentos de la X los podemos calcular directamente

o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina

Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)

cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de

intentos

CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE

BERNOULLI

Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la

probabilidad y asegurar que se cumplen las tres condiciones necesarias en

particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del

resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3

requiere que los ensayos o intentos de un proceso de Bernoulli sean

estadiacutesticamente independientes es decir que el resultado de un intento no puede

afectar de ninguacuten modo el resultado de cualquier otro intento

DISTRIBUCIOacuteN EXPONENCIAL

Modelo para variable aleatoria continua que permite representar variables

del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos

Componentes

En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de

probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para

valores x gt 0 es

f(x) = λe - λx

Su funcioacuten de distribucioacuten es

Aqui e significa el nuacutemero e

El valor esperado y la varianza de una variable aleatoria X con

distribucioacuten exponencial son

E[X] = 1 λ

V(X) = 1 λ2

Ejemplo

Ejemplos para la distribucioacuten exponencial son los tiempos dentro

accidentes con probabilidad invariable

La funcioacuten de densidad para λ igual 05 10 y 15

DISTRIBUCIOacuteN MULTINOMIAL

La distribucioacuten multinomial es similar a la distribucioacuten binomial con la

diferencia de que en lugar de dos posibles resultados en cada ensayo

La distribucioacuten multinomial sigue el siguiente modelo

Donde

X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo

que el partido POPO lo hayan votado 3 personas)

n indica el nuacutemero de veces que se ha repetido el suceso (en el

ejemplo 5 veces)

n es factorial de n (en el ejemplo 5 4 3 2 1)

p1 es la probabilidad del suceso X1 (en el ejemplo el 40)

Veamos el ejemplo

Luego

P = 00256

Es decir que la probabilidad de que las 5 personas elegidas hayan votado

de esta manera es tan soacutelo del 256

Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1

Veamos otro ejemplo

En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el

40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4

invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos

Aplicamos el modelo

LuegoP = 00384

Por lo tanto la probabilidad de que el grupo esteacute formado por personas de

estos paiacuteses es tan soacutelo del 384

DISTRIBUCIOacuteN UNIFORME

En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de

probabilidad cuyos valores tienen la misma probabilidad

Caso discreto

Su funcioacuten de probabilidad es en el caso discreto con valores posibles

p(xi) = 1 n

Su funcioacuten de distribucioacuten es en el caso discreto

Su media estadiacutestica es

Caso continuo

Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b

La funcioacuten de densidad en el caso continuo entre a y b es

Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12

Ejemplos

Para un dado perfecto todos los resultados tienen la misma probabilidad 1

6

Calcular variables aleatorias

Las variables aleatorias de probabilidad uniforme pueden calcularse con un

generador de variables aleatorias

DISTRIBUCIOacuteN BINOMIAL

En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad

discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con

probabilidad p de un eacutexito

Su funcioacuten de densidad es

Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)

posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos

((1 - p)n - x

)

El valor esperado de una variable aleatoria de probabilidad binominal es

E[x] = np y su varianza V[x] = np(1 - p)

DISTRIBUCIOacuteN BINOMIAL NEGATIVA

Sobre una sucesioacuten de va de Bernouilli independientes

Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r

eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de

distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo

Su ley de probabilidad se deduce siguiendo el esquema

De nuevo el conjunto de posibles valores de esta va discreta es

Su funcioacuten caracteriacutestica es

y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima

Ejemplo

Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en

operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal

que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda

definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para

intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus

5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones

que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se

necesiten 10 intervenciones

Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por

una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan

4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso

Identificando los paraacutemetros se tiene

Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el

nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy

simple

Y=X+r

Luego

Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente

es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de

que X=10-4=6 Por tanto

La distribucioacuten binomial negativa tambieacuten se puede definir como el

nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas

contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que

DISTRIBUCIOacuteN DE POISSON

Modelo para variable aleatoria discreta que permite calcular la

probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten

discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo

muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos

o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual

a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es

independiente de cuaacutendo se presenta dicho periacuteodo

En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de

probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos

es

Aquiacute e significa el nuacutemero e y x significa el factorial de x

La distribucion de Poisson describe el nuacutemero de sucesos en una unidad

de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un

proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens

en una carrera

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten

Poisson son

E[X] = V[X] = λ

La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos

entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un

conmutador la demanda (necesidades) de los pacientes que requieren servicio en

una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el

nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos

ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una

variable aleatoria discreta que toma valores enteros (0 1 2)

Caacutelculo de la probabilidad de Poisson

La letra X por lo general representa a una variable discreta y puede tomar

valores enteros Utilizamos la letra X para representar a la variable aleatoria y la

letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La

probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson

se calcula con la foacutermula

LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA

DISTRIBUCIOacuteN BINOMIAL

La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la

binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan

cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es

grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan

con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena

aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es

igual o menor que 005 En los casos en que se cumplen estas condiciones

podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media

de la distribucioacuten de Poisson

DISTRIBUCIOacuteN GEOMEacuteTRICA

En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten

probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores

discretos es

P(X = x) = p(1 - p)x - 1

Su funcioacuten de distribucioacuten es

El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media

estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2

Ejemplo

El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es

una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6

DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA

En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de

probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de

masa para valores es

Aqui (a sobre b) es el coeficiente binomial

El valor esperado de una variable aleatoria X de distribucioacuten

hipergeomeacutetrica es

Y su varianza

DISTRIBUCIOacuteN ZETA

En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad

discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos

es

Aqui ζ(s) es la funcioacuten zeta de Rieman con

El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto

DISTRIBUCION CHI CUADRADO

El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una

comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es

diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con

ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno

es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario

estas dos frecuencias acusan una diferencia significativa para por ejemplo un

nivel de significacioacuten del 5

El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la

asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada

por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito

bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor

del famoso libro Statistical Methods for Research Workers (1925) donde se

marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con

Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde

estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y

el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las

pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba

exacta de Fisher

Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico

publicitario presentado a grupos de clientes comparar la rentabilidad de un

proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos

de los turistas por determinados espacios geograacuteficos o por determinados

servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las

frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las

frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o

tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o

de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2

x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos

turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han

ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han

tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula

que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido

en los sitios A y B

Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es

independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo

A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces

alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este

anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos

empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de

las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51

La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten

igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es

2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del

Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del

5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206

podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para

suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B

Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias

observadas empiacutericamente de dos muestras con las frecuencias esperadas o

teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el

Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de

las materias primas perecederas Los resultados son seguacuten atributos cualitativos

los siguientes Primero veremos las frecuencias empiacutericas u observadas

Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten

Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son

131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas

Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y

fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres

columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta

maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x

120 260 = 6046 b2 = 129 x 120 260 = 5954

Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten

igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de

2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de

libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La

diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna

conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten

Es una medida de la discrepancia existente entre las frecuencias

observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso

de frecuencias () debido a que permite determinar las desviaciones entre ellas

ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la

expresioacuten

E

EOX

2

2

Donde

O frecuencia observada

E frecuencia teoacuterica esperada

TEST DE CHI-CUADRADO DE CONTINGENCIA

Un caso particular del test de chi-cuadrado que permite hacer un test sobre

la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-

cuadrado de contingencia Los dos caracteres observados en una misma

poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases

de se denotan las de por Tambieacuten vamos a

denotar

el efectivo conjunto de y es el nuacutemero de individuos para los

cuales toma el valor e el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

Estos valores se representan en una tabla de doble entrada conocida como

tabla de contingencia

Cada fila y cada columna corresponden a una submuestra particular La

fila de iacutendice es la distribucioacuten en las clases de los individuos para

los cuales el caraacutecter toma el valor La columna de iacutendice es la

distribucioacuten en las clases de los individuos para los cuales el caraacutecter

toma el valor Dividiendo las filas y las columnas por su suma se obtienen

frecuencias condicionales para cada una de las distribuciones empiacutericas Para

y las denotaremos por

y

Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y

los perfiles columna Para el modelo probabilista las observaciones provienen de

una muestra

de una ley bidimensional La hipoacutetesis a comprobar

es que los dos marginales de esta ley son independientes Si este es el caso los

perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna

de la de

y

Es equivalente a decir que las frecuencias conjuntas deben estar cerca de

los productos de las frecuencias marginales

Las frecuencias conjuntas por un lado (distribucioacuten observada) y los

productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen

dos distribuciones de probabilidad sobre el conjunto producto

Podemos por tanto calcular la distancia de

chi-cuadrado de una con respecto a la otra

Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la

distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale

Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la

definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado

Por lo dicho anteriormente para suficientemente grande podemos

aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el

nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados

a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las

que han sido estimadas Hay para el caraacutecter y para el caraacutecter

(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley

chi-cuadrado seraacute por tanto

Vamos a presentar un ejemplo de dos caracteres binarios que tienen que

ver con enfermos para los cuales se ha observado si tienen o no una tendencia al

suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y

neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las

tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla

de contingencia observada es

Tendencia Sin tendencia Total

Psicosis 20 180 200

Nneurosis 60 140 200

Total 80 320 400

La distancia de chi-cuadrado de contingencia calculada a partir de esta

tabla es de El valor tomado por el estadiacutegrafo es el cual

debemos comparar con la ley El p-valor es de

Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre

la tendencia al suicidio y la clasificacioacuten de las enfermedades

El test no precisa el sentido de esta dependencia Para describirla hay que

comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre

los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten

PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS

Los investigadores se interesan constantemente en las diferencias entre dos

poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado

civil profesioacuten color de ojos preferencia por una marca etc)

Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de

contingenciardquo

Se puede realizar una prueba para la diferencia entre dos proporciones

sobre la base de muestras independientes usaacutendose como instrumento la prueba

de chi cuadrado

El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es

la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se

podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda

Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la

ecuacioacuten

n

nnE CR

donde

nR nuacutemero total en el rengloacuten

nC nuacutemero total en la columna

n tamantildeo total de la muestra

El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado

entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia

al cuadrado se divide entre la frecuencia esperada de la celda

La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se

rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el

valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados

de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el

tamantildeo de la muestra

CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD

Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a

las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se

puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la

distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado

siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal

Por consiguiente al probar la diferencia entre las dos proporciones la

distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes

Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia

direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten

normal

La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede

ilustrar mediante el siguiente ejemplo

Cuartos de bantildeos modernos

Cocina moderna Caren

cia

existenc

ia

totales

Carencia 72 8 80

Existencia 7 146 153

La hipoacutetesis nula y alternativa seriacutean

YN ppH 0

YN ppH 0

Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de

significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute

Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H

A partir de la informacioacuten del cuadro

10080

8

N

NSN

n

Xp 95420

153

146

Y

YSY

n

Xp

A partir de la expresioacuten

21

21

111

nnpp

pPZ SS

donde

661015380

1468

p

por lo tanto

0813

153

1

80

133906610

95420100

Z

Totales 79 154 223

Dado que 1960813 Z se rechaza la 0H por lo tanto hay

diferencia entre las dos proporciones

Usando la prueba de chi cuadrado y la tabla de contingencia de este

ejemplo se tiene

Las frecuencias teoacutericas se pueden obtener a partir de la siguiente

ecuacioacuten

n

nnE CR

Por lo tanto se tiene

1227233

7980E 8852

233

15480E

8851233

79153E 12101

233

154153E

Chi cuadrado se obtiene a partir de la expresioacuten

E

EOX

2

2

A partir de la tabla se tiene

O E (O ndash E) (O ndash E)2

(O ndash E)2E

7

2

2

712

+4488 20142144 742704

7 5

188

- 4488 20142144 388245

8 5 -4488 20142144 380903

288

1

46

1

0112

+4488 20142144 199191

1711043

10431712 CALCULADOX

Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el

84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo

tanto hay diferencia entre las dos proporciones

Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la

distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos

distribuciones que a un nivel de significancia de 005 el valor de 196 es el

cuadrado de 3 841 es decir 22 ZX

CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA

La afirmacioacuten de que no existen diferencias entre proporciones significa

que las dos variables son independientes Cuando las conclusiones se presentan en

esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo

Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que

no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la

hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos

variables Independientemente de que la prueba de chi cuadrado se considera una

prueba de diferencia entre dos proporciones o una prueba de independencia los

caacutelculos y resultados son exactamente los mismos

CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE

Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o

intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que

ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de

probabilidades

Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que

seguir varios pasos Primero se tiene que establecer la distribucioacuten de

probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada

paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la

media) se deben establecer mediante hipoacutetesis o estimarlos con base a la

informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para

determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o

intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado

para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la

informacioacuten

BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON

La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de

Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la

cantidad de automoacuteviles estacionados en una cochera cubierta siguen una

distribucioacuten de Poisson 0H

En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero

de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una

muestra aleatoria de 233 casas

Numero de automoacuteviles Frecuencia

0 61

1 151

2 21

233

Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados

de la distribucioacuten de frecuencia

No de automoacuteviles Frecuencia observada On

0 61 0

1 151 151

2 21 42

233 193

808280233

193

1

n

On

X

n

i por lo tanto 80X

El valor de la media muestral se utilizara como el estimado de X

Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)

y se obtiene la frecuencia teoacuterica para cada una

Automoacutevil

n

Frecuencia

O

Probabilidad

XP

Frecuencia (E)

XPn

0 61 04493 104687

1 151 03595 87764

2 21 01438 33505

Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de

significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX

El valor calculado de chi cuadrado es

50679

2

2

K

CALCULADO

E

EOX

Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de

automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una

distribucioacuten de Poisson

CORRECCIOacuteN DE YATES

Cuando se aplican a datos discretos los resultados para distribuciones

continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres

comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de

Yates la cual viene dada mediante la expresioacuten

E

EOX CALCULADO

502

2

En general la correccioacuten se hace solamente cuando el numero de grados

de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos

resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en

relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia

esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi

cuadrado corregido y no corregido Si ambos valores conducen a la misma

conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se

presentan dificultades Si conducen a conclusiones diferentes se puede o bien

incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear

meacutetodos de probabilidad exactos

El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente

ejemplo

En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces

Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de

significancia del 005

No de caras Frecuencia Probabilidad Frecuencia (E)

Cara 115 05 100

cruce 85 05 100

2054

100

0510085

100

0510011522

2

CALCULADOX

Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado

con correccioacuten de Yates es

8432 TABULADOX

Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha

PRUEBA EXACTA DE FISHER

Para examinar la igualdad de las varianzas de dos poblaciones

independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de

las varianzas de las dos muestras Suponiendo que la informacioacuten de cada

poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2

2

2

1 SS sigue una

distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso

estadiacutestico RA Fisher

Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de

grados de libertad los grados de libertad en el numerador y en el denominador

la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea

2

2

2

111 21

S

SF nn

donde

n1 = tamantildeo de muestra en el grupo 1

n2 = tamantildeo de muestra en el grupo 2

n1 ndash 1 = grados de libertad en el grupo 1

n2 ndash 1 = grados de libertad en el grupo 2

2

1S varianza de la muestra en el grupo 1

2

2S varianza de la muestra en el grupo 2

Al probar la igualdad de dos varianzas se pueden emplear pruebas de una

cola o de dos colas

El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente

ejemplo

Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas

alta en la planta A que en la planta B Para determinar la variabilidad se puede

establecer una prueba de una cola en la forma siguiente

22 BAOH

22

1 BAH

Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta

A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta

ubicada en la cola superior de la distribucioacuten

Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de

libertad en el numerador y 19 en el denominador a un nivel de significancia de

001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene

71162 AS y 20142 BS por lo tanto

38512014

71162

2

1924 F como 1385 lt

292 no se rechaza la hipoacutetesis nula ( OH )

CONCLUSIOacuteN

La conclusioacuten que los resultados de una medida variable es la causa de

variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten

estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero

no puede reclamar legitimidad

La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en

describir la distribucioacuten de las variables estudiadas y en particular de los datos

numeacutericos Ademaacutes de las medidas descriptivas correspondientes el

comportamiento de estas variables puede explorarse graacuteficamente de un modo

muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro

organizador de las ciencias computarizadas y el modelo que nos dota de un

mejor razonamiento para implementar programas eficientes En este sentido la

combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un

reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en

colegios y universidades

Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de

combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y

evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras

loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre

operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten

juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la

teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones

simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades

que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea

BIBLIOGRAFIacuteA

AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis

Third Edition Texts in Statistical Science Chapman and Hall

BOXG E P HUNTER W G HUNTER JS (1978) Statistics for

Experimenters John Wiley amp Sons

BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores

Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de

Modelos Ed Revertsbquo SA

Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed

Piraacutemide

Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten

(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica

Matemaacutetica I Universidad de Antioquia

Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma

Madrid

Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill

Meacutexico

Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten

yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico

Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw

ndashHill 4ta Edicioacuten Colombia

CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana

Meacutexico

COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas

COX DR (1958) Planning of experiments New York John Wiley amp Sons

DANIEL C Applications of Statistics to Industrial Experimentation Willey

DAVIES OL The Design and Analysis of Industrial Experiments Hafner

(McMillan)

DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias

Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico

SA de CV Meacutexico

De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H

(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico

Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta

Estadiacutestica Editorial Microsoft corporation USA

ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial

Limusa SA Meacutexico

EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis

Arnold

FEDERER W (1965) Experimental design Oxford Publ Co

GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la

Varianza Grupo Editorial Universitario

FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico

McGraw Hill

FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque

ModernoEditorial SA Meacutexico

George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y

Meacutetodosrdquo Ed McGraw-Hill

GILL JL (1978) Design and Analysis of Experiments in the Animal and

Medical Sciences Iowa State University Press

JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression

and Experimental Design Springer-Verlag

Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor

Caracas

GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining

Institute

GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data

Mining Institute

Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial

Bourgeoacuten Caracas

Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la

EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute

Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial

BourgeoacutenCA Caracas ndash Venezuela

HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis

Multivariante 5ordf Edicioacuten Prentice Hall

JOBSON JD (1992) Applied Multivariate Data Analysis Volume II

Categorical and Multivariate Methods Springer-Verlag

KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial

Hispanoamericana Meacutexico

KIRK RE Experimental Design Procedures for the Behavioral Sciencies

BrooksCole Publishing Company

LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e

inferencia Estadiacutestica Editorial Limusa Meacutexico

LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV

Grupo Noriega Editores Meacutexico

LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial

HARLA Meacutexico

LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta

edicioacuten Editorial McGaw-Hill Usa

Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial

Hispanoameacuterica VI edicioacuten Meacutexico

LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire

Multidimensionnelle 3ordf Edition DUNOD

LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e

Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB

Caracas- Venezuela

LORENZEN T J Anderson V L (1993) Design of experiments A No-Name

Approach Marcel Dekker Inc

Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc

(1999) SPSS 90 Manual de Usuario SPSS Chicago

MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis

Academic Press

Enfocados hacia SPSS

Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de

wwwspssparatodoscom 2005

MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten

Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla

Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea

Ediciones Alfaomega SAN Meacutexico

MASON RL Statistical Design and Analysis of Experiments with Applications

to Engineering and Science John Wiley amp Sons New York

MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y

Economiacutea Editorial Iberoamericana Meacutexico

MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in

agriculture and experimental biology Second edition Chapman amp Hall

MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo

Editorial Iberoameacuterica

MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers

John Wiley amp Sons

Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial

Reverte Mejicana Meacutexico

Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da

Edicioacuten Meacutexico

Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc

Graw Hill

PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones

Editorial Limusa Meacutexico

NETER J et al Applied Linear Statistical Models Regression Analysis of

Variance and Experimental Designs Library of Congress Cataloging Publication

Data

OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp

RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo

Editorial Universitario

PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos

Lineales y Series Temporales Vol 1 y 2 Alianza Editorial

Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores

Spain SA Espantildea 2005

PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial

Mir Moscuacute

RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed

McGraw-Hill

Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca

UCV Caracas ndash Venezuela

RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE

Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en

Psicologiacuteardquo p 1

SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons

Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti

Caracas ndash Venezuela

Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores

deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico

Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica

Editorial Harla Meacutexico

STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y

procedimientos Segunda edicioacuten McGraw Hill

SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas

Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1

Ediciones UNESR Caracas

URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante

Coartiacuteculo Plan Nuevo Editorial AC

VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II

Anaacutelisis Multivariante) Mc-Graw Hill

Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows

Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea

2002

WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros

Editorial Interamericana Meacutexico

Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8

Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage

Learning Editores p 364 ISBN 9706861947

Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea

Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea

Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de

CV Meacutexico

Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para

Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico

DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR

httpesmwikipediaorgwikiSPSS

httpwwwbuenastareascomensayosque-es-el-SPSS1465478html

httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-

del-software-estadistico-integral-spss-base-160

httpesanswersyahoocomquestionindexqid=20070727073908aatuamw

httpwwwslidesharenetleticiagpestructura-de-spss-3126476

httpwwwehowenespanolcomprograma-spss-sobre_48697

httpwwwugres~bioestmedicinamanual_spsspdf

httpwwwmonografiascomtrabajos12tutortutorshtml

httpwwwspsscom

wwwspssparatodoscom

httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html

httpwwwspssfreecomcapitulotreshtml

httpwwwuvesRELIEVEemail relieveuves

httpwwwscribdcomdochellipspss-introduccioacuten

httpeswikipediaorgwikiSPSS

httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd

f

httpwwwspsscomaressuccessargentinashtml

httpeswikipediaorgwikiSPSS

httpwww-01ibmcomsoftwareesanalyticsspss

httppsicofcepurvesspssindex0htm

httpssitesgooglecomsiteestadisticaconelspss

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpe-stadisticabioucmesweb_spssindice_spsshtml

httpwwwquimicaurvesquimiogeneralanovacastpdf

httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da

tosyMultivariable14anova1_SPSSpdf

httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800

20AnE1lisis20de20Varianzaspdf

httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-

pearson

httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf

httpwwwuoceduin3emathdocsRegresionLinealpdf

httpeswikipediaorgwikiRegresiC3B3n_lineal

httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES

ION_LINEAL_CON_SPSSpdf

httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN

EAL20SIMPLE20CON20SPSSpdf

httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE

SION_LINEAL_CON_SPSSpdf

httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm

httpeswikipediaorgwikiNivel_de_medida

httphtmlrincondelvagocomregresion-lineal-simplehtml

httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp

lepdf

httpwwwvitutorcomestadisticabi8html

httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf

httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-

Martinez_1pdf

httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml

httpesslidesharenetpatolinkecuacin-de-regresin-lineal

httpeswikipediaorgwikiMC3ADnimos_cuadrados

httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios

httpwwwwordreferencecomdefinicioncorrelaciC3B3n

httpwwwditutorcomestadistica_2correlacion_estadisticahtml

httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson

httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n

httpeswikipediaorgwikiMatriz_de_correlaciC3B3n

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpwwwinfecepiunizares

httpwwwltbioestadisticaumaes

httpwwwuaqmxmatematicasestadisticasxu3html

httpwwwmembers-americastripodcom

httpwwwmsiplceorg

httpwwwbnvcocrsesionnotaaspg

httpwwwaltavistacom

httpwwwauyantepuycom

httpwwwinees

httpwwwudeccl

httpwwwrincondelvagocom

httpwwwmonografiascom

httpwwwfestadisticafguamesindicadoresiprihtml

httpwwwuaqmxmatematicasestadisticaxu3html

httpwwwinegoboiwd0801htmlE

httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm

httpwwwitlpedumx

httpwwweclaevespanovestadisticasna93nnsnann7eshtml

httpw3moritesmmx~cmendozamaestestoohtml

httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml

httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion

httpwwwunleduarfaveseiencuestasindexhtml

httpwwwmonografiascomtrabajos11operaoperashtml

httpwwwmonografiascomtrabajos6hisohisoshtml

httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos

httpwwwmonografiascomtrabajos16sistema-operativosistema-

operativoshtmlTIPPOS

httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-

operativoshtml

httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei

httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml

httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-

operativo

httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software

httpwwwsscccoclinformaticaconceptoshtml

httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr

httpwwwcadcommxhistoria_de_la_computacionhtm

httpwwweswikipediaorgwikiBus_(informC3A1tica)

httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla

httpwwwcavsicompreguntasrespuestasque-es-el-teclado

httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm

Page 15: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,

F(a) = P(X lt

La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula

P (alt x lt b) = F(b) - F(a)

La probabilidad de que la variable tome un valor particular se puede expresar

como

F(c) - F(c) = 0

DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO

Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia

valores de una variable aleatoria con sus respectivas probabilidades es

decir Probabilidad de x = Funcioacuten de x

Las distribuciones se caracterizan por una foacutermula que determina el tipo de

distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio

muestral

En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una

funcioacuten de la probabilidad que representa los resultados que se van obteniendo en

un experimento aleatorio

Asiacute para un nuacutemero dado x la probabilidad es

A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la

variable X y representa la probabilidad de que la variable tome el valor desde

hasta x

Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de

probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad

Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos

y seraacuten mutuamente excluyentes y su suma es el

suceso por lo que tenemos entonces que

y finalmente

Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos

los valores de la variable aleatoria x conoceremos completamente la distribucioacuten

de probabilidad de la variable

Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten

de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente

Es decir la probabilidad de todo el espacio muestral es 1 tal y como

establece la teoriacutea de la probabilidad y por otra parte

Es decir la probabilidad del suceso nulo es cero

Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de

probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes

praacutectico el uso de la funcioacuten de densidad

En el caso de una variable discreta la distribucioacuten puede describirse

mediante una funcioacuten de probabilidad que para cada valor de x de la variable X

determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de

una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de

distribucioacuten la que para cada valor provee la probabilidad de no ser superado

evidentemente el valor de la funcioacuten de distribucioacuten es igual

a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo

inferior del dominio de la variable hasta x inclusive Lista de los resultados de un

experimento con las probabilidades que se esperariacutean ver asociadas con cada

resultado

Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores

diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12

En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica

Para el caso de 1 solo dado donde todos los valores tienen la misma

probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme

Prueba de aleatoriedad

Con frecuencia se supone que los datos recopilados constituyen una

muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la

utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash

Wolfowitz de corridas de una muestra para aleatoriedadrdquo

Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o

la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos

siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la

partida tiene una propiedad en particular o de la cantidad o magnitud en que se

posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la

sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con

distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente

de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que

la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las

partidas que la preceden o las que la suceden en forma tal que la probabilidad de

su ocurrencia varia de una posicioacuten a otra el proceso no se considera como

aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando

esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en

forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico

Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el

tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico

de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una

prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede

rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la

sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de

una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2

exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por

consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis de aleatoriedad

U

UUZ

donde

U = numero total de corridas

U = valor medio de U 12 21

n

nnU

U = desviacioacuten estaacutendar de U 1

222

2121

nn

nnnnnU

n1 = numero de eacutexitos en la muestra

n2 = numero de fracasos en la muestra

n = tamantildeo de la muestra n = n1 + n2

PRUEBA DE McNEMAR

Suele darse el caso en que se desean comparar las proporciones de los

datos de muestras tomados de poblaciones relacionadas En este caso se quisiera

determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a

alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea

determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y

otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede

utilizar la prueba desarrollada por McNemar

El principal intereacutes es determinar si hay diferencia entre las dos

proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta

que el otro (prueba de una cola)

La prueba estadiacutestica para la prueba de McNemar es

CB

CBZ

PRUEBA U DE MANN ndash WHITNEY

Es una alternativa no parametrica a la prueba t de dos muestras para la

diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula

μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos

la forma de distribuciones normales de hecho la prueba solo requiere que las

poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no

importa si se cumple o no esta suposicioacuten

Estadiacutesticos U1 y U2

111

2112

1 W

nnnnU

222

2122

1 W

nnnnU

PRUEBA DE RACHAS

Son todas las diferencias que tiene el mismo signo y se presentan en una

misma fila Una serie de n diferencias puede tener solamente una racha (toda

positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las

rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de

poblaciones con la misma distribucioacuten de frecuencias Colocamos las

observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces

contamos el numero de rachas item de cada una de las muestras Si hay menos

rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales

rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten

La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de

que las observaciones se han sacado aleatoriamente de una sola poblacioacuten

Para hacer esto se halla la mediana de la muestra y se designa las

observaciones situadas por debajo de la mediana por un signo menos (-) y las

observaciones situadas por encima de la mediana por un signo (+) Si el numero

de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado

rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el

numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10

puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la

tabla normal con

u

uu

z

2

1

12

21

21

NN

NNu

)1()(

2(2

21

2

21

2121212

NNNN

NNNNNNu

DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES

DISTRIBUCIONES DE EJEMPLO Y USO

DISTRIBUCIOacuteN NORMAL O GAUSSIANA

Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que

multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal

Esta distribucioacuten de caracteriza porque los valores se distribuyen formando

una campana de Gauss en torno a un valor central que coincide con el valor

medio de la distribucioacuten

Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a

la izquierda

Esta distribucioacuten viene definida por dos paraacutemetros

X N (m S2)

m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro

de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores

estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores

estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de

ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten

estaacutendar

Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina

normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo

que permiten obtener esos mismos valores donde se recoge la probabilidad

acumulada para cada punto de la curva de esta distribucioacuten

Ademaacutes toda distribucioacuten normal se puede transformar en una normal

tipificada

Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con

media 10 y varianza 4 Transformarla en una normal tipificada

X N (10 4)

Para transformarla en una normal tipificada se crea una nueva variable (Y)

que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica

(que es la raiacutez cuadrada de la varianza)

En el ejemplo la nueva variable seriacutea

Esta nueva variable se distribuye como una normal tipificada

permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor

Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos

indicado de que las probabilidades para cada valor de la curva se encuentran

recogidas en una tabla

MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)

La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten

normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta

distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros

y lo que representamos del modo si su funcioacuten de densidad

es

Observacioacuten

Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y

la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes

adelante65

La forma de la funcioacuten de densidad es la llamada campana de Gauss

Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten

normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1

Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un

uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto

con lo cual en coinciden la media la mediana

y la moda y por uacuteltimo calcular sus puntos de inflexioacuten

El soporte de la distribucioacuten es todo de modo que la mayor parte de la

masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se

encuentra concentrado alrededor de la media y las ramas de la curva se extienden

asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la

media es posible (aunque poco probable)

La forma de la campana de Gauss depende de los paraacutemetros y

indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)

Figura Distribuciones gaussianas con diferentes medias e igual

dispersioacuten

(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor

sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor

de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea

``maacutes aplastado seraacute

Figura Distribuciones gaussianas con igual media pero varianza

diferente

La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes

adelante que es

Como consecuencia la distribucioacuten normal es reproductiva con respecto a

los paraacutemetros y ya que

Observacioacuten

Como se ha mencionado anteriormente la ley de probabilidad gaussiana la

encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza

por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el

de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que

apuntar un hecho negativo para esta ley de probabilidad

La funcioacuten no posee primitiva66

conocida67

Las consecuencias desde el punto de vista praacutectico son importantes ya que

eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de

la normal y nos tenemos que limitar a decir que

sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente

esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho

puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto

se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en

problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde

se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie

limitada de valores xi dados Normalmente F se encuentra tabulada para una

distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten

normal tipificada

En el caso de que tengamos una distribucioacuten diferente se

obtiene Z haciendo el siguiente cambio

De manera general se tiene

Proposicioacuten (Cambio de origen y escala)

Sean Entonces

Este resultado puede ser utilizado del siguiente modo Si y nos

interesa calcular

1 Hacemos el cambio y calculamos

2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de

modo aproximado) Como

tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada

Ejemplo

Supongamos que cierto fenoacutemeno pueda ser representado mediante una

va y queremos calcular la probabilidad de que Xtome un valor

entre 39 y 48 es decir

Comenzamos haciendo el cambio de variable

de modo que

Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que

hemos mencionado anteriormente

Proposicioacuten

Sea Entonces

Demostracioacuten

Por ser la normal una ley de probabilidad se tiene que

es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con

respecto a se obtiene el valor 0

luego

Para demostrar la igualdad entre la y basta con aplicar la misma

teacutecnica pero esta vez derivando con respecto a

Luego

Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en

primer lugar la va tipificada de X

y calculamos

Como por la proposicioacuten 5 deducimos que

CURVA NORMAL ESTANDARIZADA

Una variable numeacuterica puede clasificarse como discreta o continua Las

variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas

con la idea de contar Las variables continuas se pueden asociar con la idea de

medir utilizando fracciones y decimales Cuando la variable es continua el

modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal

El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten

normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran

cantidad de variables continuas

El modelo matemaacutetico

La funcioacuten matemaacutetica que se usa como modelo es

e = 271

π = 314

μx = media de la poblacioacuten

σx = desviacioacuten estaacutendar de la poblacioacuten

x = un valor de la variable continua

Como e y π son constantes la forma de la curva normal depende

solamente de los dos parametros de la distribucioacuten normal la media μx y la

desviacioacuten estaacutendar σx

Las diferentes curvas normales van a variar dependiendo de esos dos

paraacutemetros

En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar

visualmente como una curva en forma de campana El aacuterea debajo de esta curva se

halla por medio del integral de la funcioacuten y corresponde al por ciento o la

proporcioacuten de puntuaciones que se encuentran en el intervalo dado

Propiedades de las distribuciones normales

a Son simeacutetricas y tienen forma de campana

b Al ser simeacutetricas la media la moda y la mediana coinciden

c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea

de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media

d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la

curva se encuentra a tres desviaciones estaacutendar de la media

En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral

de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de

diferentes secciones de la curva o se utiliza la computadora para calcular ese valor

del aacuterea

La distribucioacuten normal estandarizada

Puesto que hay un nuacutemero infinito de combinaciones para los dos

paraacutemetros hay un nuacutemero infinito de curvas normales diferentes

Este problema se ha resuelto praacutecticamente al transformar los valores de

todas las distribuciones normales a los valores de una distribucioacuten normal

estandarizada representada por la curva normal estandarizada (standard normal

curve)

Las puntuaciones estandarizadas se logran restando la media a cada

observacioacuten y dividiendo entre la desviacioacuten estaacutendar

donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar

Propiedades de la distribucioacuten normal estandarizada

μ z = 0

σ z = 1

En muchas ocasiones se quieren comparar puntuaciones que pertenecen a

dos distribuciones normales diferentes La diferencia entre las dos distribuciones

radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo

la comparacioacuten se hace posible si se convierten las puntuaciones de ambas

distribuciones a puntuaciones z que corresponden a la distribucioacuten normal

estandarizada

Percentiles y rangos percentiles de una distribucioacuten normal estandarizada

Si se desea hallar la percentiles o el rango percentil en una distribucioacuten

normal no estandarizada se recurre al procedimiento de convertir las puntuaciones

de la distribucioacuten normal dada a puntuaciones z que corresponden a la

distribucioacuten normal estandarizada

Estos valores en la distribucioacuten normal estandarizada se pueden obtener

por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en

las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el

intervalo dado

Es necesario visualizar siempre el aacuterea debajo de la curva como el por

ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo

dado

Cuando una distribucioacuten de puntuaciones es normal estandarizada la

pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar

en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o

cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten

dada

DISTRIBUCIOacuteN GAMMA

Una variable aleatoria X asociada a un experimento aleatorio tiene una

distribucioacuten GAMMA si se caracteriza por las siguientes propiedades

Algunas alternativas de funciones de densidad se pueden ver en la graacutefica

del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)

respectivamente =1

=1

La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo

III

El modelo Gamma se ha utilizado frecuentemente en variables tales como

ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el

intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson

ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900

ndash Flujos maacuteximos MARKOVIC 1965

ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965

ndash Altura de la precipitacioacuten mensual WHITCOMB 1940

ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia

infin

ndash Ingresos familiares

ndash Edad del hombre al contraer matrimonio por primera vez

ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en

subestaciones a una frecuencia part

Ejemplo

Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos

de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia

promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo

de tiempo se encuentre hasta que ocurre el segundo ciclo

a Dentro de una desviacioacuten con respecto del tiempo promedio

b A maacutes de dos desviaciones por encima de la media

Solucioacuten

X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en

horas

Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)

= 2

Y Nuacutemero de ciclos hora ---------Y~P( =002)

E(Y) = 002 =

X ~ G(2 002)

Ejemplo

En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de

kilovatios por hora puede considerarse como una variable aleatoria con

distribucioacuten GAMMA de paraacutemetros = 3 y

= 05

La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de

KWhora

iquestCuaacutel es la probabilidad de que este abastecimientos sea

a Insuficiente en un diacutea cualquiera

b Se consuman entre 3 y 8 millones de K WHora

c c Encuentre E(x) y V(x)

SOLUCIOacuteN

DISTRIBUCIOacuteN PARETO

En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad

continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores

es

Su funcioacuten de distribucioacuten es

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto

son

El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (

DISTRIBUCIOacuteN T DE STUDENT

Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una

distribucioacuten t con n grados de libertad

Cuando n--gtinfinito a curva t coincide com la normal estandarizada

FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX

MOMENTOS

La distribucioacuten -Student se construye como un cociente entre una normal

y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-

Student con n grados de libertad a la de una va T

donde Este tipo de distribuciones aparece cuando

tenemos n+1 va independientes

y nos interesa la distribucioacuten de

La funcioacuten de densidad de es

Figura Funcioacuten de densidad de una de Student

La distribucioacuten de Student tiene propiedades parecidas a

Es de media cero y simeacutetrica con respecto a la misma

Es algo maacutes dispersa que la normal pero la varianza decrece hasta

1 cuando el nuacutemero de grados de libertad aumenta

Figura Comparacioacuten entre las funciones de densidad de y

Para un nuacutemero alto de grados de libertad se puede aproximar la

distribucioacuten de Student por la normal es decir

Figura Cuando aumentan los grados de libertad la distribucioacuten de

Student se aproxima a la distribucioacuten normal tipificada

Para calcular

DISTRIBUCIOacuteN BETA

Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede

representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un

intervalo de longitud finita Tales como

Proporcioacuten de impurezas en un producto quiacutemico

La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten

La proporcioacuten vendida de un lote durante un tiempo t

La humedad relativa medida en cierto lugar

Porcentaje del costo total destinado a reparacioacuten de maquinaria

Porcentaje de costo adicional destinado a reparacioacuten de maquinaria

La distribucioacuten del tiempo necesario para completar una fase del proyecto

PERT

Evaluacioacuten de programas y teacutecnicas de revisioacuten

Ejemplo

La proporcioacuten de tramos de una autopista que requieren repararse

semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros

= 3 y =2

a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten

b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista

requieren reparacioacuten en un antildeo cualquiera

DISTRIBUCIOacuteN CAUCHY

En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de

Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es

donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene

valor esperado ni varianza

Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V

2 lt 1 el

numero U V tiene la distribucioacuten Cauchy

La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un

grado de libertad

Ejemplo

Sean y dos observaciones independientes de una distribucioacuten

Cauchy con funcioacuten de densidad

Puede demostrarse que si y son tales que entonces la

funcioacuten de verosimilitud de es bimodal

Sean y Supongamos que se desea hacer inferencias sobre el

valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa

Especiacuteficamente interesa encontrar la distribucioacuten final de

Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la

distribucioacuten final de tiene una forma complicada Es conveniente notar sin

embargo que corresponde a la densidad marginal de respecto a la

densidad conjunta

DISTRIBUCIOacuteN BERNOULLI

Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto

suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el

que no lo sea (fracaso) En realidad no se trata maacutes que de una variable

dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello

que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas

obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la

situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este

experimento mediante una va discreta Xque toma los valores X=0 si el suceso no

ocurre y X=1 en caso contrario y que se denota

Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar

una moneda al aire y considerar la va

Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de

probabilidad es

y su funcioacuten de distribucioacuten

Su funcioacuten caracteriacutestica es

Los principales momentos de la X los podemos calcular directamente

o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina

Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)

cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de

intentos

CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE

BERNOULLI

Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la

probabilidad y asegurar que se cumplen las tres condiciones necesarias en

particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del

resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3

requiere que los ensayos o intentos de un proceso de Bernoulli sean

estadiacutesticamente independientes es decir que el resultado de un intento no puede

afectar de ninguacuten modo el resultado de cualquier otro intento

DISTRIBUCIOacuteN EXPONENCIAL

Modelo para variable aleatoria continua que permite representar variables

del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos

Componentes

En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de

probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para

valores x gt 0 es

f(x) = λe - λx

Su funcioacuten de distribucioacuten es

Aqui e significa el nuacutemero e

El valor esperado y la varianza de una variable aleatoria X con

distribucioacuten exponencial son

E[X] = 1 λ

V(X) = 1 λ2

Ejemplo

Ejemplos para la distribucioacuten exponencial son los tiempos dentro

accidentes con probabilidad invariable

La funcioacuten de densidad para λ igual 05 10 y 15

DISTRIBUCIOacuteN MULTINOMIAL

La distribucioacuten multinomial es similar a la distribucioacuten binomial con la

diferencia de que en lugar de dos posibles resultados en cada ensayo

La distribucioacuten multinomial sigue el siguiente modelo

Donde

X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo

que el partido POPO lo hayan votado 3 personas)

n indica el nuacutemero de veces que se ha repetido el suceso (en el

ejemplo 5 veces)

n es factorial de n (en el ejemplo 5 4 3 2 1)

p1 es la probabilidad del suceso X1 (en el ejemplo el 40)

Veamos el ejemplo

Luego

P = 00256

Es decir que la probabilidad de que las 5 personas elegidas hayan votado

de esta manera es tan soacutelo del 256

Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1

Veamos otro ejemplo

En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el

40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4

invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos

Aplicamos el modelo

LuegoP = 00384

Por lo tanto la probabilidad de que el grupo esteacute formado por personas de

estos paiacuteses es tan soacutelo del 384

DISTRIBUCIOacuteN UNIFORME

En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de

probabilidad cuyos valores tienen la misma probabilidad

Caso discreto

Su funcioacuten de probabilidad es en el caso discreto con valores posibles

p(xi) = 1 n

Su funcioacuten de distribucioacuten es en el caso discreto

Su media estadiacutestica es

Caso continuo

Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b

La funcioacuten de densidad en el caso continuo entre a y b es

Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12

Ejemplos

Para un dado perfecto todos los resultados tienen la misma probabilidad 1

6

Calcular variables aleatorias

Las variables aleatorias de probabilidad uniforme pueden calcularse con un

generador de variables aleatorias

DISTRIBUCIOacuteN BINOMIAL

En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad

discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con

probabilidad p de un eacutexito

Su funcioacuten de densidad es

Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)

posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos

((1 - p)n - x

)

El valor esperado de una variable aleatoria de probabilidad binominal es

E[x] = np y su varianza V[x] = np(1 - p)

DISTRIBUCIOacuteN BINOMIAL NEGATIVA

Sobre una sucesioacuten de va de Bernouilli independientes

Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r

eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de

distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo

Su ley de probabilidad se deduce siguiendo el esquema

De nuevo el conjunto de posibles valores de esta va discreta es

Su funcioacuten caracteriacutestica es

y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima

Ejemplo

Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en

operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal

que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda

definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para

intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus

5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones

que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se

necesiten 10 intervenciones

Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por

una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan

4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso

Identificando los paraacutemetros se tiene

Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el

nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy

simple

Y=X+r

Luego

Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente

es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de

que X=10-4=6 Por tanto

La distribucioacuten binomial negativa tambieacuten se puede definir como el

nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas

contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que

DISTRIBUCIOacuteN DE POISSON

Modelo para variable aleatoria discreta que permite calcular la

probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten

discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo

muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos

o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual

a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es

independiente de cuaacutendo se presenta dicho periacuteodo

En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de

probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos

es

Aquiacute e significa el nuacutemero e y x significa el factorial de x

La distribucion de Poisson describe el nuacutemero de sucesos en una unidad

de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un

proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens

en una carrera

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten

Poisson son

E[X] = V[X] = λ

La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos

entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un

conmutador la demanda (necesidades) de los pacientes que requieren servicio en

una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el

nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos

ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una

variable aleatoria discreta que toma valores enteros (0 1 2)

Caacutelculo de la probabilidad de Poisson

La letra X por lo general representa a una variable discreta y puede tomar

valores enteros Utilizamos la letra X para representar a la variable aleatoria y la

letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La

probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson

se calcula con la foacutermula

LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA

DISTRIBUCIOacuteN BINOMIAL

La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la

binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan

cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es

grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan

con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena

aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es

igual o menor que 005 En los casos en que se cumplen estas condiciones

podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media

de la distribucioacuten de Poisson

DISTRIBUCIOacuteN GEOMEacuteTRICA

En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten

probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores

discretos es

P(X = x) = p(1 - p)x - 1

Su funcioacuten de distribucioacuten es

El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media

estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2

Ejemplo

El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es

una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6

DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA

En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de

probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de

masa para valores es

Aqui (a sobre b) es el coeficiente binomial

El valor esperado de una variable aleatoria X de distribucioacuten

hipergeomeacutetrica es

Y su varianza

DISTRIBUCIOacuteN ZETA

En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad

discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos

es

Aqui ζ(s) es la funcioacuten zeta de Rieman con

El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto

DISTRIBUCION CHI CUADRADO

El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una

comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es

diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con

ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno

es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario

estas dos frecuencias acusan una diferencia significativa para por ejemplo un

nivel de significacioacuten del 5

El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la

asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada

por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito

bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor

del famoso libro Statistical Methods for Research Workers (1925) donde se

marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con

Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde

estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y

el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las

pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba

exacta de Fisher

Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico

publicitario presentado a grupos de clientes comparar la rentabilidad de un

proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos

de los turistas por determinados espacios geograacuteficos o por determinados

servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las

frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las

frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o

tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o

de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2

x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos

turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han

ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han

tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula

que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido

en los sitios A y B

Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es

independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo

A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces

alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este

anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos

empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de

las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51

La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten

igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es

2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del

Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del

5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206

podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para

suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B

Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias

observadas empiacutericamente de dos muestras con las frecuencias esperadas o

teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el

Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de

las materias primas perecederas Los resultados son seguacuten atributos cualitativos

los siguientes Primero veremos las frecuencias empiacutericas u observadas

Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten

Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son

131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas

Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y

fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres

columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta

maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x

120 260 = 6046 b2 = 129 x 120 260 = 5954

Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten

igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de

2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de

libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La

diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna

conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten

Es una medida de la discrepancia existente entre las frecuencias

observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso

de frecuencias () debido a que permite determinar las desviaciones entre ellas

ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la

expresioacuten

E

EOX

2

2

Donde

O frecuencia observada

E frecuencia teoacuterica esperada

TEST DE CHI-CUADRADO DE CONTINGENCIA

Un caso particular del test de chi-cuadrado que permite hacer un test sobre

la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-

cuadrado de contingencia Los dos caracteres observados en una misma

poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases

de se denotan las de por Tambieacuten vamos a

denotar

el efectivo conjunto de y es el nuacutemero de individuos para los

cuales toma el valor e el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

Estos valores se representan en una tabla de doble entrada conocida como

tabla de contingencia

Cada fila y cada columna corresponden a una submuestra particular La

fila de iacutendice es la distribucioacuten en las clases de los individuos para

los cuales el caraacutecter toma el valor La columna de iacutendice es la

distribucioacuten en las clases de los individuos para los cuales el caraacutecter

toma el valor Dividiendo las filas y las columnas por su suma se obtienen

frecuencias condicionales para cada una de las distribuciones empiacutericas Para

y las denotaremos por

y

Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y

los perfiles columna Para el modelo probabilista las observaciones provienen de

una muestra

de una ley bidimensional La hipoacutetesis a comprobar

es que los dos marginales de esta ley son independientes Si este es el caso los

perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna

de la de

y

Es equivalente a decir que las frecuencias conjuntas deben estar cerca de

los productos de las frecuencias marginales

Las frecuencias conjuntas por un lado (distribucioacuten observada) y los

productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen

dos distribuciones de probabilidad sobre el conjunto producto

Podemos por tanto calcular la distancia de

chi-cuadrado de una con respecto a la otra

Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la

distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale

Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la

definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado

Por lo dicho anteriormente para suficientemente grande podemos

aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el

nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados

a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las

que han sido estimadas Hay para el caraacutecter y para el caraacutecter

(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley

chi-cuadrado seraacute por tanto

Vamos a presentar un ejemplo de dos caracteres binarios que tienen que

ver con enfermos para los cuales se ha observado si tienen o no una tendencia al

suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y

neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las

tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla

de contingencia observada es

Tendencia Sin tendencia Total

Psicosis 20 180 200

Nneurosis 60 140 200

Total 80 320 400

La distancia de chi-cuadrado de contingencia calculada a partir de esta

tabla es de El valor tomado por el estadiacutegrafo es el cual

debemos comparar con la ley El p-valor es de

Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre

la tendencia al suicidio y la clasificacioacuten de las enfermedades

El test no precisa el sentido de esta dependencia Para describirla hay que

comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre

los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten

PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS

Los investigadores se interesan constantemente en las diferencias entre dos

poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado

civil profesioacuten color de ojos preferencia por una marca etc)

Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de

contingenciardquo

Se puede realizar una prueba para la diferencia entre dos proporciones

sobre la base de muestras independientes usaacutendose como instrumento la prueba

de chi cuadrado

El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es

la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se

podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda

Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la

ecuacioacuten

n

nnE CR

donde

nR nuacutemero total en el rengloacuten

nC nuacutemero total en la columna

n tamantildeo total de la muestra

El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado

entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia

al cuadrado se divide entre la frecuencia esperada de la celda

La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se

rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el

valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados

de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el

tamantildeo de la muestra

CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD

Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a

las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se

puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la

distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado

siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal

Por consiguiente al probar la diferencia entre las dos proporciones la

distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes

Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia

direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten

normal

La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede

ilustrar mediante el siguiente ejemplo

Cuartos de bantildeos modernos

Cocina moderna Caren

cia

existenc

ia

totales

Carencia 72 8 80

Existencia 7 146 153

La hipoacutetesis nula y alternativa seriacutean

YN ppH 0

YN ppH 0

Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de

significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute

Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H

A partir de la informacioacuten del cuadro

10080

8

N

NSN

n

Xp 95420

153

146

Y

YSY

n

Xp

A partir de la expresioacuten

21

21

111

nnpp

pPZ SS

donde

661015380

1468

p

por lo tanto

0813

153

1

80

133906610

95420100

Z

Totales 79 154 223

Dado que 1960813 Z se rechaza la 0H por lo tanto hay

diferencia entre las dos proporciones

Usando la prueba de chi cuadrado y la tabla de contingencia de este

ejemplo se tiene

Las frecuencias teoacutericas se pueden obtener a partir de la siguiente

ecuacioacuten

n

nnE CR

Por lo tanto se tiene

1227233

7980E 8852

233

15480E

8851233

79153E 12101

233

154153E

Chi cuadrado se obtiene a partir de la expresioacuten

E

EOX

2

2

A partir de la tabla se tiene

O E (O ndash E) (O ndash E)2

(O ndash E)2E

7

2

2

712

+4488 20142144 742704

7 5

188

- 4488 20142144 388245

8 5 -4488 20142144 380903

288

1

46

1

0112

+4488 20142144 199191

1711043

10431712 CALCULADOX

Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el

84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo

tanto hay diferencia entre las dos proporciones

Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la

distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos

distribuciones que a un nivel de significancia de 005 el valor de 196 es el

cuadrado de 3 841 es decir 22 ZX

CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA

La afirmacioacuten de que no existen diferencias entre proporciones significa

que las dos variables son independientes Cuando las conclusiones se presentan en

esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo

Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que

no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la

hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos

variables Independientemente de que la prueba de chi cuadrado se considera una

prueba de diferencia entre dos proporciones o una prueba de independencia los

caacutelculos y resultados son exactamente los mismos

CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE

Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o

intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que

ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de

probabilidades

Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que

seguir varios pasos Primero se tiene que establecer la distribucioacuten de

probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada

paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la

media) se deben establecer mediante hipoacutetesis o estimarlos con base a la

informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para

determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o

intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado

para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la

informacioacuten

BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON

La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de

Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la

cantidad de automoacuteviles estacionados en una cochera cubierta siguen una

distribucioacuten de Poisson 0H

En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero

de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una

muestra aleatoria de 233 casas

Numero de automoacuteviles Frecuencia

0 61

1 151

2 21

233

Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados

de la distribucioacuten de frecuencia

No de automoacuteviles Frecuencia observada On

0 61 0

1 151 151

2 21 42

233 193

808280233

193

1

n

On

X

n

i por lo tanto 80X

El valor de la media muestral se utilizara como el estimado de X

Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)

y se obtiene la frecuencia teoacuterica para cada una

Automoacutevil

n

Frecuencia

O

Probabilidad

XP

Frecuencia (E)

XPn

0 61 04493 104687

1 151 03595 87764

2 21 01438 33505

Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de

significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX

El valor calculado de chi cuadrado es

50679

2

2

K

CALCULADO

E

EOX

Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de

automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una

distribucioacuten de Poisson

CORRECCIOacuteN DE YATES

Cuando se aplican a datos discretos los resultados para distribuciones

continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres

comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de

Yates la cual viene dada mediante la expresioacuten

E

EOX CALCULADO

502

2

En general la correccioacuten se hace solamente cuando el numero de grados

de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos

resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en

relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia

esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi

cuadrado corregido y no corregido Si ambos valores conducen a la misma

conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se

presentan dificultades Si conducen a conclusiones diferentes se puede o bien

incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear

meacutetodos de probabilidad exactos

El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente

ejemplo

En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces

Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de

significancia del 005

No de caras Frecuencia Probabilidad Frecuencia (E)

Cara 115 05 100

cruce 85 05 100

2054

100

0510085

100

0510011522

2

CALCULADOX

Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado

con correccioacuten de Yates es

8432 TABULADOX

Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha

PRUEBA EXACTA DE FISHER

Para examinar la igualdad de las varianzas de dos poblaciones

independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de

las varianzas de las dos muestras Suponiendo que la informacioacuten de cada

poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2

2

2

1 SS sigue una

distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso

estadiacutestico RA Fisher

Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de

grados de libertad los grados de libertad en el numerador y en el denominador

la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea

2

2

2

111 21

S

SF nn

donde

n1 = tamantildeo de muestra en el grupo 1

n2 = tamantildeo de muestra en el grupo 2

n1 ndash 1 = grados de libertad en el grupo 1

n2 ndash 1 = grados de libertad en el grupo 2

2

1S varianza de la muestra en el grupo 1

2

2S varianza de la muestra en el grupo 2

Al probar la igualdad de dos varianzas se pueden emplear pruebas de una

cola o de dos colas

El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente

ejemplo

Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas

alta en la planta A que en la planta B Para determinar la variabilidad se puede

establecer una prueba de una cola en la forma siguiente

22 BAOH

22

1 BAH

Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta

A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta

ubicada en la cola superior de la distribucioacuten

Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de

libertad en el numerador y 19 en el denominador a un nivel de significancia de

001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene

71162 AS y 20142 BS por lo tanto

38512014

71162

2

1924 F como 1385 lt

292 no se rechaza la hipoacutetesis nula ( OH )

CONCLUSIOacuteN

La conclusioacuten que los resultados de una medida variable es la causa de

variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten

estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero

no puede reclamar legitimidad

La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en

describir la distribucioacuten de las variables estudiadas y en particular de los datos

numeacutericos Ademaacutes de las medidas descriptivas correspondientes el

comportamiento de estas variables puede explorarse graacuteficamente de un modo

muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro

organizador de las ciencias computarizadas y el modelo que nos dota de un

mejor razonamiento para implementar programas eficientes En este sentido la

combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un

reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en

colegios y universidades

Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de

combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y

evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras

loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre

operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten

juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la

teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones

simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades

que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea

BIBLIOGRAFIacuteA

AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis

Third Edition Texts in Statistical Science Chapman and Hall

BOXG E P HUNTER W G HUNTER JS (1978) Statistics for

Experimenters John Wiley amp Sons

BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores

Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de

Modelos Ed Revertsbquo SA

Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed

Piraacutemide

Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten

(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica

Matemaacutetica I Universidad de Antioquia

Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma

Madrid

Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill

Meacutexico

Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten

yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico

Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw

ndashHill 4ta Edicioacuten Colombia

CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana

Meacutexico

COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas

COX DR (1958) Planning of experiments New York John Wiley amp Sons

DANIEL C Applications of Statistics to Industrial Experimentation Willey

DAVIES OL The Design and Analysis of Industrial Experiments Hafner

(McMillan)

DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias

Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico

SA de CV Meacutexico

De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H

(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico

Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta

Estadiacutestica Editorial Microsoft corporation USA

ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial

Limusa SA Meacutexico

EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis

Arnold

FEDERER W (1965) Experimental design Oxford Publ Co

GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la

Varianza Grupo Editorial Universitario

FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico

McGraw Hill

FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque

ModernoEditorial SA Meacutexico

George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y

Meacutetodosrdquo Ed McGraw-Hill

GILL JL (1978) Design and Analysis of Experiments in the Animal and

Medical Sciences Iowa State University Press

JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression

and Experimental Design Springer-Verlag

Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor

Caracas

GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining

Institute

GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data

Mining Institute

Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial

Bourgeoacuten Caracas

Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la

EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute

Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial

BourgeoacutenCA Caracas ndash Venezuela

HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis

Multivariante 5ordf Edicioacuten Prentice Hall

JOBSON JD (1992) Applied Multivariate Data Analysis Volume II

Categorical and Multivariate Methods Springer-Verlag

KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial

Hispanoamericana Meacutexico

KIRK RE Experimental Design Procedures for the Behavioral Sciencies

BrooksCole Publishing Company

LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e

inferencia Estadiacutestica Editorial Limusa Meacutexico

LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV

Grupo Noriega Editores Meacutexico

LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial

HARLA Meacutexico

LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta

edicioacuten Editorial McGaw-Hill Usa

Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial

Hispanoameacuterica VI edicioacuten Meacutexico

LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire

Multidimensionnelle 3ordf Edition DUNOD

LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e

Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB

Caracas- Venezuela

LORENZEN T J Anderson V L (1993) Design of experiments A No-Name

Approach Marcel Dekker Inc

Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc

(1999) SPSS 90 Manual de Usuario SPSS Chicago

MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis

Academic Press

Enfocados hacia SPSS

Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de

wwwspssparatodoscom 2005

MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten

Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla

Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea

Ediciones Alfaomega SAN Meacutexico

MASON RL Statistical Design and Analysis of Experiments with Applications

to Engineering and Science John Wiley amp Sons New York

MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y

Economiacutea Editorial Iberoamericana Meacutexico

MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in

agriculture and experimental biology Second edition Chapman amp Hall

MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo

Editorial Iberoameacuterica

MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers

John Wiley amp Sons

Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial

Reverte Mejicana Meacutexico

Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da

Edicioacuten Meacutexico

Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc

Graw Hill

PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones

Editorial Limusa Meacutexico

NETER J et al Applied Linear Statistical Models Regression Analysis of

Variance and Experimental Designs Library of Congress Cataloging Publication

Data

OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp

RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo

Editorial Universitario

PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos

Lineales y Series Temporales Vol 1 y 2 Alianza Editorial

Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores

Spain SA Espantildea 2005

PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial

Mir Moscuacute

RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed

McGraw-Hill

Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca

UCV Caracas ndash Venezuela

RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE

Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en

Psicologiacuteardquo p 1

SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons

Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti

Caracas ndash Venezuela

Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores

deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico

Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica

Editorial Harla Meacutexico

STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y

procedimientos Segunda edicioacuten McGraw Hill

SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas

Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1

Ediciones UNESR Caracas

URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante

Coartiacuteculo Plan Nuevo Editorial AC

VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II

Anaacutelisis Multivariante) Mc-Graw Hill

Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows

Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea

2002

WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros

Editorial Interamericana Meacutexico

Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8

Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage

Learning Editores p 364 ISBN 9706861947

Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea

Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea

Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de

CV Meacutexico

Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para

Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico

DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR

httpesmwikipediaorgwikiSPSS

httpwwwbuenastareascomensayosque-es-el-SPSS1465478html

httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-

del-software-estadistico-integral-spss-base-160

httpesanswersyahoocomquestionindexqid=20070727073908aatuamw

httpwwwslidesharenetleticiagpestructura-de-spss-3126476

httpwwwehowenespanolcomprograma-spss-sobre_48697

httpwwwugres~bioestmedicinamanual_spsspdf

httpwwwmonografiascomtrabajos12tutortutorshtml

httpwwwspsscom

wwwspssparatodoscom

httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html

httpwwwspssfreecomcapitulotreshtml

httpwwwuvesRELIEVEemail relieveuves

httpwwwscribdcomdochellipspss-introduccioacuten

httpeswikipediaorgwikiSPSS

httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd

f

httpwwwspsscomaressuccessargentinashtml

httpeswikipediaorgwikiSPSS

httpwww-01ibmcomsoftwareesanalyticsspss

httppsicofcepurvesspssindex0htm

httpssitesgooglecomsiteestadisticaconelspss

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpe-stadisticabioucmesweb_spssindice_spsshtml

httpwwwquimicaurvesquimiogeneralanovacastpdf

httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da

tosyMultivariable14anova1_SPSSpdf

httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800

20AnE1lisis20de20Varianzaspdf

httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-

pearson

httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf

httpwwwuoceduin3emathdocsRegresionLinealpdf

httpeswikipediaorgwikiRegresiC3B3n_lineal

httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES

ION_LINEAL_CON_SPSSpdf

httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN

EAL20SIMPLE20CON20SPSSpdf

httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE

SION_LINEAL_CON_SPSSpdf

httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm

httpeswikipediaorgwikiNivel_de_medida

httphtmlrincondelvagocomregresion-lineal-simplehtml

httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp

lepdf

httpwwwvitutorcomestadisticabi8html

httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf

httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-

Martinez_1pdf

httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml

httpesslidesharenetpatolinkecuacin-de-regresin-lineal

httpeswikipediaorgwikiMC3ADnimos_cuadrados

httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios

httpwwwwordreferencecomdefinicioncorrelaciC3B3n

httpwwwditutorcomestadistica_2correlacion_estadisticahtml

httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson

httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n

httpeswikipediaorgwikiMatriz_de_correlaciC3B3n

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpwwwinfecepiunizares

httpwwwltbioestadisticaumaes

httpwwwuaqmxmatematicasestadisticasxu3html

httpwwwmembers-americastripodcom

httpwwwmsiplceorg

httpwwwbnvcocrsesionnotaaspg

httpwwwaltavistacom

httpwwwauyantepuycom

httpwwwinees

httpwwwudeccl

httpwwwrincondelvagocom

httpwwwmonografiascom

httpwwwfestadisticafguamesindicadoresiprihtml

httpwwwuaqmxmatematicasestadisticaxu3html

httpwwwinegoboiwd0801htmlE

httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm

httpwwwitlpedumx

httpwwweclaevespanovestadisticasna93nnsnann7eshtml

httpw3moritesmmx~cmendozamaestestoohtml

httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml

httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion

httpwwwunleduarfaveseiencuestasindexhtml

httpwwwmonografiascomtrabajos11operaoperashtml

httpwwwmonografiascomtrabajos6hisohisoshtml

httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos

httpwwwmonografiascomtrabajos16sistema-operativosistema-

operativoshtmlTIPPOS

httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-

operativoshtml

httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei

httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml

httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-

operativo

httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software

httpwwwsscccoclinformaticaconceptoshtml

httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr

httpwwwcadcommxhistoria_de_la_computacionhtm

httpwwweswikipediaorgwikiBus_(informC3A1tica)

httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla

httpwwwcavsicompreguntasrespuestasque-es-el-teclado

httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm

Page 16: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,

Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de

probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad

Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos

y seraacuten mutuamente excluyentes y su suma es el

suceso por lo que tenemos entonces que

y finalmente

Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos

los valores de la variable aleatoria x conoceremos completamente la distribucioacuten

de probabilidad de la variable

Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten

de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente

Es decir la probabilidad de todo el espacio muestral es 1 tal y como

establece la teoriacutea de la probabilidad y por otra parte

Es decir la probabilidad del suceso nulo es cero

Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de

probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes

praacutectico el uso de la funcioacuten de densidad

En el caso de una variable discreta la distribucioacuten puede describirse

mediante una funcioacuten de probabilidad que para cada valor de x de la variable X

determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de

una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de

distribucioacuten la que para cada valor provee la probabilidad de no ser superado

evidentemente el valor de la funcioacuten de distribucioacuten es igual

a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo

inferior del dominio de la variable hasta x inclusive Lista de los resultados de un

experimento con las probabilidades que se esperariacutean ver asociadas con cada

resultado

Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores

diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12

En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica

Para el caso de 1 solo dado donde todos los valores tienen la misma

probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme

Prueba de aleatoriedad

Con frecuencia se supone que los datos recopilados constituyen una

muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la

utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash

Wolfowitz de corridas de una muestra para aleatoriedadrdquo

Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o

la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos

siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la

partida tiene una propiedad en particular o de la cantidad o magnitud en que se

posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la

sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con

distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente

de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que

la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las

partidas que la preceden o las que la suceden en forma tal que la probabilidad de

su ocurrencia varia de una posicioacuten a otra el proceso no se considera como

aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando

esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en

forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico

Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el

tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico

de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una

prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede

rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la

sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de

una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2

exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por

consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis de aleatoriedad

U

UUZ

donde

U = numero total de corridas

U = valor medio de U 12 21

n

nnU

U = desviacioacuten estaacutendar de U 1

222

2121

nn

nnnnnU

n1 = numero de eacutexitos en la muestra

n2 = numero de fracasos en la muestra

n = tamantildeo de la muestra n = n1 + n2

PRUEBA DE McNEMAR

Suele darse el caso en que se desean comparar las proporciones de los

datos de muestras tomados de poblaciones relacionadas En este caso se quisiera

determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a

alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea

determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y

otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede

utilizar la prueba desarrollada por McNemar

El principal intereacutes es determinar si hay diferencia entre las dos

proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta

que el otro (prueba de una cola)

La prueba estadiacutestica para la prueba de McNemar es

CB

CBZ

PRUEBA U DE MANN ndash WHITNEY

Es una alternativa no parametrica a la prueba t de dos muestras para la

diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula

μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos

la forma de distribuciones normales de hecho la prueba solo requiere que las

poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no

importa si se cumple o no esta suposicioacuten

Estadiacutesticos U1 y U2

111

2112

1 W

nnnnU

222

2122

1 W

nnnnU

PRUEBA DE RACHAS

Son todas las diferencias que tiene el mismo signo y se presentan en una

misma fila Una serie de n diferencias puede tener solamente una racha (toda

positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las

rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de

poblaciones con la misma distribucioacuten de frecuencias Colocamos las

observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces

contamos el numero de rachas item de cada una de las muestras Si hay menos

rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales

rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten

La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de

que las observaciones se han sacado aleatoriamente de una sola poblacioacuten

Para hacer esto se halla la mediana de la muestra y se designa las

observaciones situadas por debajo de la mediana por un signo menos (-) y las

observaciones situadas por encima de la mediana por un signo (+) Si el numero

de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado

rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el

numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10

puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la

tabla normal con

u

uu

z

2

1

12

21

21

NN

NNu

)1()(

2(2

21

2

21

2121212

NNNN

NNNNNNu

DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES

DISTRIBUCIONES DE EJEMPLO Y USO

DISTRIBUCIOacuteN NORMAL O GAUSSIANA

Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que

multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal

Esta distribucioacuten de caracteriza porque los valores se distribuyen formando

una campana de Gauss en torno a un valor central que coincide con el valor

medio de la distribucioacuten

Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a

la izquierda

Esta distribucioacuten viene definida por dos paraacutemetros

X N (m S2)

m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro

de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores

estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores

estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de

ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten

estaacutendar

Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina

normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo

que permiten obtener esos mismos valores donde se recoge la probabilidad

acumulada para cada punto de la curva de esta distribucioacuten

Ademaacutes toda distribucioacuten normal se puede transformar en una normal

tipificada

Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con

media 10 y varianza 4 Transformarla en una normal tipificada

X N (10 4)

Para transformarla en una normal tipificada se crea una nueva variable (Y)

que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica

(que es la raiacutez cuadrada de la varianza)

En el ejemplo la nueva variable seriacutea

Esta nueva variable se distribuye como una normal tipificada

permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor

Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos

indicado de que las probabilidades para cada valor de la curva se encuentran

recogidas en una tabla

MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)

La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten

normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta

distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros

y lo que representamos del modo si su funcioacuten de densidad

es

Observacioacuten

Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y

la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes

adelante65

La forma de la funcioacuten de densidad es la llamada campana de Gauss

Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten

normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1

Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un

uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto

con lo cual en coinciden la media la mediana

y la moda y por uacuteltimo calcular sus puntos de inflexioacuten

El soporte de la distribucioacuten es todo de modo que la mayor parte de la

masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se

encuentra concentrado alrededor de la media y las ramas de la curva se extienden

asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la

media es posible (aunque poco probable)

La forma de la campana de Gauss depende de los paraacutemetros y

indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)

Figura Distribuciones gaussianas con diferentes medias e igual

dispersioacuten

(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor

sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor

de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea

``maacutes aplastado seraacute

Figura Distribuciones gaussianas con igual media pero varianza

diferente

La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes

adelante que es

Como consecuencia la distribucioacuten normal es reproductiva con respecto a

los paraacutemetros y ya que

Observacioacuten

Como se ha mencionado anteriormente la ley de probabilidad gaussiana la

encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza

por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el

de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que

apuntar un hecho negativo para esta ley de probabilidad

La funcioacuten no posee primitiva66

conocida67

Las consecuencias desde el punto de vista praacutectico son importantes ya que

eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de

la normal y nos tenemos que limitar a decir que

sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente

esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho

puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto

se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en

problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde

se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie

limitada de valores xi dados Normalmente F se encuentra tabulada para una

distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten

normal tipificada

En el caso de que tengamos una distribucioacuten diferente se

obtiene Z haciendo el siguiente cambio

De manera general se tiene

Proposicioacuten (Cambio de origen y escala)

Sean Entonces

Este resultado puede ser utilizado del siguiente modo Si y nos

interesa calcular

1 Hacemos el cambio y calculamos

2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de

modo aproximado) Como

tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada

Ejemplo

Supongamos que cierto fenoacutemeno pueda ser representado mediante una

va y queremos calcular la probabilidad de que Xtome un valor

entre 39 y 48 es decir

Comenzamos haciendo el cambio de variable

de modo que

Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que

hemos mencionado anteriormente

Proposicioacuten

Sea Entonces

Demostracioacuten

Por ser la normal una ley de probabilidad se tiene que

es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con

respecto a se obtiene el valor 0

luego

Para demostrar la igualdad entre la y basta con aplicar la misma

teacutecnica pero esta vez derivando con respecto a

Luego

Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en

primer lugar la va tipificada de X

y calculamos

Como por la proposicioacuten 5 deducimos que

CURVA NORMAL ESTANDARIZADA

Una variable numeacuterica puede clasificarse como discreta o continua Las

variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas

con la idea de contar Las variables continuas se pueden asociar con la idea de

medir utilizando fracciones y decimales Cuando la variable es continua el

modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal

El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten

normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran

cantidad de variables continuas

El modelo matemaacutetico

La funcioacuten matemaacutetica que se usa como modelo es

e = 271

π = 314

μx = media de la poblacioacuten

σx = desviacioacuten estaacutendar de la poblacioacuten

x = un valor de la variable continua

Como e y π son constantes la forma de la curva normal depende

solamente de los dos parametros de la distribucioacuten normal la media μx y la

desviacioacuten estaacutendar σx

Las diferentes curvas normales van a variar dependiendo de esos dos

paraacutemetros

En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar

visualmente como una curva en forma de campana El aacuterea debajo de esta curva se

halla por medio del integral de la funcioacuten y corresponde al por ciento o la

proporcioacuten de puntuaciones que se encuentran en el intervalo dado

Propiedades de las distribuciones normales

a Son simeacutetricas y tienen forma de campana

b Al ser simeacutetricas la media la moda y la mediana coinciden

c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea

de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media

d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la

curva se encuentra a tres desviaciones estaacutendar de la media

En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral

de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de

diferentes secciones de la curva o se utiliza la computadora para calcular ese valor

del aacuterea

La distribucioacuten normal estandarizada

Puesto que hay un nuacutemero infinito de combinaciones para los dos

paraacutemetros hay un nuacutemero infinito de curvas normales diferentes

Este problema se ha resuelto praacutecticamente al transformar los valores de

todas las distribuciones normales a los valores de una distribucioacuten normal

estandarizada representada por la curva normal estandarizada (standard normal

curve)

Las puntuaciones estandarizadas se logran restando la media a cada

observacioacuten y dividiendo entre la desviacioacuten estaacutendar

donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar

Propiedades de la distribucioacuten normal estandarizada

μ z = 0

σ z = 1

En muchas ocasiones se quieren comparar puntuaciones que pertenecen a

dos distribuciones normales diferentes La diferencia entre las dos distribuciones

radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo

la comparacioacuten se hace posible si se convierten las puntuaciones de ambas

distribuciones a puntuaciones z que corresponden a la distribucioacuten normal

estandarizada

Percentiles y rangos percentiles de una distribucioacuten normal estandarizada

Si se desea hallar la percentiles o el rango percentil en una distribucioacuten

normal no estandarizada se recurre al procedimiento de convertir las puntuaciones

de la distribucioacuten normal dada a puntuaciones z que corresponden a la

distribucioacuten normal estandarizada

Estos valores en la distribucioacuten normal estandarizada se pueden obtener

por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en

las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el

intervalo dado

Es necesario visualizar siempre el aacuterea debajo de la curva como el por

ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo

dado

Cuando una distribucioacuten de puntuaciones es normal estandarizada la

pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar

en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o

cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten

dada

DISTRIBUCIOacuteN GAMMA

Una variable aleatoria X asociada a un experimento aleatorio tiene una

distribucioacuten GAMMA si se caracteriza por las siguientes propiedades

Algunas alternativas de funciones de densidad se pueden ver en la graacutefica

del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)

respectivamente =1

=1

La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo

III

El modelo Gamma se ha utilizado frecuentemente en variables tales como

ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el

intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson

ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900

ndash Flujos maacuteximos MARKOVIC 1965

ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965

ndash Altura de la precipitacioacuten mensual WHITCOMB 1940

ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia

infin

ndash Ingresos familiares

ndash Edad del hombre al contraer matrimonio por primera vez

ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en

subestaciones a una frecuencia part

Ejemplo

Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos

de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia

promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo

de tiempo se encuentre hasta que ocurre el segundo ciclo

a Dentro de una desviacioacuten con respecto del tiempo promedio

b A maacutes de dos desviaciones por encima de la media

Solucioacuten

X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en

horas

Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)

= 2

Y Nuacutemero de ciclos hora ---------Y~P( =002)

E(Y) = 002 =

X ~ G(2 002)

Ejemplo

En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de

kilovatios por hora puede considerarse como una variable aleatoria con

distribucioacuten GAMMA de paraacutemetros = 3 y

= 05

La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de

KWhora

iquestCuaacutel es la probabilidad de que este abastecimientos sea

a Insuficiente en un diacutea cualquiera

b Se consuman entre 3 y 8 millones de K WHora

c c Encuentre E(x) y V(x)

SOLUCIOacuteN

DISTRIBUCIOacuteN PARETO

En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad

continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores

es

Su funcioacuten de distribucioacuten es

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto

son

El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (

DISTRIBUCIOacuteN T DE STUDENT

Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una

distribucioacuten t con n grados de libertad

Cuando n--gtinfinito a curva t coincide com la normal estandarizada

FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX

MOMENTOS

La distribucioacuten -Student se construye como un cociente entre una normal

y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-

Student con n grados de libertad a la de una va T

donde Este tipo de distribuciones aparece cuando

tenemos n+1 va independientes

y nos interesa la distribucioacuten de

La funcioacuten de densidad de es

Figura Funcioacuten de densidad de una de Student

La distribucioacuten de Student tiene propiedades parecidas a

Es de media cero y simeacutetrica con respecto a la misma

Es algo maacutes dispersa que la normal pero la varianza decrece hasta

1 cuando el nuacutemero de grados de libertad aumenta

Figura Comparacioacuten entre las funciones de densidad de y

Para un nuacutemero alto de grados de libertad se puede aproximar la

distribucioacuten de Student por la normal es decir

Figura Cuando aumentan los grados de libertad la distribucioacuten de

Student se aproxima a la distribucioacuten normal tipificada

Para calcular

DISTRIBUCIOacuteN BETA

Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede

representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un

intervalo de longitud finita Tales como

Proporcioacuten de impurezas en un producto quiacutemico

La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten

La proporcioacuten vendida de un lote durante un tiempo t

La humedad relativa medida en cierto lugar

Porcentaje del costo total destinado a reparacioacuten de maquinaria

Porcentaje de costo adicional destinado a reparacioacuten de maquinaria

La distribucioacuten del tiempo necesario para completar una fase del proyecto

PERT

Evaluacioacuten de programas y teacutecnicas de revisioacuten

Ejemplo

La proporcioacuten de tramos de una autopista que requieren repararse

semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros

= 3 y =2

a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten

b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista

requieren reparacioacuten en un antildeo cualquiera

DISTRIBUCIOacuteN CAUCHY

En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de

Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es

donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene

valor esperado ni varianza

Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V

2 lt 1 el

numero U V tiene la distribucioacuten Cauchy

La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un

grado de libertad

Ejemplo

Sean y dos observaciones independientes de una distribucioacuten

Cauchy con funcioacuten de densidad

Puede demostrarse que si y son tales que entonces la

funcioacuten de verosimilitud de es bimodal

Sean y Supongamos que se desea hacer inferencias sobre el

valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa

Especiacuteficamente interesa encontrar la distribucioacuten final de

Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la

distribucioacuten final de tiene una forma complicada Es conveniente notar sin

embargo que corresponde a la densidad marginal de respecto a la

densidad conjunta

DISTRIBUCIOacuteN BERNOULLI

Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto

suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el

que no lo sea (fracaso) En realidad no se trata maacutes que de una variable

dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello

que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas

obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la

situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este

experimento mediante una va discreta Xque toma los valores X=0 si el suceso no

ocurre y X=1 en caso contrario y que se denota

Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar

una moneda al aire y considerar la va

Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de

probabilidad es

y su funcioacuten de distribucioacuten

Su funcioacuten caracteriacutestica es

Los principales momentos de la X los podemos calcular directamente

o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina

Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)

cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de

intentos

CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE

BERNOULLI

Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la

probabilidad y asegurar que se cumplen las tres condiciones necesarias en

particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del

resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3

requiere que los ensayos o intentos de un proceso de Bernoulli sean

estadiacutesticamente independientes es decir que el resultado de un intento no puede

afectar de ninguacuten modo el resultado de cualquier otro intento

DISTRIBUCIOacuteN EXPONENCIAL

Modelo para variable aleatoria continua que permite representar variables

del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos

Componentes

En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de

probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para

valores x gt 0 es

f(x) = λe - λx

Su funcioacuten de distribucioacuten es

Aqui e significa el nuacutemero e

El valor esperado y la varianza de una variable aleatoria X con

distribucioacuten exponencial son

E[X] = 1 λ

V(X) = 1 λ2

Ejemplo

Ejemplos para la distribucioacuten exponencial son los tiempos dentro

accidentes con probabilidad invariable

La funcioacuten de densidad para λ igual 05 10 y 15

DISTRIBUCIOacuteN MULTINOMIAL

La distribucioacuten multinomial es similar a la distribucioacuten binomial con la

diferencia de que en lugar de dos posibles resultados en cada ensayo

La distribucioacuten multinomial sigue el siguiente modelo

Donde

X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo

que el partido POPO lo hayan votado 3 personas)

n indica el nuacutemero de veces que se ha repetido el suceso (en el

ejemplo 5 veces)

n es factorial de n (en el ejemplo 5 4 3 2 1)

p1 es la probabilidad del suceso X1 (en el ejemplo el 40)

Veamos el ejemplo

Luego

P = 00256

Es decir que la probabilidad de que las 5 personas elegidas hayan votado

de esta manera es tan soacutelo del 256

Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1

Veamos otro ejemplo

En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el

40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4

invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos

Aplicamos el modelo

LuegoP = 00384

Por lo tanto la probabilidad de que el grupo esteacute formado por personas de

estos paiacuteses es tan soacutelo del 384

DISTRIBUCIOacuteN UNIFORME

En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de

probabilidad cuyos valores tienen la misma probabilidad

Caso discreto

Su funcioacuten de probabilidad es en el caso discreto con valores posibles

p(xi) = 1 n

Su funcioacuten de distribucioacuten es en el caso discreto

Su media estadiacutestica es

Caso continuo

Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b

La funcioacuten de densidad en el caso continuo entre a y b es

Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12

Ejemplos

Para un dado perfecto todos los resultados tienen la misma probabilidad 1

6

Calcular variables aleatorias

Las variables aleatorias de probabilidad uniforme pueden calcularse con un

generador de variables aleatorias

DISTRIBUCIOacuteN BINOMIAL

En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad

discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con

probabilidad p de un eacutexito

Su funcioacuten de densidad es

Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)

posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos

((1 - p)n - x

)

El valor esperado de una variable aleatoria de probabilidad binominal es

E[x] = np y su varianza V[x] = np(1 - p)

DISTRIBUCIOacuteN BINOMIAL NEGATIVA

Sobre una sucesioacuten de va de Bernouilli independientes

Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r

eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de

distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo

Su ley de probabilidad se deduce siguiendo el esquema

De nuevo el conjunto de posibles valores de esta va discreta es

Su funcioacuten caracteriacutestica es

y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima

Ejemplo

Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en

operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal

que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda

definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para

intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus

5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones

que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se

necesiten 10 intervenciones

Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por

una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan

4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso

Identificando los paraacutemetros se tiene

Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el

nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy

simple

Y=X+r

Luego

Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente

es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de

que X=10-4=6 Por tanto

La distribucioacuten binomial negativa tambieacuten se puede definir como el

nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas

contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que

DISTRIBUCIOacuteN DE POISSON

Modelo para variable aleatoria discreta que permite calcular la

probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten

discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo

muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos

o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual

a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es

independiente de cuaacutendo se presenta dicho periacuteodo

En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de

probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos

es

Aquiacute e significa el nuacutemero e y x significa el factorial de x

La distribucion de Poisson describe el nuacutemero de sucesos en una unidad

de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un

proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens

en una carrera

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten

Poisson son

E[X] = V[X] = λ

La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos

entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un

conmutador la demanda (necesidades) de los pacientes que requieren servicio en

una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el

nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos

ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una

variable aleatoria discreta que toma valores enteros (0 1 2)

Caacutelculo de la probabilidad de Poisson

La letra X por lo general representa a una variable discreta y puede tomar

valores enteros Utilizamos la letra X para representar a la variable aleatoria y la

letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La

probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson

se calcula con la foacutermula

LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA

DISTRIBUCIOacuteN BINOMIAL

La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la

binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan

cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es

grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan

con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena

aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es

igual o menor que 005 En los casos en que se cumplen estas condiciones

podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media

de la distribucioacuten de Poisson

DISTRIBUCIOacuteN GEOMEacuteTRICA

En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten

probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores

discretos es

P(X = x) = p(1 - p)x - 1

Su funcioacuten de distribucioacuten es

El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media

estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2

Ejemplo

El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es

una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6

DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA

En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de

probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de

masa para valores es

Aqui (a sobre b) es el coeficiente binomial

El valor esperado de una variable aleatoria X de distribucioacuten

hipergeomeacutetrica es

Y su varianza

DISTRIBUCIOacuteN ZETA

En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad

discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos

es

Aqui ζ(s) es la funcioacuten zeta de Rieman con

El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto

DISTRIBUCION CHI CUADRADO

El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una

comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es

diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con

ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno

es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario

estas dos frecuencias acusan una diferencia significativa para por ejemplo un

nivel de significacioacuten del 5

El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la

asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada

por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito

bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor

del famoso libro Statistical Methods for Research Workers (1925) donde se

marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con

Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde

estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y

el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las

pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba

exacta de Fisher

Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico

publicitario presentado a grupos de clientes comparar la rentabilidad de un

proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos

de los turistas por determinados espacios geograacuteficos o por determinados

servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las

frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las

frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o

tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o

de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2

x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos

turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han

ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han

tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula

que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido

en los sitios A y B

Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es

independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo

A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces

alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este

anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos

empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de

las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51

La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten

igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es

2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del

Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del

5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206

podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para

suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B

Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias

observadas empiacutericamente de dos muestras con las frecuencias esperadas o

teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el

Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de

las materias primas perecederas Los resultados son seguacuten atributos cualitativos

los siguientes Primero veremos las frecuencias empiacutericas u observadas

Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten

Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son

131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas

Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y

fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres

columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta

maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x

120 260 = 6046 b2 = 129 x 120 260 = 5954

Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten

igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de

2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de

libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La

diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna

conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten

Es una medida de la discrepancia existente entre las frecuencias

observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso

de frecuencias () debido a que permite determinar las desviaciones entre ellas

ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la

expresioacuten

E

EOX

2

2

Donde

O frecuencia observada

E frecuencia teoacuterica esperada

TEST DE CHI-CUADRADO DE CONTINGENCIA

Un caso particular del test de chi-cuadrado que permite hacer un test sobre

la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-

cuadrado de contingencia Los dos caracteres observados en una misma

poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases

de se denotan las de por Tambieacuten vamos a

denotar

el efectivo conjunto de y es el nuacutemero de individuos para los

cuales toma el valor e el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

Estos valores se representan en una tabla de doble entrada conocida como

tabla de contingencia

Cada fila y cada columna corresponden a una submuestra particular La

fila de iacutendice es la distribucioacuten en las clases de los individuos para

los cuales el caraacutecter toma el valor La columna de iacutendice es la

distribucioacuten en las clases de los individuos para los cuales el caraacutecter

toma el valor Dividiendo las filas y las columnas por su suma se obtienen

frecuencias condicionales para cada una de las distribuciones empiacutericas Para

y las denotaremos por

y

Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y

los perfiles columna Para el modelo probabilista las observaciones provienen de

una muestra

de una ley bidimensional La hipoacutetesis a comprobar

es que los dos marginales de esta ley son independientes Si este es el caso los

perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna

de la de

y

Es equivalente a decir que las frecuencias conjuntas deben estar cerca de

los productos de las frecuencias marginales

Las frecuencias conjuntas por un lado (distribucioacuten observada) y los

productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen

dos distribuciones de probabilidad sobre el conjunto producto

Podemos por tanto calcular la distancia de

chi-cuadrado de una con respecto a la otra

Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la

distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale

Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la

definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado

Por lo dicho anteriormente para suficientemente grande podemos

aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el

nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados

a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las

que han sido estimadas Hay para el caraacutecter y para el caraacutecter

(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley

chi-cuadrado seraacute por tanto

Vamos a presentar un ejemplo de dos caracteres binarios que tienen que

ver con enfermos para los cuales se ha observado si tienen o no una tendencia al

suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y

neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las

tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla

de contingencia observada es

Tendencia Sin tendencia Total

Psicosis 20 180 200

Nneurosis 60 140 200

Total 80 320 400

La distancia de chi-cuadrado de contingencia calculada a partir de esta

tabla es de El valor tomado por el estadiacutegrafo es el cual

debemos comparar con la ley El p-valor es de

Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre

la tendencia al suicidio y la clasificacioacuten de las enfermedades

El test no precisa el sentido de esta dependencia Para describirla hay que

comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre

los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten

PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS

Los investigadores se interesan constantemente en las diferencias entre dos

poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado

civil profesioacuten color de ojos preferencia por una marca etc)

Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de

contingenciardquo

Se puede realizar una prueba para la diferencia entre dos proporciones

sobre la base de muestras independientes usaacutendose como instrumento la prueba

de chi cuadrado

El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es

la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se

podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda

Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la

ecuacioacuten

n

nnE CR

donde

nR nuacutemero total en el rengloacuten

nC nuacutemero total en la columna

n tamantildeo total de la muestra

El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado

entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia

al cuadrado se divide entre la frecuencia esperada de la celda

La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se

rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el

valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados

de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el

tamantildeo de la muestra

CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD

Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a

las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se

puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la

distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado

siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal

Por consiguiente al probar la diferencia entre las dos proporciones la

distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes

Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia

direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten

normal

La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede

ilustrar mediante el siguiente ejemplo

Cuartos de bantildeos modernos

Cocina moderna Caren

cia

existenc

ia

totales

Carencia 72 8 80

Existencia 7 146 153

La hipoacutetesis nula y alternativa seriacutean

YN ppH 0

YN ppH 0

Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de

significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute

Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H

A partir de la informacioacuten del cuadro

10080

8

N

NSN

n

Xp 95420

153

146

Y

YSY

n

Xp

A partir de la expresioacuten

21

21

111

nnpp

pPZ SS

donde

661015380

1468

p

por lo tanto

0813

153

1

80

133906610

95420100

Z

Totales 79 154 223

Dado que 1960813 Z se rechaza la 0H por lo tanto hay

diferencia entre las dos proporciones

Usando la prueba de chi cuadrado y la tabla de contingencia de este

ejemplo se tiene

Las frecuencias teoacutericas se pueden obtener a partir de la siguiente

ecuacioacuten

n

nnE CR

Por lo tanto se tiene

1227233

7980E 8852

233

15480E

8851233

79153E 12101

233

154153E

Chi cuadrado se obtiene a partir de la expresioacuten

E

EOX

2

2

A partir de la tabla se tiene

O E (O ndash E) (O ndash E)2

(O ndash E)2E

7

2

2

712

+4488 20142144 742704

7 5

188

- 4488 20142144 388245

8 5 -4488 20142144 380903

288

1

46

1

0112

+4488 20142144 199191

1711043

10431712 CALCULADOX

Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el

84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo

tanto hay diferencia entre las dos proporciones

Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la

distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos

distribuciones que a un nivel de significancia de 005 el valor de 196 es el

cuadrado de 3 841 es decir 22 ZX

CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA

La afirmacioacuten de que no existen diferencias entre proporciones significa

que las dos variables son independientes Cuando las conclusiones se presentan en

esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo

Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que

no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la

hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos

variables Independientemente de que la prueba de chi cuadrado se considera una

prueba de diferencia entre dos proporciones o una prueba de independencia los

caacutelculos y resultados son exactamente los mismos

CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE

Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o

intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que

ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de

probabilidades

Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que

seguir varios pasos Primero se tiene que establecer la distribucioacuten de

probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada

paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la

media) se deben establecer mediante hipoacutetesis o estimarlos con base a la

informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para

determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o

intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado

para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la

informacioacuten

BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON

La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de

Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la

cantidad de automoacuteviles estacionados en una cochera cubierta siguen una

distribucioacuten de Poisson 0H

En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero

de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una

muestra aleatoria de 233 casas

Numero de automoacuteviles Frecuencia

0 61

1 151

2 21

233

Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados

de la distribucioacuten de frecuencia

No de automoacuteviles Frecuencia observada On

0 61 0

1 151 151

2 21 42

233 193

808280233

193

1

n

On

X

n

i por lo tanto 80X

El valor de la media muestral se utilizara como el estimado de X

Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)

y se obtiene la frecuencia teoacuterica para cada una

Automoacutevil

n

Frecuencia

O

Probabilidad

XP

Frecuencia (E)

XPn

0 61 04493 104687

1 151 03595 87764

2 21 01438 33505

Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de

significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX

El valor calculado de chi cuadrado es

50679

2

2

K

CALCULADO

E

EOX

Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de

automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una

distribucioacuten de Poisson

CORRECCIOacuteN DE YATES

Cuando se aplican a datos discretos los resultados para distribuciones

continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres

comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de

Yates la cual viene dada mediante la expresioacuten

E

EOX CALCULADO

502

2

En general la correccioacuten se hace solamente cuando el numero de grados

de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos

resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en

relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia

esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi

cuadrado corregido y no corregido Si ambos valores conducen a la misma

conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se

presentan dificultades Si conducen a conclusiones diferentes se puede o bien

incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear

meacutetodos de probabilidad exactos

El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente

ejemplo

En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces

Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de

significancia del 005

No de caras Frecuencia Probabilidad Frecuencia (E)

Cara 115 05 100

cruce 85 05 100

2054

100

0510085

100

0510011522

2

CALCULADOX

Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado

con correccioacuten de Yates es

8432 TABULADOX

Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha

PRUEBA EXACTA DE FISHER

Para examinar la igualdad de las varianzas de dos poblaciones

independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de

las varianzas de las dos muestras Suponiendo que la informacioacuten de cada

poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2

2

2

1 SS sigue una

distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso

estadiacutestico RA Fisher

Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de

grados de libertad los grados de libertad en el numerador y en el denominador

la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea

2

2

2

111 21

S

SF nn

donde

n1 = tamantildeo de muestra en el grupo 1

n2 = tamantildeo de muestra en el grupo 2

n1 ndash 1 = grados de libertad en el grupo 1

n2 ndash 1 = grados de libertad en el grupo 2

2

1S varianza de la muestra en el grupo 1

2

2S varianza de la muestra en el grupo 2

Al probar la igualdad de dos varianzas se pueden emplear pruebas de una

cola o de dos colas

El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente

ejemplo

Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas

alta en la planta A que en la planta B Para determinar la variabilidad se puede

establecer una prueba de una cola en la forma siguiente

22 BAOH

22

1 BAH

Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta

A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta

ubicada en la cola superior de la distribucioacuten

Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de

libertad en el numerador y 19 en el denominador a un nivel de significancia de

001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene

71162 AS y 20142 BS por lo tanto

38512014

71162

2

1924 F como 1385 lt

292 no se rechaza la hipoacutetesis nula ( OH )

CONCLUSIOacuteN

La conclusioacuten que los resultados de una medida variable es la causa de

variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten

estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero

no puede reclamar legitimidad

La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en

describir la distribucioacuten de las variables estudiadas y en particular de los datos

numeacutericos Ademaacutes de las medidas descriptivas correspondientes el

comportamiento de estas variables puede explorarse graacuteficamente de un modo

muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro

organizador de las ciencias computarizadas y el modelo que nos dota de un

mejor razonamiento para implementar programas eficientes En este sentido la

combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un

reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en

colegios y universidades

Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de

combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y

evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras

loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre

operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten

juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la

teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones

simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades

que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea

BIBLIOGRAFIacuteA

AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis

Third Edition Texts in Statistical Science Chapman and Hall

BOXG E P HUNTER W G HUNTER JS (1978) Statistics for

Experimenters John Wiley amp Sons

BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores

Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de

Modelos Ed Revertsbquo SA

Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed

Piraacutemide

Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten

(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica

Matemaacutetica I Universidad de Antioquia

Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma

Madrid

Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill

Meacutexico

Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten

yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico

Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw

ndashHill 4ta Edicioacuten Colombia

CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana

Meacutexico

COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas

COX DR (1958) Planning of experiments New York John Wiley amp Sons

DANIEL C Applications of Statistics to Industrial Experimentation Willey

DAVIES OL The Design and Analysis of Industrial Experiments Hafner

(McMillan)

DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias

Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico

SA de CV Meacutexico

De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H

(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico

Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta

Estadiacutestica Editorial Microsoft corporation USA

ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial

Limusa SA Meacutexico

EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis

Arnold

FEDERER W (1965) Experimental design Oxford Publ Co

GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la

Varianza Grupo Editorial Universitario

FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico

McGraw Hill

FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque

ModernoEditorial SA Meacutexico

George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y

Meacutetodosrdquo Ed McGraw-Hill

GILL JL (1978) Design and Analysis of Experiments in the Animal and

Medical Sciences Iowa State University Press

JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression

and Experimental Design Springer-Verlag

Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor

Caracas

GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining

Institute

GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data

Mining Institute

Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial

Bourgeoacuten Caracas

Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la

EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute

Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial

BourgeoacutenCA Caracas ndash Venezuela

HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis

Multivariante 5ordf Edicioacuten Prentice Hall

JOBSON JD (1992) Applied Multivariate Data Analysis Volume II

Categorical and Multivariate Methods Springer-Verlag

KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial

Hispanoamericana Meacutexico

KIRK RE Experimental Design Procedures for the Behavioral Sciencies

BrooksCole Publishing Company

LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e

inferencia Estadiacutestica Editorial Limusa Meacutexico

LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV

Grupo Noriega Editores Meacutexico

LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial

HARLA Meacutexico

LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta

edicioacuten Editorial McGaw-Hill Usa

Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial

Hispanoameacuterica VI edicioacuten Meacutexico

LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire

Multidimensionnelle 3ordf Edition DUNOD

LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e

Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB

Caracas- Venezuela

LORENZEN T J Anderson V L (1993) Design of experiments A No-Name

Approach Marcel Dekker Inc

Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc

(1999) SPSS 90 Manual de Usuario SPSS Chicago

MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis

Academic Press

Enfocados hacia SPSS

Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de

wwwspssparatodoscom 2005

MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten

Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla

Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea

Ediciones Alfaomega SAN Meacutexico

MASON RL Statistical Design and Analysis of Experiments with Applications

to Engineering and Science John Wiley amp Sons New York

MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y

Economiacutea Editorial Iberoamericana Meacutexico

MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in

agriculture and experimental biology Second edition Chapman amp Hall

MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo

Editorial Iberoameacuterica

MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers

John Wiley amp Sons

Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial

Reverte Mejicana Meacutexico

Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da

Edicioacuten Meacutexico

Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc

Graw Hill

PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones

Editorial Limusa Meacutexico

NETER J et al Applied Linear Statistical Models Regression Analysis of

Variance and Experimental Designs Library of Congress Cataloging Publication

Data

OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp

RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo

Editorial Universitario

PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos

Lineales y Series Temporales Vol 1 y 2 Alianza Editorial

Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores

Spain SA Espantildea 2005

PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial

Mir Moscuacute

RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed

McGraw-Hill

Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca

UCV Caracas ndash Venezuela

RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE

Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en

Psicologiacuteardquo p 1

SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons

Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti

Caracas ndash Venezuela

Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores

deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico

Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica

Editorial Harla Meacutexico

STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y

procedimientos Segunda edicioacuten McGraw Hill

SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas

Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1

Ediciones UNESR Caracas

URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante

Coartiacuteculo Plan Nuevo Editorial AC

VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II

Anaacutelisis Multivariante) Mc-Graw Hill

Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows

Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea

2002

WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros

Editorial Interamericana Meacutexico

Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8

Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage

Learning Editores p 364 ISBN 9706861947

Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea

Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea

Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de

CV Meacutexico

Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para

Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico

DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR

httpesmwikipediaorgwikiSPSS

httpwwwbuenastareascomensayosque-es-el-SPSS1465478html

httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-

del-software-estadistico-integral-spss-base-160

httpesanswersyahoocomquestionindexqid=20070727073908aatuamw

httpwwwslidesharenetleticiagpestructura-de-spss-3126476

httpwwwehowenespanolcomprograma-spss-sobre_48697

httpwwwugres~bioestmedicinamanual_spsspdf

httpwwwmonografiascomtrabajos12tutortutorshtml

httpwwwspsscom

wwwspssparatodoscom

httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html

httpwwwspssfreecomcapitulotreshtml

httpwwwuvesRELIEVEemail relieveuves

httpwwwscribdcomdochellipspss-introduccioacuten

httpeswikipediaorgwikiSPSS

httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd

f

httpwwwspsscomaressuccessargentinashtml

httpeswikipediaorgwikiSPSS

httpwww-01ibmcomsoftwareesanalyticsspss

httppsicofcepurvesspssindex0htm

httpssitesgooglecomsiteestadisticaconelspss

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpe-stadisticabioucmesweb_spssindice_spsshtml

httpwwwquimicaurvesquimiogeneralanovacastpdf

httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da

tosyMultivariable14anova1_SPSSpdf

httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800

20AnE1lisis20de20Varianzaspdf

httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-

pearson

httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf

httpwwwuoceduin3emathdocsRegresionLinealpdf

httpeswikipediaorgwikiRegresiC3B3n_lineal

httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES

ION_LINEAL_CON_SPSSpdf

httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN

EAL20SIMPLE20CON20SPSSpdf

httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE

SION_LINEAL_CON_SPSSpdf

httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm

httpeswikipediaorgwikiNivel_de_medida

httphtmlrincondelvagocomregresion-lineal-simplehtml

httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp

lepdf

httpwwwvitutorcomestadisticabi8html

httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf

httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-

Martinez_1pdf

httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml

httpesslidesharenetpatolinkecuacin-de-regresin-lineal

httpeswikipediaorgwikiMC3ADnimos_cuadrados

httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios

httpwwwwordreferencecomdefinicioncorrelaciC3B3n

httpwwwditutorcomestadistica_2correlacion_estadisticahtml

httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson

httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n

httpeswikipediaorgwikiMatriz_de_correlaciC3B3n

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpwwwinfecepiunizares

httpwwwltbioestadisticaumaes

httpwwwuaqmxmatematicasestadisticasxu3html

httpwwwmembers-americastripodcom

httpwwwmsiplceorg

httpwwwbnvcocrsesionnotaaspg

httpwwwaltavistacom

httpwwwauyantepuycom

httpwwwinees

httpwwwudeccl

httpwwwrincondelvagocom

httpwwwmonografiascom

httpwwwfestadisticafguamesindicadoresiprihtml

httpwwwuaqmxmatematicasestadisticaxu3html

httpwwwinegoboiwd0801htmlE

httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm

httpwwwitlpedumx

httpwwweclaevespanovestadisticasna93nnsnann7eshtml

httpw3moritesmmx~cmendozamaestestoohtml

httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml

httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion

httpwwwunleduarfaveseiencuestasindexhtml

httpwwwmonografiascomtrabajos11operaoperashtml

httpwwwmonografiascomtrabajos6hisohisoshtml

httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos

httpwwwmonografiascomtrabajos16sistema-operativosistema-

operativoshtmlTIPPOS

httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-

operativoshtml

httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei

httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml

httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-

operativo

httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software

httpwwwsscccoclinformaticaconceptoshtml

httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr

httpwwwcadcommxhistoria_de_la_computacionhtm

httpwwweswikipediaorgwikiBus_(informC3A1tica)

httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla

httpwwwcavsicompreguntasrespuestasque-es-el-teclado

httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm

Page 17: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,

En el caso de una variable discreta la distribucioacuten puede describirse

mediante una funcioacuten de probabilidad que para cada valor de x de la variable X

determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de

una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de

distribucioacuten la que para cada valor provee la probabilidad de no ser superado

evidentemente el valor de la funcioacuten de distribucioacuten es igual

a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo

inferior del dominio de la variable hasta x inclusive Lista de los resultados de un

experimento con las probabilidades que se esperariacutean ver asociadas con cada

resultado

Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores

diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12

En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica

Para el caso de 1 solo dado donde todos los valores tienen la misma

probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme

Prueba de aleatoriedad

Con frecuencia se supone que los datos recopilados constituyen una

muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la

utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash

Wolfowitz de corridas de una muestra para aleatoriedadrdquo

Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o

la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos

siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la

partida tiene una propiedad en particular o de la cantidad o magnitud en que se

posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la

sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con

distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente

de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que

la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las

partidas que la preceden o las que la suceden en forma tal que la probabilidad de

su ocurrencia varia de una posicioacuten a otra el proceso no se considera como

aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando

esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en

forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico

Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el

tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico

de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una

prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede

rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la

sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de

una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2

exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por

consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis de aleatoriedad

U

UUZ

donde

U = numero total de corridas

U = valor medio de U 12 21

n

nnU

U = desviacioacuten estaacutendar de U 1

222

2121

nn

nnnnnU

n1 = numero de eacutexitos en la muestra

n2 = numero de fracasos en la muestra

n = tamantildeo de la muestra n = n1 + n2

PRUEBA DE McNEMAR

Suele darse el caso en que se desean comparar las proporciones de los

datos de muestras tomados de poblaciones relacionadas En este caso se quisiera

determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a

alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea

determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y

otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede

utilizar la prueba desarrollada por McNemar

El principal intereacutes es determinar si hay diferencia entre las dos

proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta

que el otro (prueba de una cola)

La prueba estadiacutestica para la prueba de McNemar es

CB

CBZ

PRUEBA U DE MANN ndash WHITNEY

Es una alternativa no parametrica a la prueba t de dos muestras para la

diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula

μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos

la forma de distribuciones normales de hecho la prueba solo requiere que las

poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no

importa si se cumple o no esta suposicioacuten

Estadiacutesticos U1 y U2

111

2112

1 W

nnnnU

222

2122

1 W

nnnnU

PRUEBA DE RACHAS

Son todas las diferencias que tiene el mismo signo y se presentan en una

misma fila Una serie de n diferencias puede tener solamente una racha (toda

positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las

rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de

poblaciones con la misma distribucioacuten de frecuencias Colocamos las

observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces

contamos el numero de rachas item de cada una de las muestras Si hay menos

rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales

rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten

La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de

que las observaciones se han sacado aleatoriamente de una sola poblacioacuten

Para hacer esto se halla la mediana de la muestra y se designa las

observaciones situadas por debajo de la mediana por un signo menos (-) y las

observaciones situadas por encima de la mediana por un signo (+) Si el numero

de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado

rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el

numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10

puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la

tabla normal con

u

uu

z

2

1

12

21

21

NN

NNu

)1()(

2(2

21

2

21

2121212

NNNN

NNNNNNu

DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES

DISTRIBUCIONES DE EJEMPLO Y USO

DISTRIBUCIOacuteN NORMAL O GAUSSIANA

Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que

multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal

Esta distribucioacuten de caracteriza porque los valores se distribuyen formando

una campana de Gauss en torno a un valor central que coincide con el valor

medio de la distribucioacuten

Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a

la izquierda

Esta distribucioacuten viene definida por dos paraacutemetros

X N (m S2)

m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro

de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores

estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores

estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de

ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten

estaacutendar

Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina

normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo

que permiten obtener esos mismos valores donde se recoge la probabilidad

acumulada para cada punto de la curva de esta distribucioacuten

Ademaacutes toda distribucioacuten normal se puede transformar en una normal

tipificada

Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con

media 10 y varianza 4 Transformarla en una normal tipificada

X N (10 4)

Para transformarla en una normal tipificada se crea una nueva variable (Y)

que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica

(que es la raiacutez cuadrada de la varianza)

En el ejemplo la nueva variable seriacutea

Esta nueva variable se distribuye como una normal tipificada

permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor

Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos

indicado de que las probabilidades para cada valor de la curva se encuentran

recogidas en una tabla

MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)

La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten

normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta

distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros

y lo que representamos del modo si su funcioacuten de densidad

es

Observacioacuten

Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y

la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes

adelante65

La forma de la funcioacuten de densidad es la llamada campana de Gauss

Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten

normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1

Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un

uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto

con lo cual en coinciden la media la mediana

y la moda y por uacuteltimo calcular sus puntos de inflexioacuten

El soporte de la distribucioacuten es todo de modo que la mayor parte de la

masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se

encuentra concentrado alrededor de la media y las ramas de la curva se extienden

asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la

media es posible (aunque poco probable)

La forma de la campana de Gauss depende de los paraacutemetros y

indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)

Figura Distribuciones gaussianas con diferentes medias e igual

dispersioacuten

(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor

sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor

de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea

``maacutes aplastado seraacute

Figura Distribuciones gaussianas con igual media pero varianza

diferente

La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes

adelante que es

Como consecuencia la distribucioacuten normal es reproductiva con respecto a

los paraacutemetros y ya que

Observacioacuten

Como se ha mencionado anteriormente la ley de probabilidad gaussiana la

encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza

por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el

de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que

apuntar un hecho negativo para esta ley de probabilidad

La funcioacuten no posee primitiva66

conocida67

Las consecuencias desde el punto de vista praacutectico son importantes ya que

eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de

la normal y nos tenemos que limitar a decir que

sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente

esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho

puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto

se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en

problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde

se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie

limitada de valores xi dados Normalmente F se encuentra tabulada para una

distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten

normal tipificada

En el caso de que tengamos una distribucioacuten diferente se

obtiene Z haciendo el siguiente cambio

De manera general se tiene

Proposicioacuten (Cambio de origen y escala)

Sean Entonces

Este resultado puede ser utilizado del siguiente modo Si y nos

interesa calcular

1 Hacemos el cambio y calculamos

2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de

modo aproximado) Como

tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada

Ejemplo

Supongamos que cierto fenoacutemeno pueda ser representado mediante una

va y queremos calcular la probabilidad de que Xtome un valor

entre 39 y 48 es decir

Comenzamos haciendo el cambio de variable

de modo que

Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que

hemos mencionado anteriormente

Proposicioacuten

Sea Entonces

Demostracioacuten

Por ser la normal una ley de probabilidad se tiene que

es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con

respecto a se obtiene el valor 0

luego

Para demostrar la igualdad entre la y basta con aplicar la misma

teacutecnica pero esta vez derivando con respecto a

Luego

Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en

primer lugar la va tipificada de X

y calculamos

Como por la proposicioacuten 5 deducimos que

CURVA NORMAL ESTANDARIZADA

Una variable numeacuterica puede clasificarse como discreta o continua Las

variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas

con la idea de contar Las variables continuas se pueden asociar con la idea de

medir utilizando fracciones y decimales Cuando la variable es continua el

modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal

El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten

normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran

cantidad de variables continuas

El modelo matemaacutetico

La funcioacuten matemaacutetica que se usa como modelo es

e = 271

π = 314

μx = media de la poblacioacuten

σx = desviacioacuten estaacutendar de la poblacioacuten

x = un valor de la variable continua

Como e y π son constantes la forma de la curva normal depende

solamente de los dos parametros de la distribucioacuten normal la media μx y la

desviacioacuten estaacutendar σx

Las diferentes curvas normales van a variar dependiendo de esos dos

paraacutemetros

En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar

visualmente como una curva en forma de campana El aacuterea debajo de esta curva se

halla por medio del integral de la funcioacuten y corresponde al por ciento o la

proporcioacuten de puntuaciones que se encuentran en el intervalo dado

Propiedades de las distribuciones normales

a Son simeacutetricas y tienen forma de campana

b Al ser simeacutetricas la media la moda y la mediana coinciden

c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea

de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media

d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la

curva se encuentra a tres desviaciones estaacutendar de la media

En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral

de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de

diferentes secciones de la curva o se utiliza la computadora para calcular ese valor

del aacuterea

La distribucioacuten normal estandarizada

Puesto que hay un nuacutemero infinito de combinaciones para los dos

paraacutemetros hay un nuacutemero infinito de curvas normales diferentes

Este problema se ha resuelto praacutecticamente al transformar los valores de

todas las distribuciones normales a los valores de una distribucioacuten normal

estandarizada representada por la curva normal estandarizada (standard normal

curve)

Las puntuaciones estandarizadas se logran restando la media a cada

observacioacuten y dividiendo entre la desviacioacuten estaacutendar

donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar

Propiedades de la distribucioacuten normal estandarizada

μ z = 0

σ z = 1

En muchas ocasiones se quieren comparar puntuaciones que pertenecen a

dos distribuciones normales diferentes La diferencia entre las dos distribuciones

radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo

la comparacioacuten se hace posible si se convierten las puntuaciones de ambas

distribuciones a puntuaciones z que corresponden a la distribucioacuten normal

estandarizada

Percentiles y rangos percentiles de una distribucioacuten normal estandarizada

Si se desea hallar la percentiles o el rango percentil en una distribucioacuten

normal no estandarizada se recurre al procedimiento de convertir las puntuaciones

de la distribucioacuten normal dada a puntuaciones z que corresponden a la

distribucioacuten normal estandarizada

Estos valores en la distribucioacuten normal estandarizada se pueden obtener

por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en

las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el

intervalo dado

Es necesario visualizar siempre el aacuterea debajo de la curva como el por

ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo

dado

Cuando una distribucioacuten de puntuaciones es normal estandarizada la

pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar

en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o

cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten

dada

DISTRIBUCIOacuteN GAMMA

Una variable aleatoria X asociada a un experimento aleatorio tiene una

distribucioacuten GAMMA si se caracteriza por las siguientes propiedades

Algunas alternativas de funciones de densidad se pueden ver en la graacutefica

del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)

respectivamente =1

=1

La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo

III

El modelo Gamma se ha utilizado frecuentemente en variables tales como

ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el

intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson

ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900

ndash Flujos maacuteximos MARKOVIC 1965

ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965

ndash Altura de la precipitacioacuten mensual WHITCOMB 1940

ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia

infin

ndash Ingresos familiares

ndash Edad del hombre al contraer matrimonio por primera vez

ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en

subestaciones a una frecuencia part

Ejemplo

Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos

de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia

promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo

de tiempo se encuentre hasta que ocurre el segundo ciclo

a Dentro de una desviacioacuten con respecto del tiempo promedio

b A maacutes de dos desviaciones por encima de la media

Solucioacuten

X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en

horas

Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)

= 2

Y Nuacutemero de ciclos hora ---------Y~P( =002)

E(Y) = 002 =

X ~ G(2 002)

Ejemplo

En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de

kilovatios por hora puede considerarse como una variable aleatoria con

distribucioacuten GAMMA de paraacutemetros = 3 y

= 05

La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de

KWhora

iquestCuaacutel es la probabilidad de que este abastecimientos sea

a Insuficiente en un diacutea cualquiera

b Se consuman entre 3 y 8 millones de K WHora

c c Encuentre E(x) y V(x)

SOLUCIOacuteN

DISTRIBUCIOacuteN PARETO

En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad

continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores

es

Su funcioacuten de distribucioacuten es

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto

son

El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (

DISTRIBUCIOacuteN T DE STUDENT

Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una

distribucioacuten t con n grados de libertad

Cuando n--gtinfinito a curva t coincide com la normal estandarizada

FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX

MOMENTOS

La distribucioacuten -Student se construye como un cociente entre una normal

y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-

Student con n grados de libertad a la de una va T

donde Este tipo de distribuciones aparece cuando

tenemos n+1 va independientes

y nos interesa la distribucioacuten de

La funcioacuten de densidad de es

Figura Funcioacuten de densidad de una de Student

La distribucioacuten de Student tiene propiedades parecidas a

Es de media cero y simeacutetrica con respecto a la misma

Es algo maacutes dispersa que la normal pero la varianza decrece hasta

1 cuando el nuacutemero de grados de libertad aumenta

Figura Comparacioacuten entre las funciones de densidad de y

Para un nuacutemero alto de grados de libertad se puede aproximar la

distribucioacuten de Student por la normal es decir

Figura Cuando aumentan los grados de libertad la distribucioacuten de

Student se aproxima a la distribucioacuten normal tipificada

Para calcular

DISTRIBUCIOacuteN BETA

Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede

representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un

intervalo de longitud finita Tales como

Proporcioacuten de impurezas en un producto quiacutemico

La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten

La proporcioacuten vendida de un lote durante un tiempo t

La humedad relativa medida en cierto lugar

Porcentaje del costo total destinado a reparacioacuten de maquinaria

Porcentaje de costo adicional destinado a reparacioacuten de maquinaria

La distribucioacuten del tiempo necesario para completar una fase del proyecto

PERT

Evaluacioacuten de programas y teacutecnicas de revisioacuten

Ejemplo

La proporcioacuten de tramos de una autopista que requieren repararse

semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros

= 3 y =2

a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten

b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista

requieren reparacioacuten en un antildeo cualquiera

DISTRIBUCIOacuteN CAUCHY

En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de

Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es

donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene

valor esperado ni varianza

Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V

2 lt 1 el

numero U V tiene la distribucioacuten Cauchy

La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un

grado de libertad

Ejemplo

Sean y dos observaciones independientes de una distribucioacuten

Cauchy con funcioacuten de densidad

Puede demostrarse que si y son tales que entonces la

funcioacuten de verosimilitud de es bimodal

Sean y Supongamos que se desea hacer inferencias sobre el

valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa

Especiacuteficamente interesa encontrar la distribucioacuten final de

Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la

distribucioacuten final de tiene una forma complicada Es conveniente notar sin

embargo que corresponde a la densidad marginal de respecto a la

densidad conjunta

DISTRIBUCIOacuteN BERNOULLI

Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto

suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el

que no lo sea (fracaso) En realidad no se trata maacutes que de una variable

dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello

que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas

obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la

situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este

experimento mediante una va discreta Xque toma los valores X=0 si el suceso no

ocurre y X=1 en caso contrario y que se denota

Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar

una moneda al aire y considerar la va

Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de

probabilidad es

y su funcioacuten de distribucioacuten

Su funcioacuten caracteriacutestica es

Los principales momentos de la X los podemos calcular directamente

o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina

Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)

cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de

intentos

CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE

BERNOULLI

Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la

probabilidad y asegurar que se cumplen las tres condiciones necesarias en

particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del

resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3

requiere que los ensayos o intentos de un proceso de Bernoulli sean

estadiacutesticamente independientes es decir que el resultado de un intento no puede

afectar de ninguacuten modo el resultado de cualquier otro intento

DISTRIBUCIOacuteN EXPONENCIAL

Modelo para variable aleatoria continua que permite representar variables

del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos

Componentes

En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de

probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para

valores x gt 0 es

f(x) = λe - λx

Su funcioacuten de distribucioacuten es

Aqui e significa el nuacutemero e

El valor esperado y la varianza de una variable aleatoria X con

distribucioacuten exponencial son

E[X] = 1 λ

V(X) = 1 λ2

Ejemplo

Ejemplos para la distribucioacuten exponencial son los tiempos dentro

accidentes con probabilidad invariable

La funcioacuten de densidad para λ igual 05 10 y 15

DISTRIBUCIOacuteN MULTINOMIAL

La distribucioacuten multinomial es similar a la distribucioacuten binomial con la

diferencia de que en lugar de dos posibles resultados en cada ensayo

La distribucioacuten multinomial sigue el siguiente modelo

Donde

X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo

que el partido POPO lo hayan votado 3 personas)

n indica el nuacutemero de veces que se ha repetido el suceso (en el

ejemplo 5 veces)

n es factorial de n (en el ejemplo 5 4 3 2 1)

p1 es la probabilidad del suceso X1 (en el ejemplo el 40)

Veamos el ejemplo

Luego

P = 00256

Es decir que la probabilidad de que las 5 personas elegidas hayan votado

de esta manera es tan soacutelo del 256

Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1

Veamos otro ejemplo

En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el

40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4

invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos

Aplicamos el modelo

LuegoP = 00384

Por lo tanto la probabilidad de que el grupo esteacute formado por personas de

estos paiacuteses es tan soacutelo del 384

DISTRIBUCIOacuteN UNIFORME

En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de

probabilidad cuyos valores tienen la misma probabilidad

Caso discreto

Su funcioacuten de probabilidad es en el caso discreto con valores posibles

p(xi) = 1 n

Su funcioacuten de distribucioacuten es en el caso discreto

Su media estadiacutestica es

Caso continuo

Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b

La funcioacuten de densidad en el caso continuo entre a y b es

Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12

Ejemplos

Para un dado perfecto todos los resultados tienen la misma probabilidad 1

6

Calcular variables aleatorias

Las variables aleatorias de probabilidad uniforme pueden calcularse con un

generador de variables aleatorias

DISTRIBUCIOacuteN BINOMIAL

En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad

discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con

probabilidad p de un eacutexito

Su funcioacuten de densidad es

Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)

posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos

((1 - p)n - x

)

El valor esperado de una variable aleatoria de probabilidad binominal es

E[x] = np y su varianza V[x] = np(1 - p)

DISTRIBUCIOacuteN BINOMIAL NEGATIVA

Sobre una sucesioacuten de va de Bernouilli independientes

Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r

eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de

distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo

Su ley de probabilidad se deduce siguiendo el esquema

De nuevo el conjunto de posibles valores de esta va discreta es

Su funcioacuten caracteriacutestica es

y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima

Ejemplo

Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en

operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal

que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda

definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para

intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus

5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones

que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se

necesiten 10 intervenciones

Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por

una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan

4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso

Identificando los paraacutemetros se tiene

Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el

nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy

simple

Y=X+r

Luego

Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente

es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de

que X=10-4=6 Por tanto

La distribucioacuten binomial negativa tambieacuten se puede definir como el

nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas

contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que

DISTRIBUCIOacuteN DE POISSON

Modelo para variable aleatoria discreta que permite calcular la

probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten

discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo

muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos

o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual

a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es

independiente de cuaacutendo se presenta dicho periacuteodo

En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de

probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos

es

Aquiacute e significa el nuacutemero e y x significa el factorial de x

La distribucion de Poisson describe el nuacutemero de sucesos en una unidad

de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un

proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens

en una carrera

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten

Poisson son

E[X] = V[X] = λ

La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos

entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un

conmutador la demanda (necesidades) de los pacientes que requieren servicio en

una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el

nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos

ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una

variable aleatoria discreta que toma valores enteros (0 1 2)

Caacutelculo de la probabilidad de Poisson

La letra X por lo general representa a una variable discreta y puede tomar

valores enteros Utilizamos la letra X para representar a la variable aleatoria y la

letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La

probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson

se calcula con la foacutermula

LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA

DISTRIBUCIOacuteN BINOMIAL

La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la

binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan

cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es

grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan

con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena

aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es

igual o menor que 005 En los casos en que se cumplen estas condiciones

podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media

de la distribucioacuten de Poisson

DISTRIBUCIOacuteN GEOMEacuteTRICA

En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten

probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores

discretos es

P(X = x) = p(1 - p)x - 1

Su funcioacuten de distribucioacuten es

El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media

estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2

Ejemplo

El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es

una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6

DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA

En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de

probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de

masa para valores es

Aqui (a sobre b) es el coeficiente binomial

El valor esperado de una variable aleatoria X de distribucioacuten

hipergeomeacutetrica es

Y su varianza

DISTRIBUCIOacuteN ZETA

En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad

discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos

es

Aqui ζ(s) es la funcioacuten zeta de Rieman con

El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto

DISTRIBUCION CHI CUADRADO

El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una

comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es

diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con

ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno

es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario

estas dos frecuencias acusan una diferencia significativa para por ejemplo un

nivel de significacioacuten del 5

El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la

asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada

por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito

bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor

del famoso libro Statistical Methods for Research Workers (1925) donde se

marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con

Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde

estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y

el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las

pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba

exacta de Fisher

Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico

publicitario presentado a grupos de clientes comparar la rentabilidad de un

proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos

de los turistas por determinados espacios geograacuteficos o por determinados

servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las

frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las

frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o

tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o

de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2

x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos

turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han

ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han

tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula

que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido

en los sitios A y B

Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es

independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo

A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces

alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este

anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos

empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de

las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51

La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten

igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es

2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del

Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del

5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206

podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para

suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B

Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias

observadas empiacutericamente de dos muestras con las frecuencias esperadas o

teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el

Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de

las materias primas perecederas Los resultados son seguacuten atributos cualitativos

los siguientes Primero veremos las frecuencias empiacutericas u observadas

Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten

Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son

131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas

Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y

fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres

columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta

maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x

120 260 = 6046 b2 = 129 x 120 260 = 5954

Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten

igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de

2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de

libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La

diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna

conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten

Es una medida de la discrepancia existente entre las frecuencias

observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso

de frecuencias () debido a que permite determinar las desviaciones entre ellas

ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la

expresioacuten

E

EOX

2

2

Donde

O frecuencia observada

E frecuencia teoacuterica esperada

TEST DE CHI-CUADRADO DE CONTINGENCIA

Un caso particular del test de chi-cuadrado que permite hacer un test sobre

la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-

cuadrado de contingencia Los dos caracteres observados en una misma

poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases

de se denotan las de por Tambieacuten vamos a

denotar

el efectivo conjunto de y es el nuacutemero de individuos para los

cuales toma el valor e el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

Estos valores se representan en una tabla de doble entrada conocida como

tabla de contingencia

Cada fila y cada columna corresponden a una submuestra particular La

fila de iacutendice es la distribucioacuten en las clases de los individuos para

los cuales el caraacutecter toma el valor La columna de iacutendice es la

distribucioacuten en las clases de los individuos para los cuales el caraacutecter

toma el valor Dividiendo las filas y las columnas por su suma se obtienen

frecuencias condicionales para cada una de las distribuciones empiacutericas Para

y las denotaremos por

y

Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y

los perfiles columna Para el modelo probabilista las observaciones provienen de

una muestra

de una ley bidimensional La hipoacutetesis a comprobar

es que los dos marginales de esta ley son independientes Si este es el caso los

perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna

de la de

y

Es equivalente a decir que las frecuencias conjuntas deben estar cerca de

los productos de las frecuencias marginales

Las frecuencias conjuntas por un lado (distribucioacuten observada) y los

productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen

dos distribuciones de probabilidad sobre el conjunto producto

Podemos por tanto calcular la distancia de

chi-cuadrado de una con respecto a la otra

Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la

distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale

Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la

definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado

Por lo dicho anteriormente para suficientemente grande podemos

aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el

nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados

a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las

que han sido estimadas Hay para el caraacutecter y para el caraacutecter

(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley

chi-cuadrado seraacute por tanto

Vamos a presentar un ejemplo de dos caracteres binarios que tienen que

ver con enfermos para los cuales se ha observado si tienen o no una tendencia al

suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y

neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las

tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla

de contingencia observada es

Tendencia Sin tendencia Total

Psicosis 20 180 200

Nneurosis 60 140 200

Total 80 320 400

La distancia de chi-cuadrado de contingencia calculada a partir de esta

tabla es de El valor tomado por el estadiacutegrafo es el cual

debemos comparar con la ley El p-valor es de

Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre

la tendencia al suicidio y la clasificacioacuten de las enfermedades

El test no precisa el sentido de esta dependencia Para describirla hay que

comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre

los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten

PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS

Los investigadores se interesan constantemente en las diferencias entre dos

poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado

civil profesioacuten color de ojos preferencia por una marca etc)

Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de

contingenciardquo

Se puede realizar una prueba para la diferencia entre dos proporciones

sobre la base de muestras independientes usaacutendose como instrumento la prueba

de chi cuadrado

El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es

la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se

podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda

Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la

ecuacioacuten

n

nnE CR

donde

nR nuacutemero total en el rengloacuten

nC nuacutemero total en la columna

n tamantildeo total de la muestra

El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado

entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia

al cuadrado se divide entre la frecuencia esperada de la celda

La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se

rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el

valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados

de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el

tamantildeo de la muestra

CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD

Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a

las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se

puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la

distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado

siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal

Por consiguiente al probar la diferencia entre las dos proporciones la

distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes

Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia

direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten

normal

La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede

ilustrar mediante el siguiente ejemplo

Cuartos de bantildeos modernos

Cocina moderna Caren

cia

existenc

ia

totales

Carencia 72 8 80

Existencia 7 146 153

La hipoacutetesis nula y alternativa seriacutean

YN ppH 0

YN ppH 0

Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de

significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute

Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H

A partir de la informacioacuten del cuadro

10080

8

N

NSN

n

Xp 95420

153

146

Y

YSY

n

Xp

A partir de la expresioacuten

21

21

111

nnpp

pPZ SS

donde

661015380

1468

p

por lo tanto

0813

153

1

80

133906610

95420100

Z

Totales 79 154 223

Dado que 1960813 Z se rechaza la 0H por lo tanto hay

diferencia entre las dos proporciones

Usando la prueba de chi cuadrado y la tabla de contingencia de este

ejemplo se tiene

Las frecuencias teoacutericas se pueden obtener a partir de la siguiente

ecuacioacuten

n

nnE CR

Por lo tanto se tiene

1227233

7980E 8852

233

15480E

8851233

79153E 12101

233

154153E

Chi cuadrado se obtiene a partir de la expresioacuten

E

EOX

2

2

A partir de la tabla se tiene

O E (O ndash E) (O ndash E)2

(O ndash E)2E

7

2

2

712

+4488 20142144 742704

7 5

188

- 4488 20142144 388245

8 5 -4488 20142144 380903

288

1

46

1

0112

+4488 20142144 199191

1711043

10431712 CALCULADOX

Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el

84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo

tanto hay diferencia entre las dos proporciones

Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la

distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos

distribuciones que a un nivel de significancia de 005 el valor de 196 es el

cuadrado de 3 841 es decir 22 ZX

CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA

La afirmacioacuten de que no existen diferencias entre proporciones significa

que las dos variables son independientes Cuando las conclusiones se presentan en

esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo

Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que

no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la

hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos

variables Independientemente de que la prueba de chi cuadrado se considera una

prueba de diferencia entre dos proporciones o una prueba de independencia los

caacutelculos y resultados son exactamente los mismos

CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE

Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o

intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que

ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de

probabilidades

Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que

seguir varios pasos Primero se tiene que establecer la distribucioacuten de

probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada

paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la

media) se deben establecer mediante hipoacutetesis o estimarlos con base a la

informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para

determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o

intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado

para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la

informacioacuten

BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON

La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de

Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la

cantidad de automoacuteviles estacionados en una cochera cubierta siguen una

distribucioacuten de Poisson 0H

En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero

de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una

muestra aleatoria de 233 casas

Numero de automoacuteviles Frecuencia

0 61

1 151

2 21

233

Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados

de la distribucioacuten de frecuencia

No de automoacuteviles Frecuencia observada On

0 61 0

1 151 151

2 21 42

233 193

808280233

193

1

n

On

X

n

i por lo tanto 80X

El valor de la media muestral se utilizara como el estimado de X

Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)

y se obtiene la frecuencia teoacuterica para cada una

Automoacutevil

n

Frecuencia

O

Probabilidad

XP

Frecuencia (E)

XPn

0 61 04493 104687

1 151 03595 87764

2 21 01438 33505

Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de

significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX

El valor calculado de chi cuadrado es

50679

2

2

K

CALCULADO

E

EOX

Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de

automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una

distribucioacuten de Poisson

CORRECCIOacuteN DE YATES

Cuando se aplican a datos discretos los resultados para distribuciones

continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres

comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de

Yates la cual viene dada mediante la expresioacuten

E

EOX CALCULADO

502

2

En general la correccioacuten se hace solamente cuando el numero de grados

de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos

resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en

relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia

esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi

cuadrado corregido y no corregido Si ambos valores conducen a la misma

conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se

presentan dificultades Si conducen a conclusiones diferentes se puede o bien

incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear

meacutetodos de probabilidad exactos

El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente

ejemplo

En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces

Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de

significancia del 005

No de caras Frecuencia Probabilidad Frecuencia (E)

Cara 115 05 100

cruce 85 05 100

2054

100

0510085

100

0510011522

2

CALCULADOX

Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado

con correccioacuten de Yates es

8432 TABULADOX

Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha

PRUEBA EXACTA DE FISHER

Para examinar la igualdad de las varianzas de dos poblaciones

independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de

las varianzas de las dos muestras Suponiendo que la informacioacuten de cada

poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2

2

2

1 SS sigue una

distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso

estadiacutestico RA Fisher

Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de

grados de libertad los grados de libertad en el numerador y en el denominador

la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea

2

2

2

111 21

S

SF nn

donde

n1 = tamantildeo de muestra en el grupo 1

n2 = tamantildeo de muestra en el grupo 2

n1 ndash 1 = grados de libertad en el grupo 1

n2 ndash 1 = grados de libertad en el grupo 2

2

1S varianza de la muestra en el grupo 1

2

2S varianza de la muestra en el grupo 2

Al probar la igualdad de dos varianzas se pueden emplear pruebas de una

cola o de dos colas

El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente

ejemplo

Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas

alta en la planta A que en la planta B Para determinar la variabilidad se puede

establecer una prueba de una cola en la forma siguiente

22 BAOH

22

1 BAH

Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta

A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta

ubicada en la cola superior de la distribucioacuten

Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de

libertad en el numerador y 19 en el denominador a un nivel de significancia de

001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene

71162 AS y 20142 BS por lo tanto

38512014

71162

2

1924 F como 1385 lt

292 no se rechaza la hipoacutetesis nula ( OH )

CONCLUSIOacuteN

La conclusioacuten que los resultados de una medida variable es la causa de

variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten

estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero

no puede reclamar legitimidad

La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en

describir la distribucioacuten de las variables estudiadas y en particular de los datos

numeacutericos Ademaacutes de las medidas descriptivas correspondientes el

comportamiento de estas variables puede explorarse graacuteficamente de un modo

muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro

organizador de las ciencias computarizadas y el modelo que nos dota de un

mejor razonamiento para implementar programas eficientes En este sentido la

combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un

reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en

colegios y universidades

Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de

combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y

evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras

loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre

operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten

juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la

teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones

simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades

que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea

BIBLIOGRAFIacuteA

AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis

Third Edition Texts in Statistical Science Chapman and Hall

BOXG E P HUNTER W G HUNTER JS (1978) Statistics for

Experimenters John Wiley amp Sons

BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores

Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de

Modelos Ed Revertsbquo SA

Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed

Piraacutemide

Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten

(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica

Matemaacutetica I Universidad de Antioquia

Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma

Madrid

Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill

Meacutexico

Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten

yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico

Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw

ndashHill 4ta Edicioacuten Colombia

CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana

Meacutexico

COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas

COX DR (1958) Planning of experiments New York John Wiley amp Sons

DANIEL C Applications of Statistics to Industrial Experimentation Willey

DAVIES OL The Design and Analysis of Industrial Experiments Hafner

(McMillan)

DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias

Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico

SA de CV Meacutexico

De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H

(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico

Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta

Estadiacutestica Editorial Microsoft corporation USA

ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial

Limusa SA Meacutexico

EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis

Arnold

FEDERER W (1965) Experimental design Oxford Publ Co

GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la

Varianza Grupo Editorial Universitario

FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico

McGraw Hill

FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque

ModernoEditorial SA Meacutexico

George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y

Meacutetodosrdquo Ed McGraw-Hill

GILL JL (1978) Design and Analysis of Experiments in the Animal and

Medical Sciences Iowa State University Press

JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression

and Experimental Design Springer-Verlag

Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor

Caracas

GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining

Institute

GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data

Mining Institute

Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial

Bourgeoacuten Caracas

Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la

EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute

Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial

BourgeoacutenCA Caracas ndash Venezuela

HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis

Multivariante 5ordf Edicioacuten Prentice Hall

JOBSON JD (1992) Applied Multivariate Data Analysis Volume II

Categorical and Multivariate Methods Springer-Verlag

KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial

Hispanoamericana Meacutexico

KIRK RE Experimental Design Procedures for the Behavioral Sciencies

BrooksCole Publishing Company

LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e

inferencia Estadiacutestica Editorial Limusa Meacutexico

LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV

Grupo Noriega Editores Meacutexico

LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial

HARLA Meacutexico

LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta

edicioacuten Editorial McGaw-Hill Usa

Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial

Hispanoameacuterica VI edicioacuten Meacutexico

LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire

Multidimensionnelle 3ordf Edition DUNOD

LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e

Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB

Caracas- Venezuela

LORENZEN T J Anderson V L (1993) Design of experiments A No-Name

Approach Marcel Dekker Inc

Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc

(1999) SPSS 90 Manual de Usuario SPSS Chicago

MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis

Academic Press

Enfocados hacia SPSS

Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de

wwwspssparatodoscom 2005

MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten

Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla

Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea

Ediciones Alfaomega SAN Meacutexico

MASON RL Statistical Design and Analysis of Experiments with Applications

to Engineering and Science John Wiley amp Sons New York

MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y

Economiacutea Editorial Iberoamericana Meacutexico

MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in

agriculture and experimental biology Second edition Chapman amp Hall

MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo

Editorial Iberoameacuterica

MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers

John Wiley amp Sons

Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial

Reverte Mejicana Meacutexico

Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da

Edicioacuten Meacutexico

Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc

Graw Hill

PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones

Editorial Limusa Meacutexico

NETER J et al Applied Linear Statistical Models Regression Analysis of

Variance and Experimental Designs Library of Congress Cataloging Publication

Data

OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp

RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo

Editorial Universitario

PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos

Lineales y Series Temporales Vol 1 y 2 Alianza Editorial

Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores

Spain SA Espantildea 2005

PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial

Mir Moscuacute

RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed

McGraw-Hill

Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca

UCV Caracas ndash Venezuela

RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE

Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en

Psicologiacuteardquo p 1

SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons

Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti

Caracas ndash Venezuela

Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores

deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico

Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica

Editorial Harla Meacutexico

STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y

procedimientos Segunda edicioacuten McGraw Hill

SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas

Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1

Ediciones UNESR Caracas

URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante

Coartiacuteculo Plan Nuevo Editorial AC

VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II

Anaacutelisis Multivariante) Mc-Graw Hill

Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows

Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea

2002

WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros

Editorial Interamericana Meacutexico

Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8

Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage

Learning Editores p 364 ISBN 9706861947

Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea

Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea

Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de

CV Meacutexico

Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para

Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico

DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR

httpesmwikipediaorgwikiSPSS

httpwwwbuenastareascomensayosque-es-el-SPSS1465478html

httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-

del-software-estadistico-integral-spss-base-160

httpesanswersyahoocomquestionindexqid=20070727073908aatuamw

httpwwwslidesharenetleticiagpestructura-de-spss-3126476

httpwwwehowenespanolcomprograma-spss-sobre_48697

httpwwwugres~bioestmedicinamanual_spsspdf

httpwwwmonografiascomtrabajos12tutortutorshtml

httpwwwspsscom

wwwspssparatodoscom

httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html

httpwwwspssfreecomcapitulotreshtml

httpwwwuvesRELIEVEemail relieveuves

httpwwwscribdcomdochellipspss-introduccioacuten

httpeswikipediaorgwikiSPSS

httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd

f

httpwwwspsscomaressuccessargentinashtml

httpeswikipediaorgwikiSPSS

httpwww-01ibmcomsoftwareesanalyticsspss

httppsicofcepurvesspssindex0htm

httpssitesgooglecomsiteestadisticaconelspss

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpe-stadisticabioucmesweb_spssindice_spsshtml

httpwwwquimicaurvesquimiogeneralanovacastpdf

httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da

tosyMultivariable14anova1_SPSSpdf

httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800

20AnE1lisis20de20Varianzaspdf

httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-

pearson

httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf

httpwwwuoceduin3emathdocsRegresionLinealpdf

httpeswikipediaorgwikiRegresiC3B3n_lineal

httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES

ION_LINEAL_CON_SPSSpdf

httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN

EAL20SIMPLE20CON20SPSSpdf

httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE

SION_LINEAL_CON_SPSSpdf

httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm

httpeswikipediaorgwikiNivel_de_medida

httphtmlrincondelvagocomregresion-lineal-simplehtml

httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp

lepdf

httpwwwvitutorcomestadisticabi8html

httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf

httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-

Martinez_1pdf

httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml

httpesslidesharenetpatolinkecuacin-de-regresin-lineal

httpeswikipediaorgwikiMC3ADnimos_cuadrados

httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios

httpwwwwordreferencecomdefinicioncorrelaciC3B3n

httpwwwditutorcomestadistica_2correlacion_estadisticahtml

httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson

httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n

httpeswikipediaorgwikiMatriz_de_correlaciC3B3n

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpwwwinfecepiunizares

httpwwwltbioestadisticaumaes

httpwwwuaqmxmatematicasestadisticasxu3html

httpwwwmembers-americastripodcom

httpwwwmsiplceorg

httpwwwbnvcocrsesionnotaaspg

httpwwwaltavistacom

httpwwwauyantepuycom

httpwwwinees

httpwwwudeccl

httpwwwrincondelvagocom

httpwwwmonografiascom

httpwwwfestadisticafguamesindicadoresiprihtml

httpwwwuaqmxmatematicasestadisticaxu3html

httpwwwinegoboiwd0801htmlE

httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm

httpwwwitlpedumx

httpwwweclaevespanovestadisticasna93nnsnann7eshtml

httpw3moritesmmx~cmendozamaestestoohtml

httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml

httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion

httpwwwunleduarfaveseiencuestasindexhtml

httpwwwmonografiascomtrabajos11operaoperashtml

httpwwwmonografiascomtrabajos6hisohisoshtml

httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos

httpwwwmonografiascomtrabajos16sistema-operativosistema-

operativoshtmlTIPPOS

httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-

operativoshtml

httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei

httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml

httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-

operativo

httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software

httpwwwsscccoclinformaticaconceptoshtml

httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr

httpwwwcadcommxhistoria_de_la_computacionhtm

httpwwweswikipediaorgwikiBus_(informC3A1tica)

httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla

httpwwwcavsicompreguntasrespuestasque-es-el-teclado

httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm

Page 18: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,

Prueba de aleatoriedad

Con frecuencia se supone que los datos recopilados constituyen una

muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la

utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash

Wolfowitz de corridas de una muestra para aleatoriedadrdquo

Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o

la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos

siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la

partida tiene una propiedad en particular o de la cantidad o magnitud en que se

posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la

sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con

distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente

de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que

la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las

partidas que la preceden o las que la suceden en forma tal que la probabilidad de

su ocurrencia varia de una posicioacuten a otra el proceso no se considera como

aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando

esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en

forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico

Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el

tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico

de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una

prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede

rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la

sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de

una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2

exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por

consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis de aleatoriedad

U

UUZ

donde

U = numero total de corridas

U = valor medio de U 12 21

n

nnU

U = desviacioacuten estaacutendar de U 1

222

2121

nn

nnnnnU

n1 = numero de eacutexitos en la muestra

n2 = numero de fracasos en la muestra

n = tamantildeo de la muestra n = n1 + n2

PRUEBA DE McNEMAR

Suele darse el caso en que se desean comparar las proporciones de los

datos de muestras tomados de poblaciones relacionadas En este caso se quisiera

determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a

alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea

determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y

otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede

utilizar la prueba desarrollada por McNemar

El principal intereacutes es determinar si hay diferencia entre las dos

proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta

que el otro (prueba de una cola)

La prueba estadiacutestica para la prueba de McNemar es

CB

CBZ

PRUEBA U DE MANN ndash WHITNEY

Es una alternativa no parametrica a la prueba t de dos muestras para la

diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula

μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos

la forma de distribuciones normales de hecho la prueba solo requiere que las

poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no

importa si se cumple o no esta suposicioacuten

Estadiacutesticos U1 y U2

111

2112

1 W

nnnnU

222

2122

1 W

nnnnU

PRUEBA DE RACHAS

Son todas las diferencias que tiene el mismo signo y se presentan en una

misma fila Una serie de n diferencias puede tener solamente una racha (toda

positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las

rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de

poblaciones con la misma distribucioacuten de frecuencias Colocamos las

observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces

contamos el numero de rachas item de cada una de las muestras Si hay menos

rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales

rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten

La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de

que las observaciones se han sacado aleatoriamente de una sola poblacioacuten

Para hacer esto se halla la mediana de la muestra y se designa las

observaciones situadas por debajo de la mediana por un signo menos (-) y las

observaciones situadas por encima de la mediana por un signo (+) Si el numero

de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado

rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el

numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10

puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la

tabla normal con

u

uu

z

2

1

12

21

21

NN

NNu

)1()(

2(2

21

2

21

2121212

NNNN

NNNNNNu

DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES

DISTRIBUCIONES DE EJEMPLO Y USO

DISTRIBUCIOacuteN NORMAL O GAUSSIANA

Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que

multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal

Esta distribucioacuten de caracteriza porque los valores se distribuyen formando

una campana de Gauss en torno a un valor central que coincide con el valor

medio de la distribucioacuten

Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a

la izquierda

Esta distribucioacuten viene definida por dos paraacutemetros

X N (m S2)

m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro

de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores

estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores

estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de

ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten

estaacutendar

Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina

normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo

que permiten obtener esos mismos valores donde se recoge la probabilidad

acumulada para cada punto de la curva de esta distribucioacuten

Ademaacutes toda distribucioacuten normal se puede transformar en una normal

tipificada

Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con

media 10 y varianza 4 Transformarla en una normal tipificada

X N (10 4)

Para transformarla en una normal tipificada se crea una nueva variable (Y)

que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica

(que es la raiacutez cuadrada de la varianza)

En el ejemplo la nueva variable seriacutea

Esta nueva variable se distribuye como una normal tipificada

permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor

Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos

indicado de que las probabilidades para cada valor de la curva se encuentran

recogidas en una tabla

MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)

La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten

normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta

distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros

y lo que representamos del modo si su funcioacuten de densidad

es

Observacioacuten

Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y

la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes

adelante65

La forma de la funcioacuten de densidad es la llamada campana de Gauss

Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten

normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1

Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un

uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto

con lo cual en coinciden la media la mediana

y la moda y por uacuteltimo calcular sus puntos de inflexioacuten

El soporte de la distribucioacuten es todo de modo que la mayor parte de la

masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se

encuentra concentrado alrededor de la media y las ramas de la curva se extienden

asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la

media es posible (aunque poco probable)

La forma de la campana de Gauss depende de los paraacutemetros y

indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)

Figura Distribuciones gaussianas con diferentes medias e igual

dispersioacuten

(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor

sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor

de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea

``maacutes aplastado seraacute

Figura Distribuciones gaussianas con igual media pero varianza

diferente

La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes

adelante que es

Como consecuencia la distribucioacuten normal es reproductiva con respecto a

los paraacutemetros y ya que

Observacioacuten

Como se ha mencionado anteriormente la ley de probabilidad gaussiana la

encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza

por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el

de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que

apuntar un hecho negativo para esta ley de probabilidad

La funcioacuten no posee primitiva66

conocida67

Las consecuencias desde el punto de vista praacutectico son importantes ya que

eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de

la normal y nos tenemos que limitar a decir que

sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente

esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho

puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto

se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en

problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde

se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie

limitada de valores xi dados Normalmente F se encuentra tabulada para una

distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten

normal tipificada

En el caso de que tengamos una distribucioacuten diferente se

obtiene Z haciendo el siguiente cambio

De manera general se tiene

Proposicioacuten (Cambio de origen y escala)

Sean Entonces

Este resultado puede ser utilizado del siguiente modo Si y nos

interesa calcular

1 Hacemos el cambio y calculamos

2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de

modo aproximado) Como

tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada

Ejemplo

Supongamos que cierto fenoacutemeno pueda ser representado mediante una

va y queremos calcular la probabilidad de que Xtome un valor

entre 39 y 48 es decir

Comenzamos haciendo el cambio de variable

de modo que

Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que

hemos mencionado anteriormente

Proposicioacuten

Sea Entonces

Demostracioacuten

Por ser la normal una ley de probabilidad se tiene que

es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con

respecto a se obtiene el valor 0

luego

Para demostrar la igualdad entre la y basta con aplicar la misma

teacutecnica pero esta vez derivando con respecto a

Luego

Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en

primer lugar la va tipificada de X

y calculamos

Como por la proposicioacuten 5 deducimos que

CURVA NORMAL ESTANDARIZADA

Una variable numeacuterica puede clasificarse como discreta o continua Las

variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas

con la idea de contar Las variables continuas se pueden asociar con la idea de

medir utilizando fracciones y decimales Cuando la variable es continua el

modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal

El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten

normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran

cantidad de variables continuas

El modelo matemaacutetico

La funcioacuten matemaacutetica que se usa como modelo es

e = 271

π = 314

μx = media de la poblacioacuten

σx = desviacioacuten estaacutendar de la poblacioacuten

x = un valor de la variable continua

Como e y π son constantes la forma de la curva normal depende

solamente de los dos parametros de la distribucioacuten normal la media μx y la

desviacioacuten estaacutendar σx

Las diferentes curvas normales van a variar dependiendo de esos dos

paraacutemetros

En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar

visualmente como una curva en forma de campana El aacuterea debajo de esta curva se

halla por medio del integral de la funcioacuten y corresponde al por ciento o la

proporcioacuten de puntuaciones que se encuentran en el intervalo dado

Propiedades de las distribuciones normales

a Son simeacutetricas y tienen forma de campana

b Al ser simeacutetricas la media la moda y la mediana coinciden

c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea

de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media

d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la

curva se encuentra a tres desviaciones estaacutendar de la media

En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral

de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de

diferentes secciones de la curva o se utiliza la computadora para calcular ese valor

del aacuterea

La distribucioacuten normal estandarizada

Puesto que hay un nuacutemero infinito de combinaciones para los dos

paraacutemetros hay un nuacutemero infinito de curvas normales diferentes

Este problema se ha resuelto praacutecticamente al transformar los valores de

todas las distribuciones normales a los valores de una distribucioacuten normal

estandarizada representada por la curva normal estandarizada (standard normal

curve)

Las puntuaciones estandarizadas se logran restando la media a cada

observacioacuten y dividiendo entre la desviacioacuten estaacutendar

donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar

Propiedades de la distribucioacuten normal estandarizada

μ z = 0

σ z = 1

En muchas ocasiones se quieren comparar puntuaciones que pertenecen a

dos distribuciones normales diferentes La diferencia entre las dos distribuciones

radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo

la comparacioacuten se hace posible si se convierten las puntuaciones de ambas

distribuciones a puntuaciones z que corresponden a la distribucioacuten normal

estandarizada

Percentiles y rangos percentiles de una distribucioacuten normal estandarizada

Si se desea hallar la percentiles o el rango percentil en una distribucioacuten

normal no estandarizada se recurre al procedimiento de convertir las puntuaciones

de la distribucioacuten normal dada a puntuaciones z que corresponden a la

distribucioacuten normal estandarizada

Estos valores en la distribucioacuten normal estandarizada se pueden obtener

por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en

las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el

intervalo dado

Es necesario visualizar siempre el aacuterea debajo de la curva como el por

ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo

dado

Cuando una distribucioacuten de puntuaciones es normal estandarizada la

pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar

en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o

cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten

dada

DISTRIBUCIOacuteN GAMMA

Una variable aleatoria X asociada a un experimento aleatorio tiene una

distribucioacuten GAMMA si se caracteriza por las siguientes propiedades

Algunas alternativas de funciones de densidad se pueden ver en la graacutefica

del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)

respectivamente =1

=1

La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo

III

El modelo Gamma se ha utilizado frecuentemente en variables tales como

ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el

intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson

ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900

ndash Flujos maacuteximos MARKOVIC 1965

ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965

ndash Altura de la precipitacioacuten mensual WHITCOMB 1940

ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia

infin

ndash Ingresos familiares

ndash Edad del hombre al contraer matrimonio por primera vez

ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en

subestaciones a una frecuencia part

Ejemplo

Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos

de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia

promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo

de tiempo se encuentre hasta que ocurre el segundo ciclo

a Dentro de una desviacioacuten con respecto del tiempo promedio

b A maacutes de dos desviaciones por encima de la media

Solucioacuten

X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en

horas

Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)

= 2

Y Nuacutemero de ciclos hora ---------Y~P( =002)

E(Y) = 002 =

X ~ G(2 002)

Ejemplo

En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de

kilovatios por hora puede considerarse como una variable aleatoria con

distribucioacuten GAMMA de paraacutemetros = 3 y

= 05

La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de

KWhora

iquestCuaacutel es la probabilidad de que este abastecimientos sea

a Insuficiente en un diacutea cualquiera

b Se consuman entre 3 y 8 millones de K WHora

c c Encuentre E(x) y V(x)

SOLUCIOacuteN

DISTRIBUCIOacuteN PARETO

En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad

continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores

es

Su funcioacuten de distribucioacuten es

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto

son

El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (

DISTRIBUCIOacuteN T DE STUDENT

Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una

distribucioacuten t con n grados de libertad

Cuando n--gtinfinito a curva t coincide com la normal estandarizada

FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX

MOMENTOS

La distribucioacuten -Student se construye como un cociente entre una normal

y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-

Student con n grados de libertad a la de una va T

donde Este tipo de distribuciones aparece cuando

tenemos n+1 va independientes

y nos interesa la distribucioacuten de

La funcioacuten de densidad de es

Figura Funcioacuten de densidad de una de Student

La distribucioacuten de Student tiene propiedades parecidas a

Es de media cero y simeacutetrica con respecto a la misma

Es algo maacutes dispersa que la normal pero la varianza decrece hasta

1 cuando el nuacutemero de grados de libertad aumenta

Figura Comparacioacuten entre las funciones de densidad de y

Para un nuacutemero alto de grados de libertad se puede aproximar la

distribucioacuten de Student por la normal es decir

Figura Cuando aumentan los grados de libertad la distribucioacuten de

Student se aproxima a la distribucioacuten normal tipificada

Para calcular

DISTRIBUCIOacuteN BETA

Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede

representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un

intervalo de longitud finita Tales como

Proporcioacuten de impurezas en un producto quiacutemico

La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten

La proporcioacuten vendida de un lote durante un tiempo t

La humedad relativa medida en cierto lugar

Porcentaje del costo total destinado a reparacioacuten de maquinaria

Porcentaje de costo adicional destinado a reparacioacuten de maquinaria

La distribucioacuten del tiempo necesario para completar una fase del proyecto

PERT

Evaluacioacuten de programas y teacutecnicas de revisioacuten

Ejemplo

La proporcioacuten de tramos de una autopista que requieren repararse

semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros

= 3 y =2

a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten

b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista

requieren reparacioacuten en un antildeo cualquiera

DISTRIBUCIOacuteN CAUCHY

En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de

Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es

donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene

valor esperado ni varianza

Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V

2 lt 1 el

numero U V tiene la distribucioacuten Cauchy

La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un

grado de libertad

Ejemplo

Sean y dos observaciones independientes de una distribucioacuten

Cauchy con funcioacuten de densidad

Puede demostrarse que si y son tales que entonces la

funcioacuten de verosimilitud de es bimodal

Sean y Supongamos que se desea hacer inferencias sobre el

valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa

Especiacuteficamente interesa encontrar la distribucioacuten final de

Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la

distribucioacuten final de tiene una forma complicada Es conveniente notar sin

embargo que corresponde a la densidad marginal de respecto a la

densidad conjunta

DISTRIBUCIOacuteN BERNOULLI

Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto

suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el

que no lo sea (fracaso) En realidad no se trata maacutes que de una variable

dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello

que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas

obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la

situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este

experimento mediante una va discreta Xque toma los valores X=0 si el suceso no

ocurre y X=1 en caso contrario y que se denota

Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar

una moneda al aire y considerar la va

Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de

probabilidad es

y su funcioacuten de distribucioacuten

Su funcioacuten caracteriacutestica es

Los principales momentos de la X los podemos calcular directamente

o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina

Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)

cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de

intentos

CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE

BERNOULLI

Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la

probabilidad y asegurar que se cumplen las tres condiciones necesarias en

particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del

resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3

requiere que los ensayos o intentos de un proceso de Bernoulli sean

estadiacutesticamente independientes es decir que el resultado de un intento no puede

afectar de ninguacuten modo el resultado de cualquier otro intento

DISTRIBUCIOacuteN EXPONENCIAL

Modelo para variable aleatoria continua que permite representar variables

del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos

Componentes

En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de

probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para

valores x gt 0 es

f(x) = λe - λx

Su funcioacuten de distribucioacuten es

Aqui e significa el nuacutemero e

El valor esperado y la varianza de una variable aleatoria X con

distribucioacuten exponencial son

E[X] = 1 λ

V(X) = 1 λ2

Ejemplo

Ejemplos para la distribucioacuten exponencial son los tiempos dentro

accidentes con probabilidad invariable

La funcioacuten de densidad para λ igual 05 10 y 15

DISTRIBUCIOacuteN MULTINOMIAL

La distribucioacuten multinomial es similar a la distribucioacuten binomial con la

diferencia de que en lugar de dos posibles resultados en cada ensayo

La distribucioacuten multinomial sigue el siguiente modelo

Donde

X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo

que el partido POPO lo hayan votado 3 personas)

n indica el nuacutemero de veces que se ha repetido el suceso (en el

ejemplo 5 veces)

n es factorial de n (en el ejemplo 5 4 3 2 1)

p1 es la probabilidad del suceso X1 (en el ejemplo el 40)

Veamos el ejemplo

Luego

P = 00256

Es decir que la probabilidad de que las 5 personas elegidas hayan votado

de esta manera es tan soacutelo del 256

Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1

Veamos otro ejemplo

En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el

40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4

invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos

Aplicamos el modelo

LuegoP = 00384

Por lo tanto la probabilidad de que el grupo esteacute formado por personas de

estos paiacuteses es tan soacutelo del 384

DISTRIBUCIOacuteN UNIFORME

En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de

probabilidad cuyos valores tienen la misma probabilidad

Caso discreto

Su funcioacuten de probabilidad es en el caso discreto con valores posibles

p(xi) = 1 n

Su funcioacuten de distribucioacuten es en el caso discreto

Su media estadiacutestica es

Caso continuo

Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b

La funcioacuten de densidad en el caso continuo entre a y b es

Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12

Ejemplos

Para un dado perfecto todos los resultados tienen la misma probabilidad 1

6

Calcular variables aleatorias

Las variables aleatorias de probabilidad uniforme pueden calcularse con un

generador de variables aleatorias

DISTRIBUCIOacuteN BINOMIAL

En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad

discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con

probabilidad p de un eacutexito

Su funcioacuten de densidad es

Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)

posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos

((1 - p)n - x

)

El valor esperado de una variable aleatoria de probabilidad binominal es

E[x] = np y su varianza V[x] = np(1 - p)

DISTRIBUCIOacuteN BINOMIAL NEGATIVA

Sobre una sucesioacuten de va de Bernouilli independientes

Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r

eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de

distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo

Su ley de probabilidad se deduce siguiendo el esquema

De nuevo el conjunto de posibles valores de esta va discreta es

Su funcioacuten caracteriacutestica es

y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima

Ejemplo

Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en

operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal

que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda

definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para

intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus

5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones

que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se

necesiten 10 intervenciones

Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por

una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan

4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso

Identificando los paraacutemetros se tiene

Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el

nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy

simple

Y=X+r

Luego

Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente

es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de

que X=10-4=6 Por tanto

La distribucioacuten binomial negativa tambieacuten se puede definir como el

nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas

contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que

DISTRIBUCIOacuteN DE POISSON

Modelo para variable aleatoria discreta que permite calcular la

probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten

discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo

muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos

o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual

a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es

independiente de cuaacutendo se presenta dicho periacuteodo

En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de

probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos

es

Aquiacute e significa el nuacutemero e y x significa el factorial de x

La distribucion de Poisson describe el nuacutemero de sucesos en una unidad

de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un

proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens

en una carrera

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten

Poisson son

E[X] = V[X] = λ

La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos

entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un

conmutador la demanda (necesidades) de los pacientes que requieren servicio en

una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el

nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos

ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una

variable aleatoria discreta que toma valores enteros (0 1 2)

Caacutelculo de la probabilidad de Poisson

La letra X por lo general representa a una variable discreta y puede tomar

valores enteros Utilizamos la letra X para representar a la variable aleatoria y la

letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La

probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson

se calcula con la foacutermula

LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA

DISTRIBUCIOacuteN BINOMIAL

La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la

binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan

cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es

grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan

con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena

aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es

igual o menor que 005 En los casos en que se cumplen estas condiciones

podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media

de la distribucioacuten de Poisson

DISTRIBUCIOacuteN GEOMEacuteTRICA

En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten

probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores

discretos es

P(X = x) = p(1 - p)x - 1

Su funcioacuten de distribucioacuten es

El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media

estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2

Ejemplo

El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es

una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6

DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA

En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de

probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de

masa para valores es

Aqui (a sobre b) es el coeficiente binomial

El valor esperado de una variable aleatoria X de distribucioacuten

hipergeomeacutetrica es

Y su varianza

DISTRIBUCIOacuteN ZETA

En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad

discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos

es

Aqui ζ(s) es la funcioacuten zeta de Rieman con

El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto

DISTRIBUCION CHI CUADRADO

El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una

comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es

diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con

ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno

es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario

estas dos frecuencias acusan una diferencia significativa para por ejemplo un

nivel de significacioacuten del 5

El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la

asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada

por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito

bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor

del famoso libro Statistical Methods for Research Workers (1925) donde se

marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con

Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde

estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y

el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las

pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba

exacta de Fisher

Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico

publicitario presentado a grupos de clientes comparar la rentabilidad de un

proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos

de los turistas por determinados espacios geograacuteficos o por determinados

servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las

frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las

frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o

tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o

de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2

x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos

turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han

ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han

tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula

que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido

en los sitios A y B

Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es

independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo

A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces

alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este

anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos

empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de

las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51

La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten

igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es

2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del

Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del

5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206

podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para

suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B

Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias

observadas empiacutericamente de dos muestras con las frecuencias esperadas o

teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el

Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de

las materias primas perecederas Los resultados son seguacuten atributos cualitativos

los siguientes Primero veremos las frecuencias empiacutericas u observadas

Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten

Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son

131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas

Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y

fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres

columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta

maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x

120 260 = 6046 b2 = 129 x 120 260 = 5954

Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten

igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de

2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de

libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La

diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna

conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten

Es una medida de la discrepancia existente entre las frecuencias

observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso

de frecuencias () debido a que permite determinar las desviaciones entre ellas

ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la

expresioacuten

E

EOX

2

2

Donde

O frecuencia observada

E frecuencia teoacuterica esperada

TEST DE CHI-CUADRADO DE CONTINGENCIA

Un caso particular del test de chi-cuadrado que permite hacer un test sobre

la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-

cuadrado de contingencia Los dos caracteres observados en una misma

poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases

de se denotan las de por Tambieacuten vamos a

denotar

el efectivo conjunto de y es el nuacutemero de individuos para los

cuales toma el valor e el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

Estos valores se representan en una tabla de doble entrada conocida como

tabla de contingencia

Cada fila y cada columna corresponden a una submuestra particular La

fila de iacutendice es la distribucioacuten en las clases de los individuos para

los cuales el caraacutecter toma el valor La columna de iacutendice es la

distribucioacuten en las clases de los individuos para los cuales el caraacutecter

toma el valor Dividiendo las filas y las columnas por su suma se obtienen

frecuencias condicionales para cada una de las distribuciones empiacutericas Para

y las denotaremos por

y

Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y

los perfiles columna Para el modelo probabilista las observaciones provienen de

una muestra

de una ley bidimensional La hipoacutetesis a comprobar

es que los dos marginales de esta ley son independientes Si este es el caso los

perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna

de la de

y

Es equivalente a decir que las frecuencias conjuntas deben estar cerca de

los productos de las frecuencias marginales

Las frecuencias conjuntas por un lado (distribucioacuten observada) y los

productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen

dos distribuciones de probabilidad sobre el conjunto producto

Podemos por tanto calcular la distancia de

chi-cuadrado de una con respecto a la otra

Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la

distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale

Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la

definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado

Por lo dicho anteriormente para suficientemente grande podemos

aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el

nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados

a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las

que han sido estimadas Hay para el caraacutecter y para el caraacutecter

(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley

chi-cuadrado seraacute por tanto

Vamos a presentar un ejemplo de dos caracteres binarios que tienen que

ver con enfermos para los cuales se ha observado si tienen o no una tendencia al

suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y

neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las

tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla

de contingencia observada es

Tendencia Sin tendencia Total

Psicosis 20 180 200

Nneurosis 60 140 200

Total 80 320 400

La distancia de chi-cuadrado de contingencia calculada a partir de esta

tabla es de El valor tomado por el estadiacutegrafo es el cual

debemos comparar con la ley El p-valor es de

Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre

la tendencia al suicidio y la clasificacioacuten de las enfermedades

El test no precisa el sentido de esta dependencia Para describirla hay que

comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre

los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten

PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS

Los investigadores se interesan constantemente en las diferencias entre dos

poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado

civil profesioacuten color de ojos preferencia por una marca etc)

Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de

contingenciardquo

Se puede realizar una prueba para la diferencia entre dos proporciones

sobre la base de muestras independientes usaacutendose como instrumento la prueba

de chi cuadrado

El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es

la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se

podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda

Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la

ecuacioacuten

n

nnE CR

donde

nR nuacutemero total en el rengloacuten

nC nuacutemero total en la columna

n tamantildeo total de la muestra

El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado

entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia

al cuadrado se divide entre la frecuencia esperada de la celda

La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se

rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el

valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados

de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el

tamantildeo de la muestra

CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD

Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a

las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se

puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la

distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado

siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal

Por consiguiente al probar la diferencia entre las dos proporciones la

distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes

Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia

direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten

normal

La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede

ilustrar mediante el siguiente ejemplo

Cuartos de bantildeos modernos

Cocina moderna Caren

cia

existenc

ia

totales

Carencia 72 8 80

Existencia 7 146 153

La hipoacutetesis nula y alternativa seriacutean

YN ppH 0

YN ppH 0

Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de

significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute

Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H

A partir de la informacioacuten del cuadro

10080

8

N

NSN

n

Xp 95420

153

146

Y

YSY

n

Xp

A partir de la expresioacuten

21

21

111

nnpp

pPZ SS

donde

661015380

1468

p

por lo tanto

0813

153

1

80

133906610

95420100

Z

Totales 79 154 223

Dado que 1960813 Z se rechaza la 0H por lo tanto hay

diferencia entre las dos proporciones

Usando la prueba de chi cuadrado y la tabla de contingencia de este

ejemplo se tiene

Las frecuencias teoacutericas se pueden obtener a partir de la siguiente

ecuacioacuten

n

nnE CR

Por lo tanto se tiene

1227233

7980E 8852

233

15480E

8851233

79153E 12101

233

154153E

Chi cuadrado se obtiene a partir de la expresioacuten

E

EOX

2

2

A partir de la tabla se tiene

O E (O ndash E) (O ndash E)2

(O ndash E)2E

7

2

2

712

+4488 20142144 742704

7 5

188

- 4488 20142144 388245

8 5 -4488 20142144 380903

288

1

46

1

0112

+4488 20142144 199191

1711043

10431712 CALCULADOX

Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el

84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo

tanto hay diferencia entre las dos proporciones

Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la

distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos

distribuciones que a un nivel de significancia de 005 el valor de 196 es el

cuadrado de 3 841 es decir 22 ZX

CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA

La afirmacioacuten de que no existen diferencias entre proporciones significa

que las dos variables son independientes Cuando las conclusiones se presentan en

esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo

Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que

no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la

hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos

variables Independientemente de que la prueba de chi cuadrado se considera una

prueba de diferencia entre dos proporciones o una prueba de independencia los

caacutelculos y resultados son exactamente los mismos

CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE

Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o

intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que

ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de

probabilidades

Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que

seguir varios pasos Primero se tiene que establecer la distribucioacuten de

probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada

paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la

media) se deben establecer mediante hipoacutetesis o estimarlos con base a la

informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para

determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o

intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado

para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la

informacioacuten

BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON

La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de

Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la

cantidad de automoacuteviles estacionados en una cochera cubierta siguen una

distribucioacuten de Poisson 0H

En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero

de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una

muestra aleatoria de 233 casas

Numero de automoacuteviles Frecuencia

0 61

1 151

2 21

233

Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados

de la distribucioacuten de frecuencia

No de automoacuteviles Frecuencia observada On

0 61 0

1 151 151

2 21 42

233 193

808280233

193

1

n

On

X

n

i por lo tanto 80X

El valor de la media muestral se utilizara como el estimado de X

Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)

y se obtiene la frecuencia teoacuterica para cada una

Automoacutevil

n

Frecuencia

O

Probabilidad

XP

Frecuencia (E)

XPn

0 61 04493 104687

1 151 03595 87764

2 21 01438 33505

Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de

significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX

El valor calculado de chi cuadrado es

50679

2

2

K

CALCULADO

E

EOX

Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de

automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una

distribucioacuten de Poisson

CORRECCIOacuteN DE YATES

Cuando se aplican a datos discretos los resultados para distribuciones

continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres

comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de

Yates la cual viene dada mediante la expresioacuten

E

EOX CALCULADO

502

2

En general la correccioacuten se hace solamente cuando el numero de grados

de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos

resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en

relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia

esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi

cuadrado corregido y no corregido Si ambos valores conducen a la misma

conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se

presentan dificultades Si conducen a conclusiones diferentes se puede o bien

incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear

meacutetodos de probabilidad exactos

El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente

ejemplo

En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces

Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de

significancia del 005

No de caras Frecuencia Probabilidad Frecuencia (E)

Cara 115 05 100

cruce 85 05 100

2054

100

0510085

100

0510011522

2

CALCULADOX

Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado

con correccioacuten de Yates es

8432 TABULADOX

Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha

PRUEBA EXACTA DE FISHER

Para examinar la igualdad de las varianzas de dos poblaciones

independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de

las varianzas de las dos muestras Suponiendo que la informacioacuten de cada

poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2

2

2

1 SS sigue una

distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso

estadiacutestico RA Fisher

Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de

grados de libertad los grados de libertad en el numerador y en el denominador

la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea

2

2

2

111 21

S

SF nn

donde

n1 = tamantildeo de muestra en el grupo 1

n2 = tamantildeo de muestra en el grupo 2

n1 ndash 1 = grados de libertad en el grupo 1

n2 ndash 1 = grados de libertad en el grupo 2

2

1S varianza de la muestra en el grupo 1

2

2S varianza de la muestra en el grupo 2

Al probar la igualdad de dos varianzas se pueden emplear pruebas de una

cola o de dos colas

El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente

ejemplo

Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas

alta en la planta A que en la planta B Para determinar la variabilidad se puede

establecer una prueba de una cola en la forma siguiente

22 BAOH

22

1 BAH

Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta

A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta

ubicada en la cola superior de la distribucioacuten

Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de

libertad en el numerador y 19 en el denominador a un nivel de significancia de

001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene

71162 AS y 20142 BS por lo tanto

38512014

71162

2

1924 F como 1385 lt

292 no se rechaza la hipoacutetesis nula ( OH )

CONCLUSIOacuteN

La conclusioacuten que los resultados de una medida variable es la causa de

variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten

estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero

no puede reclamar legitimidad

La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en

describir la distribucioacuten de las variables estudiadas y en particular de los datos

numeacutericos Ademaacutes de las medidas descriptivas correspondientes el

comportamiento de estas variables puede explorarse graacuteficamente de un modo

muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro

organizador de las ciencias computarizadas y el modelo que nos dota de un

mejor razonamiento para implementar programas eficientes En este sentido la

combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un

reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en

colegios y universidades

Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de

combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y

evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras

loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre

operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten

juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la

teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones

simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades

que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea

BIBLIOGRAFIacuteA

AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis

Third Edition Texts in Statistical Science Chapman and Hall

BOXG E P HUNTER W G HUNTER JS (1978) Statistics for

Experimenters John Wiley amp Sons

BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores

Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de

Modelos Ed Revertsbquo SA

Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed

Piraacutemide

Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten

(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica

Matemaacutetica I Universidad de Antioquia

Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma

Madrid

Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill

Meacutexico

Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten

yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico

Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw

ndashHill 4ta Edicioacuten Colombia

CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana

Meacutexico

COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas

COX DR (1958) Planning of experiments New York John Wiley amp Sons

DANIEL C Applications of Statistics to Industrial Experimentation Willey

DAVIES OL The Design and Analysis of Industrial Experiments Hafner

(McMillan)

DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias

Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico

SA de CV Meacutexico

De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H

(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico

Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta

Estadiacutestica Editorial Microsoft corporation USA

ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial

Limusa SA Meacutexico

EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis

Arnold

FEDERER W (1965) Experimental design Oxford Publ Co

GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la

Varianza Grupo Editorial Universitario

FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico

McGraw Hill

FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque

ModernoEditorial SA Meacutexico

George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y

Meacutetodosrdquo Ed McGraw-Hill

GILL JL (1978) Design and Analysis of Experiments in the Animal and

Medical Sciences Iowa State University Press

JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression

and Experimental Design Springer-Verlag

Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor

Caracas

GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining

Institute

GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data

Mining Institute

Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial

Bourgeoacuten Caracas

Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la

EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute

Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial

BourgeoacutenCA Caracas ndash Venezuela

HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis

Multivariante 5ordf Edicioacuten Prentice Hall

JOBSON JD (1992) Applied Multivariate Data Analysis Volume II

Categorical and Multivariate Methods Springer-Verlag

KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial

Hispanoamericana Meacutexico

KIRK RE Experimental Design Procedures for the Behavioral Sciencies

BrooksCole Publishing Company

LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e

inferencia Estadiacutestica Editorial Limusa Meacutexico

LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV

Grupo Noriega Editores Meacutexico

LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial

HARLA Meacutexico

LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta

edicioacuten Editorial McGaw-Hill Usa

Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial

Hispanoameacuterica VI edicioacuten Meacutexico

LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire

Multidimensionnelle 3ordf Edition DUNOD

LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e

Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB

Caracas- Venezuela

LORENZEN T J Anderson V L (1993) Design of experiments A No-Name

Approach Marcel Dekker Inc

Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc

(1999) SPSS 90 Manual de Usuario SPSS Chicago

MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis

Academic Press

Enfocados hacia SPSS

Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de

wwwspssparatodoscom 2005

MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten

Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla

Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea

Ediciones Alfaomega SAN Meacutexico

MASON RL Statistical Design and Analysis of Experiments with Applications

to Engineering and Science John Wiley amp Sons New York

MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y

Economiacutea Editorial Iberoamericana Meacutexico

MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in

agriculture and experimental biology Second edition Chapman amp Hall

MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo

Editorial Iberoameacuterica

MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers

John Wiley amp Sons

Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial

Reverte Mejicana Meacutexico

Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da

Edicioacuten Meacutexico

Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc

Graw Hill

PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones

Editorial Limusa Meacutexico

NETER J et al Applied Linear Statistical Models Regression Analysis of

Variance and Experimental Designs Library of Congress Cataloging Publication

Data

OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp

RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo

Editorial Universitario

PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos

Lineales y Series Temporales Vol 1 y 2 Alianza Editorial

Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores

Spain SA Espantildea 2005

PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial

Mir Moscuacute

RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed

McGraw-Hill

Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca

UCV Caracas ndash Venezuela

RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE

Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en

Psicologiacuteardquo p 1

SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons

Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti

Caracas ndash Venezuela

Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores

deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico

Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica

Editorial Harla Meacutexico

STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y

procedimientos Segunda edicioacuten McGraw Hill

SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas

Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1

Ediciones UNESR Caracas

URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante

Coartiacuteculo Plan Nuevo Editorial AC

VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II

Anaacutelisis Multivariante) Mc-Graw Hill

Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows

Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea

2002

WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros

Editorial Interamericana Meacutexico

Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8

Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage

Learning Editores p 364 ISBN 9706861947

Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea

Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea

Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de

CV Meacutexico

Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para

Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico

DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR

httpesmwikipediaorgwikiSPSS

httpwwwbuenastareascomensayosque-es-el-SPSS1465478html

httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-

del-software-estadistico-integral-spss-base-160

httpesanswersyahoocomquestionindexqid=20070727073908aatuamw

httpwwwslidesharenetleticiagpestructura-de-spss-3126476

httpwwwehowenespanolcomprograma-spss-sobre_48697

httpwwwugres~bioestmedicinamanual_spsspdf

httpwwwmonografiascomtrabajos12tutortutorshtml

httpwwwspsscom

wwwspssparatodoscom

httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html

httpwwwspssfreecomcapitulotreshtml

httpwwwuvesRELIEVEemail relieveuves

httpwwwscribdcomdochellipspss-introduccioacuten

httpeswikipediaorgwikiSPSS

httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd

f

httpwwwspsscomaressuccessargentinashtml

httpeswikipediaorgwikiSPSS

httpwww-01ibmcomsoftwareesanalyticsspss

httppsicofcepurvesspssindex0htm

httpssitesgooglecomsiteestadisticaconelspss

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpe-stadisticabioucmesweb_spssindice_spsshtml

httpwwwquimicaurvesquimiogeneralanovacastpdf

httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da

tosyMultivariable14anova1_SPSSpdf

httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800

20AnE1lisis20de20Varianzaspdf

httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-

pearson

httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf

httpwwwuoceduin3emathdocsRegresionLinealpdf

httpeswikipediaorgwikiRegresiC3B3n_lineal

httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES

ION_LINEAL_CON_SPSSpdf

httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN

EAL20SIMPLE20CON20SPSSpdf

httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE

SION_LINEAL_CON_SPSSpdf

httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm

httpeswikipediaorgwikiNivel_de_medida

httphtmlrincondelvagocomregresion-lineal-simplehtml

httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp

lepdf

httpwwwvitutorcomestadisticabi8html

httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf

httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-

Martinez_1pdf

httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml

httpesslidesharenetpatolinkecuacin-de-regresin-lineal

httpeswikipediaorgwikiMC3ADnimos_cuadrados

httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios

httpwwwwordreferencecomdefinicioncorrelaciC3B3n

httpwwwditutorcomestadistica_2correlacion_estadisticahtml

httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson

httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n

httpeswikipediaorgwikiMatriz_de_correlaciC3B3n

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpwwwinfecepiunizares

httpwwwltbioestadisticaumaes

httpwwwuaqmxmatematicasestadisticasxu3html

httpwwwmembers-americastripodcom

httpwwwmsiplceorg

httpwwwbnvcocrsesionnotaaspg

httpwwwaltavistacom

httpwwwauyantepuycom

httpwwwinees

httpwwwudeccl

httpwwwrincondelvagocom

httpwwwmonografiascom

httpwwwfestadisticafguamesindicadoresiprihtml

httpwwwuaqmxmatematicasestadisticaxu3html

httpwwwinegoboiwd0801htmlE

httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm

httpwwwitlpedumx

httpwwweclaevespanovestadisticasna93nnsnann7eshtml

httpw3moritesmmx~cmendozamaestestoohtml

httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml

httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion

httpwwwunleduarfaveseiencuestasindexhtml

httpwwwmonografiascomtrabajos11operaoperashtml

httpwwwmonografiascomtrabajos6hisohisoshtml

httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos

httpwwwmonografiascomtrabajos16sistema-operativosistema-

operativoshtmlTIPPOS

httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-

operativoshtml

httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei

httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml

httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-

operativo

httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software

httpwwwsscccoclinformaticaconceptoshtml

httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr

httpwwwcadcommxhistoria_de_la_computacionhtm

httpwwweswikipediaorgwikiBus_(informC3A1tica)

httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla

httpwwwcavsicompreguntasrespuestasque-es-el-teclado

httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm

Page 19: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,

de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una

prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede

rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la

sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de

una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2

exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por

consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras

grandes a fin de probar la hipoacutetesis de aleatoriedad

U

UUZ

donde

U = numero total de corridas

U = valor medio de U 12 21

n

nnU

U = desviacioacuten estaacutendar de U 1

222

2121

nn

nnnnnU

n1 = numero de eacutexitos en la muestra

n2 = numero de fracasos en la muestra

n = tamantildeo de la muestra n = n1 + n2

PRUEBA DE McNEMAR

Suele darse el caso en que se desean comparar las proporciones de los

datos de muestras tomados de poblaciones relacionadas En este caso se quisiera

determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a

alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea

determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y

otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede

utilizar la prueba desarrollada por McNemar

El principal intereacutes es determinar si hay diferencia entre las dos

proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta

que el otro (prueba de una cola)

La prueba estadiacutestica para la prueba de McNemar es

CB

CBZ

PRUEBA U DE MANN ndash WHITNEY

Es una alternativa no parametrica a la prueba t de dos muestras para la

diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula

μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos

la forma de distribuciones normales de hecho la prueba solo requiere que las

poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no

importa si se cumple o no esta suposicioacuten

Estadiacutesticos U1 y U2

111

2112

1 W

nnnnU

222

2122

1 W

nnnnU

PRUEBA DE RACHAS

Son todas las diferencias que tiene el mismo signo y se presentan en una

misma fila Una serie de n diferencias puede tener solamente una racha (toda

positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las

rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de

poblaciones con la misma distribucioacuten de frecuencias Colocamos las

observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces

contamos el numero de rachas item de cada una de las muestras Si hay menos

rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales

rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten

La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de

que las observaciones se han sacado aleatoriamente de una sola poblacioacuten

Para hacer esto se halla la mediana de la muestra y se designa las

observaciones situadas por debajo de la mediana por un signo menos (-) y las

observaciones situadas por encima de la mediana por un signo (+) Si el numero

de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado

rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el

numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10

puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la

tabla normal con

u

uu

z

2

1

12

21

21

NN

NNu

)1()(

2(2

21

2

21

2121212

NNNN

NNNNNNu

DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES

DISTRIBUCIONES DE EJEMPLO Y USO

DISTRIBUCIOacuteN NORMAL O GAUSSIANA

Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que

multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal

Esta distribucioacuten de caracteriza porque los valores se distribuyen formando

una campana de Gauss en torno a un valor central que coincide con el valor

medio de la distribucioacuten

Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a

la izquierda

Esta distribucioacuten viene definida por dos paraacutemetros

X N (m S2)

m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro

de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores

estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores

estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de

ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten

estaacutendar

Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina

normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo

que permiten obtener esos mismos valores donde se recoge la probabilidad

acumulada para cada punto de la curva de esta distribucioacuten

Ademaacutes toda distribucioacuten normal se puede transformar en una normal

tipificada

Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con

media 10 y varianza 4 Transformarla en una normal tipificada

X N (10 4)

Para transformarla en una normal tipificada se crea una nueva variable (Y)

que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica

(que es la raiacutez cuadrada de la varianza)

En el ejemplo la nueva variable seriacutea

Esta nueva variable se distribuye como una normal tipificada

permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor

Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos

indicado de que las probabilidades para cada valor de la curva se encuentran

recogidas en una tabla

MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)

La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten

normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta

distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros

y lo que representamos del modo si su funcioacuten de densidad

es

Observacioacuten

Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y

la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes

adelante65

La forma de la funcioacuten de densidad es la llamada campana de Gauss

Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten

normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1

Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un

uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto

con lo cual en coinciden la media la mediana

y la moda y por uacuteltimo calcular sus puntos de inflexioacuten

El soporte de la distribucioacuten es todo de modo que la mayor parte de la

masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se

encuentra concentrado alrededor de la media y las ramas de la curva se extienden

asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la

media es posible (aunque poco probable)

La forma de la campana de Gauss depende de los paraacutemetros y

indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)

Figura Distribuciones gaussianas con diferentes medias e igual

dispersioacuten

(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor

sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor

de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea

``maacutes aplastado seraacute

Figura Distribuciones gaussianas con igual media pero varianza

diferente

La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes

adelante que es

Como consecuencia la distribucioacuten normal es reproductiva con respecto a

los paraacutemetros y ya que

Observacioacuten

Como se ha mencionado anteriormente la ley de probabilidad gaussiana la

encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza

por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el

de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que

apuntar un hecho negativo para esta ley de probabilidad

La funcioacuten no posee primitiva66

conocida67

Las consecuencias desde el punto de vista praacutectico son importantes ya que

eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de

la normal y nos tenemos que limitar a decir que

sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente

esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho

puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto

se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en

problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde

se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie

limitada de valores xi dados Normalmente F se encuentra tabulada para una

distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten

normal tipificada

En el caso de que tengamos una distribucioacuten diferente se

obtiene Z haciendo el siguiente cambio

De manera general se tiene

Proposicioacuten (Cambio de origen y escala)

Sean Entonces

Este resultado puede ser utilizado del siguiente modo Si y nos

interesa calcular

1 Hacemos el cambio y calculamos

2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de

modo aproximado) Como

tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada

Ejemplo

Supongamos que cierto fenoacutemeno pueda ser representado mediante una

va y queremos calcular la probabilidad de que Xtome un valor

entre 39 y 48 es decir

Comenzamos haciendo el cambio de variable

de modo que

Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que

hemos mencionado anteriormente

Proposicioacuten

Sea Entonces

Demostracioacuten

Por ser la normal una ley de probabilidad se tiene que

es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con

respecto a se obtiene el valor 0

luego

Para demostrar la igualdad entre la y basta con aplicar la misma

teacutecnica pero esta vez derivando con respecto a

Luego

Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en

primer lugar la va tipificada de X

y calculamos

Como por la proposicioacuten 5 deducimos que

CURVA NORMAL ESTANDARIZADA

Una variable numeacuterica puede clasificarse como discreta o continua Las

variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas

con la idea de contar Las variables continuas se pueden asociar con la idea de

medir utilizando fracciones y decimales Cuando la variable es continua el

modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal

El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten

normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran

cantidad de variables continuas

El modelo matemaacutetico

La funcioacuten matemaacutetica que se usa como modelo es

e = 271

π = 314

μx = media de la poblacioacuten

σx = desviacioacuten estaacutendar de la poblacioacuten

x = un valor de la variable continua

Como e y π son constantes la forma de la curva normal depende

solamente de los dos parametros de la distribucioacuten normal la media μx y la

desviacioacuten estaacutendar σx

Las diferentes curvas normales van a variar dependiendo de esos dos

paraacutemetros

En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar

visualmente como una curva en forma de campana El aacuterea debajo de esta curva se

halla por medio del integral de la funcioacuten y corresponde al por ciento o la

proporcioacuten de puntuaciones que se encuentran en el intervalo dado

Propiedades de las distribuciones normales

a Son simeacutetricas y tienen forma de campana

b Al ser simeacutetricas la media la moda y la mediana coinciden

c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea

de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media

d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la

curva se encuentra a tres desviaciones estaacutendar de la media

En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral

de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de

diferentes secciones de la curva o se utiliza la computadora para calcular ese valor

del aacuterea

La distribucioacuten normal estandarizada

Puesto que hay un nuacutemero infinito de combinaciones para los dos

paraacutemetros hay un nuacutemero infinito de curvas normales diferentes

Este problema se ha resuelto praacutecticamente al transformar los valores de

todas las distribuciones normales a los valores de una distribucioacuten normal

estandarizada representada por la curva normal estandarizada (standard normal

curve)

Las puntuaciones estandarizadas se logran restando la media a cada

observacioacuten y dividiendo entre la desviacioacuten estaacutendar

donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar

Propiedades de la distribucioacuten normal estandarizada

μ z = 0

σ z = 1

En muchas ocasiones se quieren comparar puntuaciones que pertenecen a

dos distribuciones normales diferentes La diferencia entre las dos distribuciones

radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo

la comparacioacuten se hace posible si se convierten las puntuaciones de ambas

distribuciones a puntuaciones z que corresponden a la distribucioacuten normal

estandarizada

Percentiles y rangos percentiles de una distribucioacuten normal estandarizada

Si se desea hallar la percentiles o el rango percentil en una distribucioacuten

normal no estandarizada se recurre al procedimiento de convertir las puntuaciones

de la distribucioacuten normal dada a puntuaciones z que corresponden a la

distribucioacuten normal estandarizada

Estos valores en la distribucioacuten normal estandarizada se pueden obtener

por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en

las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el

intervalo dado

Es necesario visualizar siempre el aacuterea debajo de la curva como el por

ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo

dado

Cuando una distribucioacuten de puntuaciones es normal estandarizada la

pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar

en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o

cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten

dada

DISTRIBUCIOacuteN GAMMA

Una variable aleatoria X asociada a un experimento aleatorio tiene una

distribucioacuten GAMMA si se caracteriza por las siguientes propiedades

Algunas alternativas de funciones de densidad se pueden ver en la graacutefica

del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)

respectivamente =1

=1

La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo

III

El modelo Gamma se ha utilizado frecuentemente en variables tales como

ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el

intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson

ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900

ndash Flujos maacuteximos MARKOVIC 1965

ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965

ndash Altura de la precipitacioacuten mensual WHITCOMB 1940

ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia

infin

ndash Ingresos familiares

ndash Edad del hombre al contraer matrimonio por primera vez

ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en

subestaciones a una frecuencia part

Ejemplo

Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos

de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia

promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo

de tiempo se encuentre hasta que ocurre el segundo ciclo

a Dentro de una desviacioacuten con respecto del tiempo promedio

b A maacutes de dos desviaciones por encima de la media

Solucioacuten

X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en

horas

Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)

= 2

Y Nuacutemero de ciclos hora ---------Y~P( =002)

E(Y) = 002 =

X ~ G(2 002)

Ejemplo

En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de

kilovatios por hora puede considerarse como una variable aleatoria con

distribucioacuten GAMMA de paraacutemetros = 3 y

= 05

La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de

KWhora

iquestCuaacutel es la probabilidad de que este abastecimientos sea

a Insuficiente en un diacutea cualquiera

b Se consuman entre 3 y 8 millones de K WHora

c c Encuentre E(x) y V(x)

SOLUCIOacuteN

DISTRIBUCIOacuteN PARETO

En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad

continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores

es

Su funcioacuten de distribucioacuten es

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto

son

El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (

DISTRIBUCIOacuteN T DE STUDENT

Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una

distribucioacuten t con n grados de libertad

Cuando n--gtinfinito a curva t coincide com la normal estandarizada

FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX

MOMENTOS

La distribucioacuten -Student se construye como un cociente entre una normal

y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-

Student con n grados de libertad a la de una va T

donde Este tipo de distribuciones aparece cuando

tenemos n+1 va independientes

y nos interesa la distribucioacuten de

La funcioacuten de densidad de es

Figura Funcioacuten de densidad de una de Student

La distribucioacuten de Student tiene propiedades parecidas a

Es de media cero y simeacutetrica con respecto a la misma

Es algo maacutes dispersa que la normal pero la varianza decrece hasta

1 cuando el nuacutemero de grados de libertad aumenta

Figura Comparacioacuten entre las funciones de densidad de y

Para un nuacutemero alto de grados de libertad se puede aproximar la

distribucioacuten de Student por la normal es decir

Figura Cuando aumentan los grados de libertad la distribucioacuten de

Student se aproxima a la distribucioacuten normal tipificada

Para calcular

DISTRIBUCIOacuteN BETA

Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede

representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un

intervalo de longitud finita Tales como

Proporcioacuten de impurezas en un producto quiacutemico

La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten

La proporcioacuten vendida de un lote durante un tiempo t

La humedad relativa medida en cierto lugar

Porcentaje del costo total destinado a reparacioacuten de maquinaria

Porcentaje de costo adicional destinado a reparacioacuten de maquinaria

La distribucioacuten del tiempo necesario para completar una fase del proyecto

PERT

Evaluacioacuten de programas y teacutecnicas de revisioacuten

Ejemplo

La proporcioacuten de tramos de una autopista que requieren repararse

semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros

= 3 y =2

a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten

b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista

requieren reparacioacuten en un antildeo cualquiera

DISTRIBUCIOacuteN CAUCHY

En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de

Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es

donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene

valor esperado ni varianza

Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V

2 lt 1 el

numero U V tiene la distribucioacuten Cauchy

La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un

grado de libertad

Ejemplo

Sean y dos observaciones independientes de una distribucioacuten

Cauchy con funcioacuten de densidad

Puede demostrarse que si y son tales que entonces la

funcioacuten de verosimilitud de es bimodal

Sean y Supongamos que se desea hacer inferencias sobre el

valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa

Especiacuteficamente interesa encontrar la distribucioacuten final de

Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la

distribucioacuten final de tiene una forma complicada Es conveniente notar sin

embargo que corresponde a la densidad marginal de respecto a la

densidad conjunta

DISTRIBUCIOacuteN BERNOULLI

Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto

suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el

que no lo sea (fracaso) En realidad no se trata maacutes que de una variable

dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello

que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas

obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la

situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este

experimento mediante una va discreta Xque toma los valores X=0 si el suceso no

ocurre y X=1 en caso contrario y que se denota

Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar

una moneda al aire y considerar la va

Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de

probabilidad es

y su funcioacuten de distribucioacuten

Su funcioacuten caracteriacutestica es

Los principales momentos de la X los podemos calcular directamente

o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina

Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)

cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de

intentos

CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE

BERNOULLI

Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la

probabilidad y asegurar que se cumplen las tres condiciones necesarias en

particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del

resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3

requiere que los ensayos o intentos de un proceso de Bernoulli sean

estadiacutesticamente independientes es decir que el resultado de un intento no puede

afectar de ninguacuten modo el resultado de cualquier otro intento

DISTRIBUCIOacuteN EXPONENCIAL

Modelo para variable aleatoria continua que permite representar variables

del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos

Componentes

En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de

probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para

valores x gt 0 es

f(x) = λe - λx

Su funcioacuten de distribucioacuten es

Aqui e significa el nuacutemero e

El valor esperado y la varianza de una variable aleatoria X con

distribucioacuten exponencial son

E[X] = 1 λ

V(X) = 1 λ2

Ejemplo

Ejemplos para la distribucioacuten exponencial son los tiempos dentro

accidentes con probabilidad invariable

La funcioacuten de densidad para λ igual 05 10 y 15

DISTRIBUCIOacuteN MULTINOMIAL

La distribucioacuten multinomial es similar a la distribucioacuten binomial con la

diferencia de que en lugar de dos posibles resultados en cada ensayo

La distribucioacuten multinomial sigue el siguiente modelo

Donde

X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo

que el partido POPO lo hayan votado 3 personas)

n indica el nuacutemero de veces que se ha repetido el suceso (en el

ejemplo 5 veces)

n es factorial de n (en el ejemplo 5 4 3 2 1)

p1 es la probabilidad del suceso X1 (en el ejemplo el 40)

Veamos el ejemplo

Luego

P = 00256

Es decir que la probabilidad de que las 5 personas elegidas hayan votado

de esta manera es tan soacutelo del 256

Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1

Veamos otro ejemplo

En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el

40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4

invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos

Aplicamos el modelo

LuegoP = 00384

Por lo tanto la probabilidad de que el grupo esteacute formado por personas de

estos paiacuteses es tan soacutelo del 384

DISTRIBUCIOacuteN UNIFORME

En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de

probabilidad cuyos valores tienen la misma probabilidad

Caso discreto

Su funcioacuten de probabilidad es en el caso discreto con valores posibles

p(xi) = 1 n

Su funcioacuten de distribucioacuten es en el caso discreto

Su media estadiacutestica es

Caso continuo

Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b

La funcioacuten de densidad en el caso continuo entre a y b es

Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12

Ejemplos

Para un dado perfecto todos los resultados tienen la misma probabilidad 1

6

Calcular variables aleatorias

Las variables aleatorias de probabilidad uniforme pueden calcularse con un

generador de variables aleatorias

DISTRIBUCIOacuteN BINOMIAL

En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad

discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con

probabilidad p de un eacutexito

Su funcioacuten de densidad es

Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)

posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos

((1 - p)n - x

)

El valor esperado de una variable aleatoria de probabilidad binominal es

E[x] = np y su varianza V[x] = np(1 - p)

DISTRIBUCIOacuteN BINOMIAL NEGATIVA

Sobre una sucesioacuten de va de Bernouilli independientes

Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r

eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de

distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo

Su ley de probabilidad se deduce siguiendo el esquema

De nuevo el conjunto de posibles valores de esta va discreta es

Su funcioacuten caracteriacutestica es

y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima

Ejemplo

Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en

operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal

que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda

definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para

intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus

5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones

que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se

necesiten 10 intervenciones

Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por

una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan

4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso

Identificando los paraacutemetros se tiene

Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el

nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy

simple

Y=X+r

Luego

Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente

es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de

que X=10-4=6 Por tanto

La distribucioacuten binomial negativa tambieacuten se puede definir como el

nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas

contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que

DISTRIBUCIOacuteN DE POISSON

Modelo para variable aleatoria discreta que permite calcular la

probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten

discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo

muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos

o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual

a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es

independiente de cuaacutendo se presenta dicho periacuteodo

En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de

probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos

es

Aquiacute e significa el nuacutemero e y x significa el factorial de x

La distribucion de Poisson describe el nuacutemero de sucesos en una unidad

de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un

proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens

en una carrera

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten

Poisson son

E[X] = V[X] = λ

La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos

entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un

conmutador la demanda (necesidades) de los pacientes que requieren servicio en

una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el

nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos

ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una

variable aleatoria discreta que toma valores enteros (0 1 2)

Caacutelculo de la probabilidad de Poisson

La letra X por lo general representa a una variable discreta y puede tomar

valores enteros Utilizamos la letra X para representar a la variable aleatoria y la

letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La

probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson

se calcula con la foacutermula

LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA

DISTRIBUCIOacuteN BINOMIAL

La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la

binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan

cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es

grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan

con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena

aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es

igual o menor que 005 En los casos en que se cumplen estas condiciones

podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media

de la distribucioacuten de Poisson

DISTRIBUCIOacuteN GEOMEacuteTRICA

En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten

probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores

discretos es

P(X = x) = p(1 - p)x - 1

Su funcioacuten de distribucioacuten es

El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media

estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2

Ejemplo

El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es

una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6

DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA

En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de

probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de

masa para valores es

Aqui (a sobre b) es el coeficiente binomial

El valor esperado de una variable aleatoria X de distribucioacuten

hipergeomeacutetrica es

Y su varianza

DISTRIBUCIOacuteN ZETA

En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad

discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos

es

Aqui ζ(s) es la funcioacuten zeta de Rieman con

El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto

DISTRIBUCION CHI CUADRADO

El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una

comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es

diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con

ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno

es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario

estas dos frecuencias acusan una diferencia significativa para por ejemplo un

nivel de significacioacuten del 5

El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la

asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada

por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito

bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor

del famoso libro Statistical Methods for Research Workers (1925) donde se

marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con

Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde

estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y

el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las

pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba

exacta de Fisher

Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico

publicitario presentado a grupos de clientes comparar la rentabilidad de un

proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos

de los turistas por determinados espacios geograacuteficos o por determinados

servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las

frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las

frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o

tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o

de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2

x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos

turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han

ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han

tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula

que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido

en los sitios A y B

Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es

independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo

A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces

alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este

anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos

empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de

las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51

La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten

igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es

2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del

Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del

5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206

podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para

suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B

Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias

observadas empiacutericamente de dos muestras con las frecuencias esperadas o

teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el

Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de

las materias primas perecederas Los resultados son seguacuten atributos cualitativos

los siguientes Primero veremos las frecuencias empiacutericas u observadas

Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten

Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son

131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas

Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y

fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres

columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta

maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x

120 260 = 6046 b2 = 129 x 120 260 = 5954

Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten

igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de

2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de

libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La

diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna

conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten

Es una medida de la discrepancia existente entre las frecuencias

observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso

de frecuencias () debido a que permite determinar las desviaciones entre ellas

ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la

expresioacuten

E

EOX

2

2

Donde

O frecuencia observada

E frecuencia teoacuterica esperada

TEST DE CHI-CUADRADO DE CONTINGENCIA

Un caso particular del test de chi-cuadrado que permite hacer un test sobre

la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-

cuadrado de contingencia Los dos caracteres observados en una misma

poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases

de se denotan las de por Tambieacuten vamos a

denotar

el efectivo conjunto de y es el nuacutemero de individuos para los

cuales toma el valor e el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

Estos valores se representan en una tabla de doble entrada conocida como

tabla de contingencia

Cada fila y cada columna corresponden a una submuestra particular La

fila de iacutendice es la distribucioacuten en las clases de los individuos para

los cuales el caraacutecter toma el valor La columna de iacutendice es la

distribucioacuten en las clases de los individuos para los cuales el caraacutecter

toma el valor Dividiendo las filas y las columnas por su suma se obtienen

frecuencias condicionales para cada una de las distribuciones empiacutericas Para

y las denotaremos por

y

Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y

los perfiles columna Para el modelo probabilista las observaciones provienen de

una muestra

de una ley bidimensional La hipoacutetesis a comprobar

es que los dos marginales de esta ley son independientes Si este es el caso los

perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna

de la de

y

Es equivalente a decir que las frecuencias conjuntas deben estar cerca de

los productos de las frecuencias marginales

Las frecuencias conjuntas por un lado (distribucioacuten observada) y los

productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen

dos distribuciones de probabilidad sobre el conjunto producto

Podemos por tanto calcular la distancia de

chi-cuadrado de una con respecto a la otra

Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la

distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale

Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la

definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado

Por lo dicho anteriormente para suficientemente grande podemos

aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el

nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados

a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las

que han sido estimadas Hay para el caraacutecter y para el caraacutecter

(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley

chi-cuadrado seraacute por tanto

Vamos a presentar un ejemplo de dos caracteres binarios que tienen que

ver con enfermos para los cuales se ha observado si tienen o no una tendencia al

suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y

neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las

tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla

de contingencia observada es

Tendencia Sin tendencia Total

Psicosis 20 180 200

Nneurosis 60 140 200

Total 80 320 400

La distancia de chi-cuadrado de contingencia calculada a partir de esta

tabla es de El valor tomado por el estadiacutegrafo es el cual

debemos comparar con la ley El p-valor es de

Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre

la tendencia al suicidio y la clasificacioacuten de las enfermedades

El test no precisa el sentido de esta dependencia Para describirla hay que

comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre

los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten

PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS

Los investigadores se interesan constantemente en las diferencias entre dos

poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado

civil profesioacuten color de ojos preferencia por una marca etc)

Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de

contingenciardquo

Se puede realizar una prueba para la diferencia entre dos proporciones

sobre la base de muestras independientes usaacutendose como instrumento la prueba

de chi cuadrado

El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es

la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se

podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda

Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la

ecuacioacuten

n

nnE CR

donde

nR nuacutemero total en el rengloacuten

nC nuacutemero total en la columna

n tamantildeo total de la muestra

El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado

entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia

al cuadrado se divide entre la frecuencia esperada de la celda

La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se

rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el

valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados

de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el

tamantildeo de la muestra

CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD

Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a

las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se

puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la

distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado

siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal

Por consiguiente al probar la diferencia entre las dos proporciones la

distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes

Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia

direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten

normal

La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede

ilustrar mediante el siguiente ejemplo

Cuartos de bantildeos modernos

Cocina moderna Caren

cia

existenc

ia

totales

Carencia 72 8 80

Existencia 7 146 153

La hipoacutetesis nula y alternativa seriacutean

YN ppH 0

YN ppH 0

Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de

significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute

Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H

A partir de la informacioacuten del cuadro

10080

8

N

NSN

n

Xp 95420

153

146

Y

YSY

n

Xp

A partir de la expresioacuten

21

21

111

nnpp

pPZ SS

donde

661015380

1468

p

por lo tanto

0813

153

1

80

133906610

95420100

Z

Totales 79 154 223

Dado que 1960813 Z se rechaza la 0H por lo tanto hay

diferencia entre las dos proporciones

Usando la prueba de chi cuadrado y la tabla de contingencia de este

ejemplo se tiene

Las frecuencias teoacutericas se pueden obtener a partir de la siguiente

ecuacioacuten

n

nnE CR

Por lo tanto se tiene

1227233

7980E 8852

233

15480E

8851233

79153E 12101

233

154153E

Chi cuadrado se obtiene a partir de la expresioacuten

E

EOX

2

2

A partir de la tabla se tiene

O E (O ndash E) (O ndash E)2

(O ndash E)2E

7

2

2

712

+4488 20142144 742704

7 5

188

- 4488 20142144 388245

8 5 -4488 20142144 380903

288

1

46

1

0112

+4488 20142144 199191

1711043

10431712 CALCULADOX

Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el

84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo

tanto hay diferencia entre las dos proporciones

Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la

distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos

distribuciones que a un nivel de significancia de 005 el valor de 196 es el

cuadrado de 3 841 es decir 22 ZX

CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA

La afirmacioacuten de que no existen diferencias entre proporciones significa

que las dos variables son independientes Cuando las conclusiones se presentan en

esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo

Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que

no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la

hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos

variables Independientemente de que la prueba de chi cuadrado se considera una

prueba de diferencia entre dos proporciones o una prueba de independencia los

caacutelculos y resultados son exactamente los mismos

CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE

Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o

intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que

ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de

probabilidades

Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que

seguir varios pasos Primero se tiene que establecer la distribucioacuten de

probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada

paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la

media) se deben establecer mediante hipoacutetesis o estimarlos con base a la

informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para

determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o

intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado

para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la

informacioacuten

BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON

La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de

Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la

cantidad de automoacuteviles estacionados en una cochera cubierta siguen una

distribucioacuten de Poisson 0H

En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero

de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una

muestra aleatoria de 233 casas

Numero de automoacuteviles Frecuencia

0 61

1 151

2 21

233

Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados

de la distribucioacuten de frecuencia

No de automoacuteviles Frecuencia observada On

0 61 0

1 151 151

2 21 42

233 193

808280233

193

1

n

On

X

n

i por lo tanto 80X

El valor de la media muestral se utilizara como el estimado de X

Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)

y se obtiene la frecuencia teoacuterica para cada una

Automoacutevil

n

Frecuencia

O

Probabilidad

XP

Frecuencia (E)

XPn

0 61 04493 104687

1 151 03595 87764

2 21 01438 33505

Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de

significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX

El valor calculado de chi cuadrado es

50679

2

2

K

CALCULADO

E

EOX

Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de

automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una

distribucioacuten de Poisson

CORRECCIOacuteN DE YATES

Cuando se aplican a datos discretos los resultados para distribuciones

continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres

comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de

Yates la cual viene dada mediante la expresioacuten

E

EOX CALCULADO

502

2

En general la correccioacuten se hace solamente cuando el numero de grados

de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos

resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en

relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia

esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi

cuadrado corregido y no corregido Si ambos valores conducen a la misma

conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se

presentan dificultades Si conducen a conclusiones diferentes se puede o bien

incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear

meacutetodos de probabilidad exactos

El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente

ejemplo

En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces

Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de

significancia del 005

No de caras Frecuencia Probabilidad Frecuencia (E)

Cara 115 05 100

cruce 85 05 100

2054

100

0510085

100

0510011522

2

CALCULADOX

Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado

con correccioacuten de Yates es

8432 TABULADOX

Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha

PRUEBA EXACTA DE FISHER

Para examinar la igualdad de las varianzas de dos poblaciones

independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de

las varianzas de las dos muestras Suponiendo que la informacioacuten de cada

poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2

2

2

1 SS sigue una

distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso

estadiacutestico RA Fisher

Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de

grados de libertad los grados de libertad en el numerador y en el denominador

la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea

2

2

2

111 21

S

SF nn

donde

n1 = tamantildeo de muestra en el grupo 1

n2 = tamantildeo de muestra en el grupo 2

n1 ndash 1 = grados de libertad en el grupo 1

n2 ndash 1 = grados de libertad en el grupo 2

2

1S varianza de la muestra en el grupo 1

2

2S varianza de la muestra en el grupo 2

Al probar la igualdad de dos varianzas se pueden emplear pruebas de una

cola o de dos colas

El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente

ejemplo

Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas

alta en la planta A que en la planta B Para determinar la variabilidad se puede

establecer una prueba de una cola en la forma siguiente

22 BAOH

22

1 BAH

Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta

A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta

ubicada en la cola superior de la distribucioacuten

Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de

libertad en el numerador y 19 en el denominador a un nivel de significancia de

001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene

71162 AS y 20142 BS por lo tanto

38512014

71162

2

1924 F como 1385 lt

292 no se rechaza la hipoacutetesis nula ( OH )

CONCLUSIOacuteN

La conclusioacuten que los resultados de una medida variable es la causa de

variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten

estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero

no puede reclamar legitimidad

La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en

describir la distribucioacuten de las variables estudiadas y en particular de los datos

numeacutericos Ademaacutes de las medidas descriptivas correspondientes el

comportamiento de estas variables puede explorarse graacuteficamente de un modo

muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro

organizador de las ciencias computarizadas y el modelo que nos dota de un

mejor razonamiento para implementar programas eficientes En este sentido la

combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un

reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en

colegios y universidades

Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de

combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y

evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras

loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre

operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten

juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la

teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones

simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades

que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea

BIBLIOGRAFIacuteA

AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis

Third Edition Texts in Statistical Science Chapman and Hall

BOXG E P HUNTER W G HUNTER JS (1978) Statistics for

Experimenters John Wiley amp Sons

BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores

Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de

Modelos Ed Revertsbquo SA

Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed

Piraacutemide

Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten

(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica

Matemaacutetica I Universidad de Antioquia

Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma

Madrid

Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill

Meacutexico

Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten

yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico

Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw

ndashHill 4ta Edicioacuten Colombia

CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana

Meacutexico

COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas

COX DR (1958) Planning of experiments New York John Wiley amp Sons

DANIEL C Applications of Statistics to Industrial Experimentation Willey

DAVIES OL The Design and Analysis of Industrial Experiments Hafner

(McMillan)

DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias

Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico

SA de CV Meacutexico

De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H

(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico

Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta

Estadiacutestica Editorial Microsoft corporation USA

ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial

Limusa SA Meacutexico

EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis

Arnold

FEDERER W (1965) Experimental design Oxford Publ Co

GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la

Varianza Grupo Editorial Universitario

FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico

McGraw Hill

FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque

ModernoEditorial SA Meacutexico

George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y

Meacutetodosrdquo Ed McGraw-Hill

GILL JL (1978) Design and Analysis of Experiments in the Animal and

Medical Sciences Iowa State University Press

JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression

and Experimental Design Springer-Verlag

Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor

Caracas

GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining

Institute

GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data

Mining Institute

Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial

Bourgeoacuten Caracas

Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la

EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute

Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial

BourgeoacutenCA Caracas ndash Venezuela

HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis

Multivariante 5ordf Edicioacuten Prentice Hall

JOBSON JD (1992) Applied Multivariate Data Analysis Volume II

Categorical and Multivariate Methods Springer-Verlag

KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial

Hispanoamericana Meacutexico

KIRK RE Experimental Design Procedures for the Behavioral Sciencies

BrooksCole Publishing Company

LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e

inferencia Estadiacutestica Editorial Limusa Meacutexico

LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV

Grupo Noriega Editores Meacutexico

LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial

HARLA Meacutexico

LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta

edicioacuten Editorial McGaw-Hill Usa

Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial

Hispanoameacuterica VI edicioacuten Meacutexico

LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire

Multidimensionnelle 3ordf Edition DUNOD

LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e

Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB

Caracas- Venezuela

LORENZEN T J Anderson V L (1993) Design of experiments A No-Name

Approach Marcel Dekker Inc

Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc

(1999) SPSS 90 Manual de Usuario SPSS Chicago

MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis

Academic Press

Enfocados hacia SPSS

Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de

wwwspssparatodoscom 2005

MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten

Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla

Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea

Ediciones Alfaomega SAN Meacutexico

MASON RL Statistical Design and Analysis of Experiments with Applications

to Engineering and Science John Wiley amp Sons New York

MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y

Economiacutea Editorial Iberoamericana Meacutexico

MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in

agriculture and experimental biology Second edition Chapman amp Hall

MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo

Editorial Iberoameacuterica

MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers

John Wiley amp Sons

Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial

Reverte Mejicana Meacutexico

Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da

Edicioacuten Meacutexico

Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc

Graw Hill

PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones

Editorial Limusa Meacutexico

NETER J et al Applied Linear Statistical Models Regression Analysis of

Variance and Experimental Designs Library of Congress Cataloging Publication

Data

OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp

RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo

Editorial Universitario

PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos

Lineales y Series Temporales Vol 1 y 2 Alianza Editorial

Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores

Spain SA Espantildea 2005

PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial

Mir Moscuacute

RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed

McGraw-Hill

Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca

UCV Caracas ndash Venezuela

RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE

Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en

Psicologiacuteardquo p 1

SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons

Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti

Caracas ndash Venezuela

Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores

deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico

Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica

Editorial Harla Meacutexico

STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y

procedimientos Segunda edicioacuten McGraw Hill

SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas

Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1

Ediciones UNESR Caracas

URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante

Coartiacuteculo Plan Nuevo Editorial AC

VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II

Anaacutelisis Multivariante) Mc-Graw Hill

Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows

Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea

2002

WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros

Editorial Interamericana Meacutexico

Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8

Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage

Learning Editores p 364 ISBN 9706861947

Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea

Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea

Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de

CV Meacutexico

Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para

Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico

DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR

httpesmwikipediaorgwikiSPSS

httpwwwbuenastareascomensayosque-es-el-SPSS1465478html

httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-

del-software-estadistico-integral-spss-base-160

httpesanswersyahoocomquestionindexqid=20070727073908aatuamw

httpwwwslidesharenetleticiagpestructura-de-spss-3126476

httpwwwehowenespanolcomprograma-spss-sobre_48697

httpwwwugres~bioestmedicinamanual_spsspdf

httpwwwmonografiascomtrabajos12tutortutorshtml

httpwwwspsscom

wwwspssparatodoscom

httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html

httpwwwspssfreecomcapitulotreshtml

httpwwwuvesRELIEVEemail relieveuves

httpwwwscribdcomdochellipspss-introduccioacuten

httpeswikipediaorgwikiSPSS

httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd

f

httpwwwspsscomaressuccessargentinashtml

httpeswikipediaorgwikiSPSS

httpwww-01ibmcomsoftwareesanalyticsspss

httppsicofcepurvesspssindex0htm

httpssitesgooglecomsiteestadisticaconelspss

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpe-stadisticabioucmesweb_spssindice_spsshtml

httpwwwquimicaurvesquimiogeneralanovacastpdf

httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da

tosyMultivariable14anova1_SPSSpdf

httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800

20AnE1lisis20de20Varianzaspdf

httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-

pearson

httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf

httpwwwuoceduin3emathdocsRegresionLinealpdf

httpeswikipediaorgwikiRegresiC3B3n_lineal

httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES

ION_LINEAL_CON_SPSSpdf

httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN

EAL20SIMPLE20CON20SPSSpdf

httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE

SION_LINEAL_CON_SPSSpdf

httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm

httpeswikipediaorgwikiNivel_de_medida

httphtmlrincondelvagocomregresion-lineal-simplehtml

httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp

lepdf

httpwwwvitutorcomestadisticabi8html

httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf

httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-

Martinez_1pdf

httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml

httpesslidesharenetpatolinkecuacin-de-regresin-lineal

httpeswikipediaorgwikiMC3ADnimos_cuadrados

httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios

httpwwwwordreferencecomdefinicioncorrelaciC3B3n

httpwwwditutorcomestadistica_2correlacion_estadisticahtml

httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson

httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n

httpeswikipediaorgwikiMatriz_de_correlaciC3B3n

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpwwwinfecepiunizares

httpwwwltbioestadisticaumaes

httpwwwuaqmxmatematicasestadisticasxu3html

httpwwwmembers-americastripodcom

httpwwwmsiplceorg

httpwwwbnvcocrsesionnotaaspg

httpwwwaltavistacom

httpwwwauyantepuycom

httpwwwinees

httpwwwudeccl

httpwwwrincondelvagocom

httpwwwmonografiascom

httpwwwfestadisticafguamesindicadoresiprihtml

httpwwwuaqmxmatematicasestadisticaxu3html

httpwwwinegoboiwd0801htmlE

httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm

httpwwwitlpedumx

httpwwweclaevespanovestadisticasna93nnsnann7eshtml

httpw3moritesmmx~cmendozamaestestoohtml

httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml

httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion

httpwwwunleduarfaveseiencuestasindexhtml

httpwwwmonografiascomtrabajos11operaoperashtml

httpwwwmonografiascomtrabajos6hisohisoshtml

httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos

httpwwwmonografiascomtrabajos16sistema-operativosistema-

operativoshtmlTIPPOS

httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-

operativoshtml

httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei

httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml

httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-

operativo

httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software

httpwwwsscccoclinformaticaconceptoshtml

httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr

httpwwwcadcommxhistoria_de_la_computacionhtm

httpwwweswikipediaorgwikiBus_(informC3A1tica)

httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla

httpwwwcavsicompreguntasrespuestasque-es-el-teclado

httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm

Page 20: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,

alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea

determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y

otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede

utilizar la prueba desarrollada por McNemar

El principal intereacutes es determinar si hay diferencia entre las dos

proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta

que el otro (prueba de una cola)

La prueba estadiacutestica para la prueba de McNemar es

CB

CBZ

PRUEBA U DE MANN ndash WHITNEY

Es una alternativa no parametrica a la prueba t de dos muestras para la

diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula

μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos

la forma de distribuciones normales de hecho la prueba solo requiere que las

poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no

importa si se cumple o no esta suposicioacuten

Estadiacutesticos U1 y U2

111

2112

1 W

nnnnU

222

2122

1 W

nnnnU

PRUEBA DE RACHAS

Son todas las diferencias que tiene el mismo signo y se presentan en una

misma fila Una serie de n diferencias puede tener solamente una racha (toda

positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las

rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de

poblaciones con la misma distribucioacuten de frecuencias Colocamos las

observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces

contamos el numero de rachas item de cada una de las muestras Si hay menos

rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales

rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten

La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de

que las observaciones se han sacado aleatoriamente de una sola poblacioacuten

Para hacer esto se halla la mediana de la muestra y se designa las

observaciones situadas por debajo de la mediana por un signo menos (-) y las

observaciones situadas por encima de la mediana por un signo (+) Si el numero

de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado

rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el

numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10

puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la

tabla normal con

u

uu

z

2

1

12

21

21

NN

NNu

)1()(

2(2

21

2

21

2121212

NNNN

NNNNNNu

DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES

DISTRIBUCIONES DE EJEMPLO Y USO

DISTRIBUCIOacuteN NORMAL O GAUSSIANA

Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que

multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal

Esta distribucioacuten de caracteriza porque los valores se distribuyen formando

una campana de Gauss en torno a un valor central que coincide con el valor

medio de la distribucioacuten

Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a

la izquierda

Esta distribucioacuten viene definida por dos paraacutemetros

X N (m S2)

m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro

de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores

estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores

estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de

ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten

estaacutendar

Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina

normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo

que permiten obtener esos mismos valores donde se recoge la probabilidad

acumulada para cada punto de la curva de esta distribucioacuten

Ademaacutes toda distribucioacuten normal se puede transformar en una normal

tipificada

Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con

media 10 y varianza 4 Transformarla en una normal tipificada

X N (10 4)

Para transformarla en una normal tipificada se crea una nueva variable (Y)

que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica

(que es la raiacutez cuadrada de la varianza)

En el ejemplo la nueva variable seriacutea

Esta nueva variable se distribuye como una normal tipificada

permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor

Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos

indicado de que las probabilidades para cada valor de la curva se encuentran

recogidas en una tabla

MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)

La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten

normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta

distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros

y lo que representamos del modo si su funcioacuten de densidad

es

Observacioacuten

Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y

la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes

adelante65

La forma de la funcioacuten de densidad es la llamada campana de Gauss

Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten

normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1

Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un

uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto

con lo cual en coinciden la media la mediana

y la moda y por uacuteltimo calcular sus puntos de inflexioacuten

El soporte de la distribucioacuten es todo de modo que la mayor parte de la

masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se

encuentra concentrado alrededor de la media y las ramas de la curva se extienden

asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la

media es posible (aunque poco probable)

La forma de la campana de Gauss depende de los paraacutemetros y

indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)

Figura Distribuciones gaussianas con diferentes medias e igual

dispersioacuten

(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor

sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor

de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea

``maacutes aplastado seraacute

Figura Distribuciones gaussianas con igual media pero varianza

diferente

La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes

adelante que es

Como consecuencia la distribucioacuten normal es reproductiva con respecto a

los paraacutemetros y ya que

Observacioacuten

Como se ha mencionado anteriormente la ley de probabilidad gaussiana la

encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza

por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el

de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que

apuntar un hecho negativo para esta ley de probabilidad

La funcioacuten no posee primitiva66

conocida67

Las consecuencias desde el punto de vista praacutectico son importantes ya que

eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de

la normal y nos tenemos que limitar a decir que

sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente

esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho

puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto

se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en

problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde

se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie

limitada de valores xi dados Normalmente F se encuentra tabulada para una

distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten

normal tipificada

En el caso de que tengamos una distribucioacuten diferente se

obtiene Z haciendo el siguiente cambio

De manera general se tiene

Proposicioacuten (Cambio de origen y escala)

Sean Entonces

Este resultado puede ser utilizado del siguiente modo Si y nos

interesa calcular

1 Hacemos el cambio y calculamos

2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de

modo aproximado) Como

tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada

Ejemplo

Supongamos que cierto fenoacutemeno pueda ser representado mediante una

va y queremos calcular la probabilidad de que Xtome un valor

entre 39 y 48 es decir

Comenzamos haciendo el cambio de variable

de modo que

Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que

hemos mencionado anteriormente

Proposicioacuten

Sea Entonces

Demostracioacuten

Por ser la normal una ley de probabilidad se tiene que

es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con

respecto a se obtiene el valor 0

luego

Para demostrar la igualdad entre la y basta con aplicar la misma

teacutecnica pero esta vez derivando con respecto a

Luego

Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en

primer lugar la va tipificada de X

y calculamos

Como por la proposicioacuten 5 deducimos que

CURVA NORMAL ESTANDARIZADA

Una variable numeacuterica puede clasificarse como discreta o continua Las

variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas

con la idea de contar Las variables continuas se pueden asociar con la idea de

medir utilizando fracciones y decimales Cuando la variable es continua el

modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal

El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten

normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran

cantidad de variables continuas

El modelo matemaacutetico

La funcioacuten matemaacutetica que se usa como modelo es

e = 271

π = 314

μx = media de la poblacioacuten

σx = desviacioacuten estaacutendar de la poblacioacuten

x = un valor de la variable continua

Como e y π son constantes la forma de la curva normal depende

solamente de los dos parametros de la distribucioacuten normal la media μx y la

desviacioacuten estaacutendar σx

Las diferentes curvas normales van a variar dependiendo de esos dos

paraacutemetros

En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar

visualmente como una curva en forma de campana El aacuterea debajo de esta curva se

halla por medio del integral de la funcioacuten y corresponde al por ciento o la

proporcioacuten de puntuaciones que se encuentran en el intervalo dado

Propiedades de las distribuciones normales

a Son simeacutetricas y tienen forma de campana

b Al ser simeacutetricas la media la moda y la mediana coinciden

c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea

de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media

d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la

curva se encuentra a tres desviaciones estaacutendar de la media

En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral

de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de

diferentes secciones de la curva o se utiliza la computadora para calcular ese valor

del aacuterea

La distribucioacuten normal estandarizada

Puesto que hay un nuacutemero infinito de combinaciones para los dos

paraacutemetros hay un nuacutemero infinito de curvas normales diferentes

Este problema se ha resuelto praacutecticamente al transformar los valores de

todas las distribuciones normales a los valores de una distribucioacuten normal

estandarizada representada por la curva normal estandarizada (standard normal

curve)

Las puntuaciones estandarizadas se logran restando la media a cada

observacioacuten y dividiendo entre la desviacioacuten estaacutendar

donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar

Propiedades de la distribucioacuten normal estandarizada

μ z = 0

σ z = 1

En muchas ocasiones se quieren comparar puntuaciones que pertenecen a

dos distribuciones normales diferentes La diferencia entre las dos distribuciones

radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo

la comparacioacuten se hace posible si se convierten las puntuaciones de ambas

distribuciones a puntuaciones z que corresponden a la distribucioacuten normal

estandarizada

Percentiles y rangos percentiles de una distribucioacuten normal estandarizada

Si se desea hallar la percentiles o el rango percentil en una distribucioacuten

normal no estandarizada se recurre al procedimiento de convertir las puntuaciones

de la distribucioacuten normal dada a puntuaciones z que corresponden a la

distribucioacuten normal estandarizada

Estos valores en la distribucioacuten normal estandarizada se pueden obtener

por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en

las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el

intervalo dado

Es necesario visualizar siempre el aacuterea debajo de la curva como el por

ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo

dado

Cuando una distribucioacuten de puntuaciones es normal estandarizada la

pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar

en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o

cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten

dada

DISTRIBUCIOacuteN GAMMA

Una variable aleatoria X asociada a un experimento aleatorio tiene una

distribucioacuten GAMMA si se caracteriza por las siguientes propiedades

Algunas alternativas de funciones de densidad se pueden ver en la graacutefica

del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)

respectivamente =1

=1

La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo

III

El modelo Gamma se ha utilizado frecuentemente en variables tales como

ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el

intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson

ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900

ndash Flujos maacuteximos MARKOVIC 1965

ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965

ndash Altura de la precipitacioacuten mensual WHITCOMB 1940

ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia

infin

ndash Ingresos familiares

ndash Edad del hombre al contraer matrimonio por primera vez

ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en

subestaciones a una frecuencia part

Ejemplo

Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos

de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia

promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo

de tiempo se encuentre hasta que ocurre el segundo ciclo

a Dentro de una desviacioacuten con respecto del tiempo promedio

b A maacutes de dos desviaciones por encima de la media

Solucioacuten

X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en

horas

Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)

= 2

Y Nuacutemero de ciclos hora ---------Y~P( =002)

E(Y) = 002 =

X ~ G(2 002)

Ejemplo

En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de

kilovatios por hora puede considerarse como una variable aleatoria con

distribucioacuten GAMMA de paraacutemetros = 3 y

= 05

La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de

KWhora

iquestCuaacutel es la probabilidad de que este abastecimientos sea

a Insuficiente en un diacutea cualquiera

b Se consuman entre 3 y 8 millones de K WHora

c c Encuentre E(x) y V(x)

SOLUCIOacuteN

DISTRIBUCIOacuteN PARETO

En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad

continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores

es

Su funcioacuten de distribucioacuten es

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto

son

El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (

DISTRIBUCIOacuteN T DE STUDENT

Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una

distribucioacuten t con n grados de libertad

Cuando n--gtinfinito a curva t coincide com la normal estandarizada

FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX

MOMENTOS

La distribucioacuten -Student se construye como un cociente entre una normal

y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-

Student con n grados de libertad a la de una va T

donde Este tipo de distribuciones aparece cuando

tenemos n+1 va independientes

y nos interesa la distribucioacuten de

La funcioacuten de densidad de es

Figura Funcioacuten de densidad de una de Student

La distribucioacuten de Student tiene propiedades parecidas a

Es de media cero y simeacutetrica con respecto a la misma

Es algo maacutes dispersa que la normal pero la varianza decrece hasta

1 cuando el nuacutemero de grados de libertad aumenta

Figura Comparacioacuten entre las funciones de densidad de y

Para un nuacutemero alto de grados de libertad se puede aproximar la

distribucioacuten de Student por la normal es decir

Figura Cuando aumentan los grados de libertad la distribucioacuten de

Student se aproxima a la distribucioacuten normal tipificada

Para calcular

DISTRIBUCIOacuteN BETA

Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede

representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un

intervalo de longitud finita Tales como

Proporcioacuten de impurezas en un producto quiacutemico

La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten

La proporcioacuten vendida de un lote durante un tiempo t

La humedad relativa medida en cierto lugar

Porcentaje del costo total destinado a reparacioacuten de maquinaria

Porcentaje de costo adicional destinado a reparacioacuten de maquinaria

La distribucioacuten del tiempo necesario para completar una fase del proyecto

PERT

Evaluacioacuten de programas y teacutecnicas de revisioacuten

Ejemplo

La proporcioacuten de tramos de una autopista que requieren repararse

semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros

= 3 y =2

a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten

b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista

requieren reparacioacuten en un antildeo cualquiera

DISTRIBUCIOacuteN CAUCHY

En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de

Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es

donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene

valor esperado ni varianza

Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V

2 lt 1 el

numero U V tiene la distribucioacuten Cauchy

La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un

grado de libertad

Ejemplo

Sean y dos observaciones independientes de una distribucioacuten

Cauchy con funcioacuten de densidad

Puede demostrarse que si y son tales que entonces la

funcioacuten de verosimilitud de es bimodal

Sean y Supongamos que se desea hacer inferencias sobre el

valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa

Especiacuteficamente interesa encontrar la distribucioacuten final de

Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la

distribucioacuten final de tiene una forma complicada Es conveniente notar sin

embargo que corresponde a la densidad marginal de respecto a la

densidad conjunta

DISTRIBUCIOacuteN BERNOULLI

Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto

suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el

que no lo sea (fracaso) En realidad no se trata maacutes que de una variable

dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello

que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas

obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la

situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este

experimento mediante una va discreta Xque toma los valores X=0 si el suceso no

ocurre y X=1 en caso contrario y que se denota

Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar

una moneda al aire y considerar la va

Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de

probabilidad es

y su funcioacuten de distribucioacuten

Su funcioacuten caracteriacutestica es

Los principales momentos de la X los podemos calcular directamente

o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina

Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)

cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de

intentos

CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE

BERNOULLI

Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la

probabilidad y asegurar que se cumplen las tres condiciones necesarias en

particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del

resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3

requiere que los ensayos o intentos de un proceso de Bernoulli sean

estadiacutesticamente independientes es decir que el resultado de un intento no puede

afectar de ninguacuten modo el resultado de cualquier otro intento

DISTRIBUCIOacuteN EXPONENCIAL

Modelo para variable aleatoria continua que permite representar variables

del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos

Componentes

En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de

probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para

valores x gt 0 es

f(x) = λe - λx

Su funcioacuten de distribucioacuten es

Aqui e significa el nuacutemero e

El valor esperado y la varianza de una variable aleatoria X con

distribucioacuten exponencial son

E[X] = 1 λ

V(X) = 1 λ2

Ejemplo

Ejemplos para la distribucioacuten exponencial son los tiempos dentro

accidentes con probabilidad invariable

La funcioacuten de densidad para λ igual 05 10 y 15

DISTRIBUCIOacuteN MULTINOMIAL

La distribucioacuten multinomial es similar a la distribucioacuten binomial con la

diferencia de que en lugar de dos posibles resultados en cada ensayo

La distribucioacuten multinomial sigue el siguiente modelo

Donde

X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo

que el partido POPO lo hayan votado 3 personas)

n indica el nuacutemero de veces que se ha repetido el suceso (en el

ejemplo 5 veces)

n es factorial de n (en el ejemplo 5 4 3 2 1)

p1 es la probabilidad del suceso X1 (en el ejemplo el 40)

Veamos el ejemplo

Luego

P = 00256

Es decir que la probabilidad de que las 5 personas elegidas hayan votado

de esta manera es tan soacutelo del 256

Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1

Veamos otro ejemplo

En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el

40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4

invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos

Aplicamos el modelo

LuegoP = 00384

Por lo tanto la probabilidad de que el grupo esteacute formado por personas de

estos paiacuteses es tan soacutelo del 384

DISTRIBUCIOacuteN UNIFORME

En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de

probabilidad cuyos valores tienen la misma probabilidad

Caso discreto

Su funcioacuten de probabilidad es en el caso discreto con valores posibles

p(xi) = 1 n

Su funcioacuten de distribucioacuten es en el caso discreto

Su media estadiacutestica es

Caso continuo

Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b

La funcioacuten de densidad en el caso continuo entre a y b es

Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12

Ejemplos

Para un dado perfecto todos los resultados tienen la misma probabilidad 1

6

Calcular variables aleatorias

Las variables aleatorias de probabilidad uniforme pueden calcularse con un

generador de variables aleatorias

DISTRIBUCIOacuteN BINOMIAL

En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad

discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con

probabilidad p de un eacutexito

Su funcioacuten de densidad es

Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)

posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos

((1 - p)n - x

)

El valor esperado de una variable aleatoria de probabilidad binominal es

E[x] = np y su varianza V[x] = np(1 - p)

DISTRIBUCIOacuteN BINOMIAL NEGATIVA

Sobre una sucesioacuten de va de Bernouilli independientes

Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r

eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de

distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo

Su ley de probabilidad se deduce siguiendo el esquema

De nuevo el conjunto de posibles valores de esta va discreta es

Su funcioacuten caracteriacutestica es

y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima

Ejemplo

Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en

operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal

que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda

definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para

intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus

5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones

que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se

necesiten 10 intervenciones

Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por

una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan

4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso

Identificando los paraacutemetros se tiene

Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el

nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy

simple

Y=X+r

Luego

Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente

es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de

que X=10-4=6 Por tanto

La distribucioacuten binomial negativa tambieacuten se puede definir como el

nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas

contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que

DISTRIBUCIOacuteN DE POISSON

Modelo para variable aleatoria discreta que permite calcular la

probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten

discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo

muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos

o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual

a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es

independiente de cuaacutendo se presenta dicho periacuteodo

En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de

probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos

es

Aquiacute e significa el nuacutemero e y x significa el factorial de x

La distribucion de Poisson describe el nuacutemero de sucesos en una unidad

de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un

proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens

en una carrera

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten

Poisson son

E[X] = V[X] = λ

La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos

entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un

conmutador la demanda (necesidades) de los pacientes que requieren servicio en

una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el

nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos

ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una

variable aleatoria discreta que toma valores enteros (0 1 2)

Caacutelculo de la probabilidad de Poisson

La letra X por lo general representa a una variable discreta y puede tomar

valores enteros Utilizamos la letra X para representar a la variable aleatoria y la

letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La

probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson

se calcula con la foacutermula

LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA

DISTRIBUCIOacuteN BINOMIAL

La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la

binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan

cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es

grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan

con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena

aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es

igual o menor que 005 En los casos en que se cumplen estas condiciones

podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media

de la distribucioacuten de Poisson

DISTRIBUCIOacuteN GEOMEacuteTRICA

En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten

probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores

discretos es

P(X = x) = p(1 - p)x - 1

Su funcioacuten de distribucioacuten es

El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media

estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2

Ejemplo

El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es

una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6

DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA

En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de

probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de

masa para valores es

Aqui (a sobre b) es el coeficiente binomial

El valor esperado de una variable aleatoria X de distribucioacuten

hipergeomeacutetrica es

Y su varianza

DISTRIBUCIOacuteN ZETA

En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad

discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos

es

Aqui ζ(s) es la funcioacuten zeta de Rieman con

El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto

DISTRIBUCION CHI CUADRADO

El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una

comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es

diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con

ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno

es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario

estas dos frecuencias acusan una diferencia significativa para por ejemplo un

nivel de significacioacuten del 5

El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la

asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada

por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito

bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor

del famoso libro Statistical Methods for Research Workers (1925) donde se

marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con

Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde

estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y

el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las

pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba

exacta de Fisher

Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico

publicitario presentado a grupos de clientes comparar la rentabilidad de un

proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos

de los turistas por determinados espacios geograacuteficos o por determinados

servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las

frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las

frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o

tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o

de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2

x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos

turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han

ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han

tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula

que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido

en los sitios A y B

Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es

independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo

A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces

alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este

anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos

empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de

las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51

La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten

igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es

2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del

Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del

5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206

podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para

suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B

Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias

observadas empiacutericamente de dos muestras con las frecuencias esperadas o

teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el

Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de

las materias primas perecederas Los resultados son seguacuten atributos cualitativos

los siguientes Primero veremos las frecuencias empiacutericas u observadas

Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten

Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son

131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas

Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y

fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres

columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta

maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x

120 260 = 6046 b2 = 129 x 120 260 = 5954

Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten

igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de

2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de

libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La

diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna

conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten

Es una medida de la discrepancia existente entre las frecuencias

observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso

de frecuencias () debido a que permite determinar las desviaciones entre ellas

ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la

expresioacuten

E

EOX

2

2

Donde

O frecuencia observada

E frecuencia teoacuterica esperada

TEST DE CHI-CUADRADO DE CONTINGENCIA

Un caso particular del test de chi-cuadrado que permite hacer un test sobre

la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-

cuadrado de contingencia Los dos caracteres observados en una misma

poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases

de se denotan las de por Tambieacuten vamos a

denotar

el efectivo conjunto de y es el nuacutemero de individuos para los

cuales toma el valor e el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

Estos valores se representan en una tabla de doble entrada conocida como

tabla de contingencia

Cada fila y cada columna corresponden a una submuestra particular La

fila de iacutendice es la distribucioacuten en las clases de los individuos para

los cuales el caraacutecter toma el valor La columna de iacutendice es la

distribucioacuten en las clases de los individuos para los cuales el caraacutecter

toma el valor Dividiendo las filas y las columnas por su suma se obtienen

frecuencias condicionales para cada una de las distribuciones empiacutericas Para

y las denotaremos por

y

Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y

los perfiles columna Para el modelo probabilista las observaciones provienen de

una muestra

de una ley bidimensional La hipoacutetesis a comprobar

es que los dos marginales de esta ley son independientes Si este es el caso los

perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna

de la de

y

Es equivalente a decir que las frecuencias conjuntas deben estar cerca de

los productos de las frecuencias marginales

Las frecuencias conjuntas por un lado (distribucioacuten observada) y los

productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen

dos distribuciones de probabilidad sobre el conjunto producto

Podemos por tanto calcular la distancia de

chi-cuadrado de una con respecto a la otra

Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la

distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale

Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la

definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado

Por lo dicho anteriormente para suficientemente grande podemos

aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el

nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados

a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las

que han sido estimadas Hay para el caraacutecter y para el caraacutecter

(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley

chi-cuadrado seraacute por tanto

Vamos a presentar un ejemplo de dos caracteres binarios que tienen que

ver con enfermos para los cuales se ha observado si tienen o no una tendencia al

suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y

neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las

tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla

de contingencia observada es

Tendencia Sin tendencia Total

Psicosis 20 180 200

Nneurosis 60 140 200

Total 80 320 400

La distancia de chi-cuadrado de contingencia calculada a partir de esta

tabla es de El valor tomado por el estadiacutegrafo es el cual

debemos comparar con la ley El p-valor es de

Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre

la tendencia al suicidio y la clasificacioacuten de las enfermedades

El test no precisa el sentido de esta dependencia Para describirla hay que

comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre

los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten

PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS

Los investigadores se interesan constantemente en las diferencias entre dos

poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado

civil profesioacuten color de ojos preferencia por una marca etc)

Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de

contingenciardquo

Se puede realizar una prueba para la diferencia entre dos proporciones

sobre la base de muestras independientes usaacutendose como instrumento la prueba

de chi cuadrado

El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es

la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se

podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda

Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la

ecuacioacuten

n

nnE CR

donde

nR nuacutemero total en el rengloacuten

nC nuacutemero total en la columna

n tamantildeo total de la muestra

El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado

entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia

al cuadrado se divide entre la frecuencia esperada de la celda

La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se

rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el

valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados

de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el

tamantildeo de la muestra

CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD

Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a

las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se

puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la

distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado

siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal

Por consiguiente al probar la diferencia entre las dos proporciones la

distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes

Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia

direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten

normal

La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede

ilustrar mediante el siguiente ejemplo

Cuartos de bantildeos modernos

Cocina moderna Caren

cia

existenc

ia

totales

Carencia 72 8 80

Existencia 7 146 153

La hipoacutetesis nula y alternativa seriacutean

YN ppH 0

YN ppH 0

Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de

significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute

Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H

A partir de la informacioacuten del cuadro

10080

8

N

NSN

n

Xp 95420

153

146

Y

YSY

n

Xp

A partir de la expresioacuten

21

21

111

nnpp

pPZ SS

donde

661015380

1468

p

por lo tanto

0813

153

1

80

133906610

95420100

Z

Totales 79 154 223

Dado que 1960813 Z se rechaza la 0H por lo tanto hay

diferencia entre las dos proporciones

Usando la prueba de chi cuadrado y la tabla de contingencia de este

ejemplo se tiene

Las frecuencias teoacutericas se pueden obtener a partir de la siguiente

ecuacioacuten

n

nnE CR

Por lo tanto se tiene

1227233

7980E 8852

233

15480E

8851233

79153E 12101

233

154153E

Chi cuadrado se obtiene a partir de la expresioacuten

E

EOX

2

2

A partir de la tabla se tiene

O E (O ndash E) (O ndash E)2

(O ndash E)2E

7

2

2

712

+4488 20142144 742704

7 5

188

- 4488 20142144 388245

8 5 -4488 20142144 380903

288

1

46

1

0112

+4488 20142144 199191

1711043

10431712 CALCULADOX

Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el

84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo

tanto hay diferencia entre las dos proporciones

Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la

distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos

distribuciones que a un nivel de significancia de 005 el valor de 196 es el

cuadrado de 3 841 es decir 22 ZX

CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA

La afirmacioacuten de que no existen diferencias entre proporciones significa

que las dos variables son independientes Cuando las conclusiones se presentan en

esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo

Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que

no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la

hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos

variables Independientemente de que la prueba de chi cuadrado se considera una

prueba de diferencia entre dos proporciones o una prueba de independencia los

caacutelculos y resultados son exactamente los mismos

CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE

Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o

intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que

ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de

probabilidades

Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que

seguir varios pasos Primero se tiene que establecer la distribucioacuten de

probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada

paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la

media) se deben establecer mediante hipoacutetesis o estimarlos con base a la

informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para

determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o

intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado

para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la

informacioacuten

BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON

La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de

Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la

cantidad de automoacuteviles estacionados en una cochera cubierta siguen una

distribucioacuten de Poisson 0H

En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero

de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una

muestra aleatoria de 233 casas

Numero de automoacuteviles Frecuencia

0 61

1 151

2 21

233

Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados

de la distribucioacuten de frecuencia

No de automoacuteviles Frecuencia observada On

0 61 0

1 151 151

2 21 42

233 193

808280233

193

1

n

On

X

n

i por lo tanto 80X

El valor de la media muestral se utilizara como el estimado de X

Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)

y se obtiene la frecuencia teoacuterica para cada una

Automoacutevil

n

Frecuencia

O

Probabilidad

XP

Frecuencia (E)

XPn

0 61 04493 104687

1 151 03595 87764

2 21 01438 33505

Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de

significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX

El valor calculado de chi cuadrado es

50679

2

2

K

CALCULADO

E

EOX

Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de

automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una

distribucioacuten de Poisson

CORRECCIOacuteN DE YATES

Cuando se aplican a datos discretos los resultados para distribuciones

continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres

comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de

Yates la cual viene dada mediante la expresioacuten

E

EOX CALCULADO

502

2

En general la correccioacuten se hace solamente cuando el numero de grados

de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos

resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en

relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia

esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi

cuadrado corregido y no corregido Si ambos valores conducen a la misma

conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se

presentan dificultades Si conducen a conclusiones diferentes se puede o bien

incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear

meacutetodos de probabilidad exactos

El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente

ejemplo

En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces

Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de

significancia del 005

No de caras Frecuencia Probabilidad Frecuencia (E)

Cara 115 05 100

cruce 85 05 100

2054

100

0510085

100

0510011522

2

CALCULADOX

Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado

con correccioacuten de Yates es

8432 TABULADOX

Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha

PRUEBA EXACTA DE FISHER

Para examinar la igualdad de las varianzas de dos poblaciones

independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de

las varianzas de las dos muestras Suponiendo que la informacioacuten de cada

poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2

2

2

1 SS sigue una

distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso

estadiacutestico RA Fisher

Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de

grados de libertad los grados de libertad en el numerador y en el denominador

la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea

2

2

2

111 21

S

SF nn

donde

n1 = tamantildeo de muestra en el grupo 1

n2 = tamantildeo de muestra en el grupo 2

n1 ndash 1 = grados de libertad en el grupo 1

n2 ndash 1 = grados de libertad en el grupo 2

2

1S varianza de la muestra en el grupo 1

2

2S varianza de la muestra en el grupo 2

Al probar la igualdad de dos varianzas se pueden emplear pruebas de una

cola o de dos colas

El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente

ejemplo

Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas

alta en la planta A que en la planta B Para determinar la variabilidad se puede

establecer una prueba de una cola en la forma siguiente

22 BAOH

22

1 BAH

Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta

A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta

ubicada en la cola superior de la distribucioacuten

Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de

libertad en el numerador y 19 en el denominador a un nivel de significancia de

001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene

71162 AS y 20142 BS por lo tanto

38512014

71162

2

1924 F como 1385 lt

292 no se rechaza la hipoacutetesis nula ( OH )

CONCLUSIOacuteN

La conclusioacuten que los resultados de una medida variable es la causa de

variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten

estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero

no puede reclamar legitimidad

La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en

describir la distribucioacuten de las variables estudiadas y en particular de los datos

numeacutericos Ademaacutes de las medidas descriptivas correspondientes el

comportamiento de estas variables puede explorarse graacuteficamente de un modo

muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro

organizador de las ciencias computarizadas y el modelo que nos dota de un

mejor razonamiento para implementar programas eficientes En este sentido la

combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un

reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en

colegios y universidades

Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de

combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y

evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras

loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre

operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten

juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la

teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones

simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades

que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea

BIBLIOGRAFIacuteA

AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis

Third Edition Texts in Statistical Science Chapman and Hall

BOXG E P HUNTER W G HUNTER JS (1978) Statistics for

Experimenters John Wiley amp Sons

BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores

Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de

Modelos Ed Revertsbquo SA

Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed

Piraacutemide

Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten

(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica

Matemaacutetica I Universidad de Antioquia

Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma

Madrid

Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill

Meacutexico

Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten

yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico

Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw

ndashHill 4ta Edicioacuten Colombia

CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana

Meacutexico

COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas

COX DR (1958) Planning of experiments New York John Wiley amp Sons

DANIEL C Applications of Statistics to Industrial Experimentation Willey

DAVIES OL The Design and Analysis of Industrial Experiments Hafner

(McMillan)

DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias

Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico

SA de CV Meacutexico

De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H

(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico

Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta

Estadiacutestica Editorial Microsoft corporation USA

ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial

Limusa SA Meacutexico

EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis

Arnold

FEDERER W (1965) Experimental design Oxford Publ Co

GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la

Varianza Grupo Editorial Universitario

FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico

McGraw Hill

FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque

ModernoEditorial SA Meacutexico

George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y

Meacutetodosrdquo Ed McGraw-Hill

GILL JL (1978) Design and Analysis of Experiments in the Animal and

Medical Sciences Iowa State University Press

JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression

and Experimental Design Springer-Verlag

Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor

Caracas

GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining

Institute

GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data

Mining Institute

Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial

Bourgeoacuten Caracas

Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la

EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute

Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial

BourgeoacutenCA Caracas ndash Venezuela

HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis

Multivariante 5ordf Edicioacuten Prentice Hall

JOBSON JD (1992) Applied Multivariate Data Analysis Volume II

Categorical and Multivariate Methods Springer-Verlag

KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial

Hispanoamericana Meacutexico

KIRK RE Experimental Design Procedures for the Behavioral Sciencies

BrooksCole Publishing Company

LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e

inferencia Estadiacutestica Editorial Limusa Meacutexico

LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV

Grupo Noriega Editores Meacutexico

LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial

HARLA Meacutexico

LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta

edicioacuten Editorial McGaw-Hill Usa

Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial

Hispanoameacuterica VI edicioacuten Meacutexico

LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire

Multidimensionnelle 3ordf Edition DUNOD

LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e

Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB

Caracas- Venezuela

LORENZEN T J Anderson V L (1993) Design of experiments A No-Name

Approach Marcel Dekker Inc

Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc

(1999) SPSS 90 Manual de Usuario SPSS Chicago

MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis

Academic Press

Enfocados hacia SPSS

Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de

wwwspssparatodoscom 2005

MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten

Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla

Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea

Ediciones Alfaomega SAN Meacutexico

MASON RL Statistical Design and Analysis of Experiments with Applications

to Engineering and Science John Wiley amp Sons New York

MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y

Economiacutea Editorial Iberoamericana Meacutexico

MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in

agriculture and experimental biology Second edition Chapman amp Hall

MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo

Editorial Iberoameacuterica

MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers

John Wiley amp Sons

Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial

Reverte Mejicana Meacutexico

Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da

Edicioacuten Meacutexico

Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc

Graw Hill

PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones

Editorial Limusa Meacutexico

NETER J et al Applied Linear Statistical Models Regression Analysis of

Variance and Experimental Designs Library of Congress Cataloging Publication

Data

OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp

RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo

Editorial Universitario

PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos

Lineales y Series Temporales Vol 1 y 2 Alianza Editorial

Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores

Spain SA Espantildea 2005

PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial

Mir Moscuacute

RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed

McGraw-Hill

Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca

UCV Caracas ndash Venezuela

RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE

Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en

Psicologiacuteardquo p 1

SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons

Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti

Caracas ndash Venezuela

Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores

deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico

Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica

Editorial Harla Meacutexico

STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y

procedimientos Segunda edicioacuten McGraw Hill

SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas

Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1

Ediciones UNESR Caracas

URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante

Coartiacuteculo Plan Nuevo Editorial AC

VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II

Anaacutelisis Multivariante) Mc-Graw Hill

Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows

Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea

2002

WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros

Editorial Interamericana Meacutexico

Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8

Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage

Learning Editores p 364 ISBN 9706861947

Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea

Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea

Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de

CV Meacutexico

Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para

Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico

DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR

httpesmwikipediaorgwikiSPSS

httpwwwbuenastareascomensayosque-es-el-SPSS1465478html

httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-

del-software-estadistico-integral-spss-base-160

httpesanswersyahoocomquestionindexqid=20070727073908aatuamw

httpwwwslidesharenetleticiagpestructura-de-spss-3126476

httpwwwehowenespanolcomprograma-spss-sobre_48697

httpwwwugres~bioestmedicinamanual_spsspdf

httpwwwmonografiascomtrabajos12tutortutorshtml

httpwwwspsscom

wwwspssparatodoscom

httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html

httpwwwspssfreecomcapitulotreshtml

httpwwwuvesRELIEVEemail relieveuves

httpwwwscribdcomdochellipspss-introduccioacuten

httpeswikipediaorgwikiSPSS

httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd

f

httpwwwspsscomaressuccessargentinashtml

httpeswikipediaorgwikiSPSS

httpwww-01ibmcomsoftwareesanalyticsspss

httppsicofcepurvesspssindex0htm

httpssitesgooglecomsiteestadisticaconelspss

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpe-stadisticabioucmesweb_spssindice_spsshtml

httpwwwquimicaurvesquimiogeneralanovacastpdf

httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da

tosyMultivariable14anova1_SPSSpdf

httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800

20AnE1lisis20de20Varianzaspdf

httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-

pearson

httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf

httpwwwuoceduin3emathdocsRegresionLinealpdf

httpeswikipediaorgwikiRegresiC3B3n_lineal

httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES

ION_LINEAL_CON_SPSSpdf

httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN

EAL20SIMPLE20CON20SPSSpdf

httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE

SION_LINEAL_CON_SPSSpdf

httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm

httpeswikipediaorgwikiNivel_de_medida

httphtmlrincondelvagocomregresion-lineal-simplehtml

httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp

lepdf

httpwwwvitutorcomestadisticabi8html

httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf

httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-

Martinez_1pdf

httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml

httpesslidesharenetpatolinkecuacin-de-regresin-lineal

httpeswikipediaorgwikiMC3ADnimos_cuadrados

httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios

httpwwwwordreferencecomdefinicioncorrelaciC3B3n

httpwwwditutorcomestadistica_2correlacion_estadisticahtml

httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson

httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n

httpeswikipediaorgwikiMatriz_de_correlaciC3B3n

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpwwwinfecepiunizares

httpwwwltbioestadisticaumaes

httpwwwuaqmxmatematicasestadisticasxu3html

httpwwwmembers-americastripodcom

httpwwwmsiplceorg

httpwwwbnvcocrsesionnotaaspg

httpwwwaltavistacom

httpwwwauyantepuycom

httpwwwinees

httpwwwudeccl

httpwwwrincondelvagocom

httpwwwmonografiascom

httpwwwfestadisticafguamesindicadoresiprihtml

httpwwwuaqmxmatematicasestadisticaxu3html

httpwwwinegoboiwd0801htmlE

httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm

httpwwwitlpedumx

httpwwweclaevespanovestadisticasna93nnsnann7eshtml

httpw3moritesmmx~cmendozamaestestoohtml

httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml

httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion

httpwwwunleduarfaveseiencuestasindexhtml

httpwwwmonografiascomtrabajos11operaoperashtml

httpwwwmonografiascomtrabajos6hisohisoshtml

httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos

httpwwwmonografiascomtrabajos16sistema-operativosistema-

operativoshtmlTIPPOS

httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-

operativoshtml

httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei

httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml

httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-

operativo

httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software

httpwwwsscccoclinformaticaconceptoshtml

httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr

httpwwwcadcommxhistoria_de_la_computacionhtm

httpwwweswikipediaorgwikiBus_(informC3A1tica)

httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla

httpwwwcavsicompreguntasrespuestasque-es-el-teclado

httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm

Page 21: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,

rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de

poblaciones con la misma distribucioacuten de frecuencias Colocamos las

observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces

contamos el numero de rachas item de cada una de las muestras Si hay menos

rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales

rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten

La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de

que las observaciones se han sacado aleatoriamente de una sola poblacioacuten

Para hacer esto se halla la mediana de la muestra y se designa las

observaciones situadas por debajo de la mediana por un signo menos (-) y las

observaciones situadas por encima de la mediana por un signo (+) Si el numero

de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado

rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el

numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10

puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la

tabla normal con

u

uu

z

2

1

12

21

21

NN

NNu

)1()(

2(2

21

2

21

2121212

NNNN

NNNNNNu

DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES

DISTRIBUCIONES DE EJEMPLO Y USO

DISTRIBUCIOacuteN NORMAL O GAUSSIANA

Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que

multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal

Esta distribucioacuten de caracteriza porque los valores se distribuyen formando

una campana de Gauss en torno a un valor central que coincide con el valor

medio de la distribucioacuten

Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a

la izquierda

Esta distribucioacuten viene definida por dos paraacutemetros

X N (m S2)

m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro

de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores

estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores

estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de

ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten

estaacutendar

Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina

normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo

que permiten obtener esos mismos valores donde se recoge la probabilidad

acumulada para cada punto de la curva de esta distribucioacuten

Ademaacutes toda distribucioacuten normal se puede transformar en una normal

tipificada

Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con

media 10 y varianza 4 Transformarla en una normal tipificada

X N (10 4)

Para transformarla en una normal tipificada se crea una nueva variable (Y)

que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica

(que es la raiacutez cuadrada de la varianza)

En el ejemplo la nueva variable seriacutea

Esta nueva variable se distribuye como una normal tipificada

permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor

Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos

indicado de que las probabilidades para cada valor de la curva se encuentran

recogidas en una tabla

MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)

La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten

normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta

distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros

y lo que representamos del modo si su funcioacuten de densidad

es

Observacioacuten

Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y

la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes

adelante65

La forma de la funcioacuten de densidad es la llamada campana de Gauss

Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten

normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1

Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un

uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto

con lo cual en coinciden la media la mediana

y la moda y por uacuteltimo calcular sus puntos de inflexioacuten

El soporte de la distribucioacuten es todo de modo que la mayor parte de la

masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se

encuentra concentrado alrededor de la media y las ramas de la curva se extienden

asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la

media es posible (aunque poco probable)

La forma de la campana de Gauss depende de los paraacutemetros y

indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)

Figura Distribuciones gaussianas con diferentes medias e igual

dispersioacuten

(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor

sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor

de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea

``maacutes aplastado seraacute

Figura Distribuciones gaussianas con igual media pero varianza

diferente

La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes

adelante que es

Como consecuencia la distribucioacuten normal es reproductiva con respecto a

los paraacutemetros y ya que

Observacioacuten

Como se ha mencionado anteriormente la ley de probabilidad gaussiana la

encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza

por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el

de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que

apuntar un hecho negativo para esta ley de probabilidad

La funcioacuten no posee primitiva66

conocida67

Las consecuencias desde el punto de vista praacutectico son importantes ya que

eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de

la normal y nos tenemos que limitar a decir que

sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente

esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho

puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto

se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en

problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde

se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie

limitada de valores xi dados Normalmente F se encuentra tabulada para una

distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten

normal tipificada

En el caso de que tengamos una distribucioacuten diferente se

obtiene Z haciendo el siguiente cambio

De manera general se tiene

Proposicioacuten (Cambio de origen y escala)

Sean Entonces

Este resultado puede ser utilizado del siguiente modo Si y nos

interesa calcular

1 Hacemos el cambio y calculamos

2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de

modo aproximado) Como

tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada

Ejemplo

Supongamos que cierto fenoacutemeno pueda ser representado mediante una

va y queremos calcular la probabilidad de que Xtome un valor

entre 39 y 48 es decir

Comenzamos haciendo el cambio de variable

de modo que

Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que

hemos mencionado anteriormente

Proposicioacuten

Sea Entonces

Demostracioacuten

Por ser la normal una ley de probabilidad se tiene que

es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con

respecto a se obtiene el valor 0

luego

Para demostrar la igualdad entre la y basta con aplicar la misma

teacutecnica pero esta vez derivando con respecto a

Luego

Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en

primer lugar la va tipificada de X

y calculamos

Como por la proposicioacuten 5 deducimos que

CURVA NORMAL ESTANDARIZADA

Una variable numeacuterica puede clasificarse como discreta o continua Las

variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas

con la idea de contar Las variables continuas se pueden asociar con la idea de

medir utilizando fracciones y decimales Cuando la variable es continua el

modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal

El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten

normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran

cantidad de variables continuas

El modelo matemaacutetico

La funcioacuten matemaacutetica que se usa como modelo es

e = 271

π = 314

μx = media de la poblacioacuten

σx = desviacioacuten estaacutendar de la poblacioacuten

x = un valor de la variable continua

Como e y π son constantes la forma de la curva normal depende

solamente de los dos parametros de la distribucioacuten normal la media μx y la

desviacioacuten estaacutendar σx

Las diferentes curvas normales van a variar dependiendo de esos dos

paraacutemetros

En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar

visualmente como una curva en forma de campana El aacuterea debajo de esta curva se

halla por medio del integral de la funcioacuten y corresponde al por ciento o la

proporcioacuten de puntuaciones que se encuentran en el intervalo dado

Propiedades de las distribuciones normales

a Son simeacutetricas y tienen forma de campana

b Al ser simeacutetricas la media la moda y la mediana coinciden

c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea

de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media

d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la

curva se encuentra a tres desviaciones estaacutendar de la media

En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral

de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de

diferentes secciones de la curva o se utiliza la computadora para calcular ese valor

del aacuterea

La distribucioacuten normal estandarizada

Puesto que hay un nuacutemero infinito de combinaciones para los dos

paraacutemetros hay un nuacutemero infinito de curvas normales diferentes

Este problema se ha resuelto praacutecticamente al transformar los valores de

todas las distribuciones normales a los valores de una distribucioacuten normal

estandarizada representada por la curva normal estandarizada (standard normal

curve)

Las puntuaciones estandarizadas se logran restando la media a cada

observacioacuten y dividiendo entre la desviacioacuten estaacutendar

donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar

Propiedades de la distribucioacuten normal estandarizada

μ z = 0

σ z = 1

En muchas ocasiones se quieren comparar puntuaciones que pertenecen a

dos distribuciones normales diferentes La diferencia entre las dos distribuciones

radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo

la comparacioacuten se hace posible si se convierten las puntuaciones de ambas

distribuciones a puntuaciones z que corresponden a la distribucioacuten normal

estandarizada

Percentiles y rangos percentiles de una distribucioacuten normal estandarizada

Si se desea hallar la percentiles o el rango percentil en una distribucioacuten

normal no estandarizada se recurre al procedimiento de convertir las puntuaciones

de la distribucioacuten normal dada a puntuaciones z que corresponden a la

distribucioacuten normal estandarizada

Estos valores en la distribucioacuten normal estandarizada se pueden obtener

por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en

las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el

intervalo dado

Es necesario visualizar siempre el aacuterea debajo de la curva como el por

ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo

dado

Cuando una distribucioacuten de puntuaciones es normal estandarizada la

pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar

en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o

cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten

dada

DISTRIBUCIOacuteN GAMMA

Una variable aleatoria X asociada a un experimento aleatorio tiene una

distribucioacuten GAMMA si se caracteriza por las siguientes propiedades

Algunas alternativas de funciones de densidad se pueden ver en la graacutefica

del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)

respectivamente =1

=1

La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo

III

El modelo Gamma se ha utilizado frecuentemente en variables tales como

ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el

intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson

ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900

ndash Flujos maacuteximos MARKOVIC 1965

ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965

ndash Altura de la precipitacioacuten mensual WHITCOMB 1940

ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia

infin

ndash Ingresos familiares

ndash Edad del hombre al contraer matrimonio por primera vez

ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en

subestaciones a una frecuencia part

Ejemplo

Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos

de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia

promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo

de tiempo se encuentre hasta que ocurre el segundo ciclo

a Dentro de una desviacioacuten con respecto del tiempo promedio

b A maacutes de dos desviaciones por encima de la media

Solucioacuten

X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en

horas

Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)

= 2

Y Nuacutemero de ciclos hora ---------Y~P( =002)

E(Y) = 002 =

X ~ G(2 002)

Ejemplo

En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de

kilovatios por hora puede considerarse como una variable aleatoria con

distribucioacuten GAMMA de paraacutemetros = 3 y

= 05

La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de

KWhora

iquestCuaacutel es la probabilidad de que este abastecimientos sea

a Insuficiente en un diacutea cualquiera

b Se consuman entre 3 y 8 millones de K WHora

c c Encuentre E(x) y V(x)

SOLUCIOacuteN

DISTRIBUCIOacuteN PARETO

En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad

continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores

es

Su funcioacuten de distribucioacuten es

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto

son

El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (

DISTRIBUCIOacuteN T DE STUDENT

Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una

distribucioacuten t con n grados de libertad

Cuando n--gtinfinito a curva t coincide com la normal estandarizada

FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX

MOMENTOS

La distribucioacuten -Student se construye como un cociente entre una normal

y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-

Student con n grados de libertad a la de una va T

donde Este tipo de distribuciones aparece cuando

tenemos n+1 va independientes

y nos interesa la distribucioacuten de

La funcioacuten de densidad de es

Figura Funcioacuten de densidad de una de Student

La distribucioacuten de Student tiene propiedades parecidas a

Es de media cero y simeacutetrica con respecto a la misma

Es algo maacutes dispersa que la normal pero la varianza decrece hasta

1 cuando el nuacutemero de grados de libertad aumenta

Figura Comparacioacuten entre las funciones de densidad de y

Para un nuacutemero alto de grados de libertad se puede aproximar la

distribucioacuten de Student por la normal es decir

Figura Cuando aumentan los grados de libertad la distribucioacuten de

Student se aproxima a la distribucioacuten normal tipificada

Para calcular

DISTRIBUCIOacuteN BETA

Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede

representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un

intervalo de longitud finita Tales como

Proporcioacuten de impurezas en un producto quiacutemico

La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten

La proporcioacuten vendida de un lote durante un tiempo t

La humedad relativa medida en cierto lugar

Porcentaje del costo total destinado a reparacioacuten de maquinaria

Porcentaje de costo adicional destinado a reparacioacuten de maquinaria

La distribucioacuten del tiempo necesario para completar una fase del proyecto

PERT

Evaluacioacuten de programas y teacutecnicas de revisioacuten

Ejemplo

La proporcioacuten de tramos de una autopista que requieren repararse

semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros

= 3 y =2

a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten

b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista

requieren reparacioacuten en un antildeo cualquiera

DISTRIBUCIOacuteN CAUCHY

En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de

Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es

donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene

valor esperado ni varianza

Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V

2 lt 1 el

numero U V tiene la distribucioacuten Cauchy

La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un

grado de libertad

Ejemplo

Sean y dos observaciones independientes de una distribucioacuten

Cauchy con funcioacuten de densidad

Puede demostrarse que si y son tales que entonces la

funcioacuten de verosimilitud de es bimodal

Sean y Supongamos que se desea hacer inferencias sobre el

valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa

Especiacuteficamente interesa encontrar la distribucioacuten final de

Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la

distribucioacuten final de tiene una forma complicada Es conveniente notar sin

embargo que corresponde a la densidad marginal de respecto a la

densidad conjunta

DISTRIBUCIOacuteN BERNOULLI

Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto

suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el

que no lo sea (fracaso) En realidad no se trata maacutes que de una variable

dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello

que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas

obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la

situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este

experimento mediante una va discreta Xque toma los valores X=0 si el suceso no

ocurre y X=1 en caso contrario y que se denota

Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar

una moneda al aire y considerar la va

Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de

probabilidad es

y su funcioacuten de distribucioacuten

Su funcioacuten caracteriacutestica es

Los principales momentos de la X los podemos calcular directamente

o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina

Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)

cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de

intentos

CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE

BERNOULLI

Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la

probabilidad y asegurar que se cumplen las tres condiciones necesarias en

particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del

resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3

requiere que los ensayos o intentos de un proceso de Bernoulli sean

estadiacutesticamente independientes es decir que el resultado de un intento no puede

afectar de ninguacuten modo el resultado de cualquier otro intento

DISTRIBUCIOacuteN EXPONENCIAL

Modelo para variable aleatoria continua que permite representar variables

del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos

Componentes

En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de

probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para

valores x gt 0 es

f(x) = λe - λx

Su funcioacuten de distribucioacuten es

Aqui e significa el nuacutemero e

El valor esperado y la varianza de una variable aleatoria X con

distribucioacuten exponencial son

E[X] = 1 λ

V(X) = 1 λ2

Ejemplo

Ejemplos para la distribucioacuten exponencial son los tiempos dentro

accidentes con probabilidad invariable

La funcioacuten de densidad para λ igual 05 10 y 15

DISTRIBUCIOacuteN MULTINOMIAL

La distribucioacuten multinomial es similar a la distribucioacuten binomial con la

diferencia de que en lugar de dos posibles resultados en cada ensayo

La distribucioacuten multinomial sigue el siguiente modelo

Donde

X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo

que el partido POPO lo hayan votado 3 personas)

n indica el nuacutemero de veces que se ha repetido el suceso (en el

ejemplo 5 veces)

n es factorial de n (en el ejemplo 5 4 3 2 1)

p1 es la probabilidad del suceso X1 (en el ejemplo el 40)

Veamos el ejemplo

Luego

P = 00256

Es decir que la probabilidad de que las 5 personas elegidas hayan votado

de esta manera es tan soacutelo del 256

Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1

Veamos otro ejemplo

En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el

40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4

invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos

Aplicamos el modelo

LuegoP = 00384

Por lo tanto la probabilidad de que el grupo esteacute formado por personas de

estos paiacuteses es tan soacutelo del 384

DISTRIBUCIOacuteN UNIFORME

En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de

probabilidad cuyos valores tienen la misma probabilidad

Caso discreto

Su funcioacuten de probabilidad es en el caso discreto con valores posibles

p(xi) = 1 n

Su funcioacuten de distribucioacuten es en el caso discreto

Su media estadiacutestica es

Caso continuo

Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b

La funcioacuten de densidad en el caso continuo entre a y b es

Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12

Ejemplos

Para un dado perfecto todos los resultados tienen la misma probabilidad 1

6

Calcular variables aleatorias

Las variables aleatorias de probabilidad uniforme pueden calcularse con un

generador de variables aleatorias

DISTRIBUCIOacuteN BINOMIAL

En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad

discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con

probabilidad p de un eacutexito

Su funcioacuten de densidad es

Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)

posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos

((1 - p)n - x

)

El valor esperado de una variable aleatoria de probabilidad binominal es

E[x] = np y su varianza V[x] = np(1 - p)

DISTRIBUCIOacuteN BINOMIAL NEGATIVA

Sobre una sucesioacuten de va de Bernouilli independientes

Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r

eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de

distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo

Su ley de probabilidad se deduce siguiendo el esquema

De nuevo el conjunto de posibles valores de esta va discreta es

Su funcioacuten caracteriacutestica es

y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima

Ejemplo

Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en

operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal

que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda

definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para

intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus

5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones

que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se

necesiten 10 intervenciones

Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por

una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan

4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso

Identificando los paraacutemetros se tiene

Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el

nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy

simple

Y=X+r

Luego

Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente

es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de

que X=10-4=6 Por tanto

La distribucioacuten binomial negativa tambieacuten se puede definir como el

nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas

contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que

DISTRIBUCIOacuteN DE POISSON

Modelo para variable aleatoria discreta que permite calcular la

probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten

discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo

muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos

o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual

a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es

independiente de cuaacutendo se presenta dicho periacuteodo

En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de

probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos

es

Aquiacute e significa el nuacutemero e y x significa el factorial de x

La distribucion de Poisson describe el nuacutemero de sucesos en una unidad

de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un

proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens

en una carrera

El valor esperado y la varianza de una variable aleatoria X de distribucioacuten

Poisson son

E[X] = V[X] = λ

La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos

entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un

conmutador la demanda (necesidades) de los pacientes que requieren servicio en

una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el

nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos

ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una

variable aleatoria discreta que toma valores enteros (0 1 2)

Caacutelculo de la probabilidad de Poisson

La letra X por lo general representa a una variable discreta y puede tomar

valores enteros Utilizamos la letra X para representar a la variable aleatoria y la

letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La

probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson

se calcula con la foacutermula

LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA

DISTRIBUCIOacuteN BINOMIAL

La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la

binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan

cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es

grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan

con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena

aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es

igual o menor que 005 En los casos en que se cumplen estas condiciones

podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media

de la distribucioacuten de Poisson

DISTRIBUCIOacuteN GEOMEacuteTRICA

En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten

probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores

discretos es

P(X = x) = p(1 - p)x - 1

Su funcioacuten de distribucioacuten es

El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media

estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2

Ejemplo

El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es

una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6

DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA

En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de

probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de

masa para valores es

Aqui (a sobre b) es el coeficiente binomial

El valor esperado de una variable aleatoria X de distribucioacuten

hipergeomeacutetrica es

Y su varianza

DISTRIBUCIOacuteN ZETA

En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad

discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos

es

Aqui ζ(s) es la funcioacuten zeta de Rieman con

El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto

DISTRIBUCION CHI CUADRADO

El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una

comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es

diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con

ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno

es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario

estas dos frecuencias acusan una diferencia significativa para por ejemplo un

nivel de significacioacuten del 5

El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la

asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada

por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito

bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor

del famoso libro Statistical Methods for Research Workers (1925) donde se

marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con

Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde

estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y

el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las

pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba

exacta de Fisher

Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico

publicitario presentado a grupos de clientes comparar la rentabilidad de un

proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos

de los turistas por determinados espacios geograacuteficos o por determinados

servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las

frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las

frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o

tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o

de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2

x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos

turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han

ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han

tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula

que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido

en los sitios A y B

Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es

independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo

A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces

alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este

anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos

empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de

las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51

La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten

igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es

2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del

Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del

5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206

podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para

suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B

Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias

observadas empiacutericamente de dos muestras con las frecuencias esperadas o

teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el

Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de

las materias primas perecederas Los resultados son seguacuten atributos cualitativos

los siguientes Primero veremos las frecuencias empiacutericas u observadas

Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten

Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son

131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas

Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y

fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres

columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta

maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x

120 260 = 6046 b2 = 129 x 120 260 = 5954

Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten

igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de

2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de

libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La

diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna

conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten

Es una medida de la discrepancia existente entre las frecuencias

observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso

de frecuencias () debido a que permite determinar las desviaciones entre ellas

ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la

expresioacuten

E

EOX

2

2

Donde

O frecuencia observada

E frecuencia teoacuterica esperada

TEST DE CHI-CUADRADO DE CONTINGENCIA

Un caso particular del test de chi-cuadrado que permite hacer un test sobre

la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-

cuadrado de contingencia Los dos caracteres observados en una misma

poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases

de se denotan las de por Tambieacuten vamos a

denotar

el efectivo conjunto de y es el nuacutemero de individuos para los

cuales toma el valor e el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

el efectivo marginal de es el nuacutemero de

individuos para los cuales toma el valor

Estos valores se representan en una tabla de doble entrada conocida como

tabla de contingencia

Cada fila y cada columna corresponden a una submuestra particular La

fila de iacutendice es la distribucioacuten en las clases de los individuos para

los cuales el caraacutecter toma el valor La columna de iacutendice es la

distribucioacuten en las clases de los individuos para los cuales el caraacutecter

toma el valor Dividiendo las filas y las columnas por su suma se obtienen

frecuencias condicionales para cada una de las distribuciones empiacutericas Para

y las denotaremos por

y

Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y

los perfiles columna Para el modelo probabilista las observaciones provienen de

una muestra

de una ley bidimensional La hipoacutetesis a comprobar

es que los dos marginales de esta ley son independientes Si este es el caso los

perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna

de la de

y

Es equivalente a decir que las frecuencias conjuntas deben estar cerca de

los productos de las frecuencias marginales

Las frecuencias conjuntas por un lado (distribucioacuten observada) y los

productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen

dos distribuciones de probabilidad sobre el conjunto producto

Podemos por tanto calcular la distancia de

chi-cuadrado de una con respecto a la otra

Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la

distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale

Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la

definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado

Por lo dicho anteriormente para suficientemente grande podemos

aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el

nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados

a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las

que han sido estimadas Hay para el caraacutecter y para el caraacutecter

(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley

chi-cuadrado seraacute por tanto

Vamos a presentar un ejemplo de dos caracteres binarios que tienen que

ver con enfermos para los cuales se ha observado si tienen o no una tendencia al

suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y

neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las

tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla

de contingencia observada es

Tendencia Sin tendencia Total

Psicosis 20 180 200

Nneurosis 60 140 200

Total 80 320 400

La distancia de chi-cuadrado de contingencia calculada a partir de esta

tabla es de El valor tomado por el estadiacutegrafo es el cual

debemos comparar con la ley El p-valor es de

Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre

la tendencia al suicidio y la clasificacioacuten de las enfermedades

El test no precisa el sentido de esta dependencia Para describirla hay que

comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre

los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten

PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS

Los investigadores se interesan constantemente en las diferencias entre dos

poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado

civil profesioacuten color de ojos preferencia por una marca etc)

Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de

contingenciardquo

Se puede realizar una prueba para la diferencia entre dos proporciones

sobre la base de muestras independientes usaacutendose como instrumento la prueba

de chi cuadrado

El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es

la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se

podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda

Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la

ecuacioacuten

n

nnE CR

donde

nR nuacutemero total en el rengloacuten

nC nuacutemero total en la columna

n tamantildeo total de la muestra

El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado

entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia

al cuadrado se divide entre la frecuencia esperada de la celda

La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se

rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el

valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados

de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el

tamantildeo de la muestra

CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD

Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a

las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se

puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la

distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado

siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal

Por consiguiente al probar la diferencia entre las dos proporciones la

distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes

Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia

direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten

normal

La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede

ilustrar mediante el siguiente ejemplo

Cuartos de bantildeos modernos

Cocina moderna Caren

cia

existenc

ia

totales

Carencia 72 8 80

Existencia 7 146 153

La hipoacutetesis nula y alternativa seriacutean

YN ppH 0

YN ppH 0

Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de

significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute

Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H

A partir de la informacioacuten del cuadro

10080

8

N

NSN

n

Xp 95420

153

146

Y

YSY

n

Xp

A partir de la expresioacuten

21

21

111

nnpp

pPZ SS

donde

661015380

1468

p

por lo tanto

0813

153

1

80

133906610

95420100

Z

Totales 79 154 223

Dado que 1960813 Z se rechaza la 0H por lo tanto hay

diferencia entre las dos proporciones

Usando la prueba de chi cuadrado y la tabla de contingencia de este

ejemplo se tiene

Las frecuencias teoacutericas se pueden obtener a partir de la siguiente

ecuacioacuten

n

nnE CR

Por lo tanto se tiene

1227233

7980E 8852

233

15480E

8851233

79153E 12101

233

154153E

Chi cuadrado se obtiene a partir de la expresioacuten

E

EOX

2

2

A partir de la tabla se tiene

O E (O ndash E) (O ndash E)2

(O ndash E)2E

7

2

2

712

+4488 20142144 742704

7 5

188

- 4488 20142144 388245

8 5 -4488 20142144 380903

288

1

46

1

0112

+4488 20142144 199191

1711043

10431712 CALCULADOX

Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el

84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo

tanto hay diferencia entre las dos proporciones

Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la

distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos

distribuciones que a un nivel de significancia de 005 el valor de 196 es el

cuadrado de 3 841 es decir 22 ZX

CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA

La afirmacioacuten de que no existen diferencias entre proporciones significa

que las dos variables son independientes Cuando las conclusiones se presentan en

esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo

Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que

no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la

hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos

variables Independientemente de que la prueba de chi cuadrado se considera una

prueba de diferencia entre dos proporciones o una prueba de independencia los

caacutelculos y resultados son exactamente los mismos

CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE

Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o

intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que

ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de

probabilidades

Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que

seguir varios pasos Primero se tiene que establecer la distribucioacuten de

probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada

paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la

media) se deben establecer mediante hipoacutetesis o estimarlos con base a la

informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para

determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o

intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado

para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la

informacioacuten

BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON

La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de

Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la

cantidad de automoacuteviles estacionados en una cochera cubierta siguen una

distribucioacuten de Poisson 0H

En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero

de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una

muestra aleatoria de 233 casas

Numero de automoacuteviles Frecuencia

0 61

1 151

2 21

233

Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados

de la distribucioacuten de frecuencia

No de automoacuteviles Frecuencia observada On

0 61 0

1 151 151

2 21 42

233 193

808280233

193

1

n

On

X

n

i por lo tanto 80X

El valor de la media muestral se utilizara como el estimado de X

Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)

y se obtiene la frecuencia teoacuterica para cada una

Automoacutevil

n

Frecuencia

O

Probabilidad

XP

Frecuencia (E)

XPn

0 61 04493 104687

1 151 03595 87764

2 21 01438 33505

Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de

significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX

El valor calculado de chi cuadrado es

50679

2

2

K

CALCULADO

E

EOX

Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de

automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una

distribucioacuten de Poisson

CORRECCIOacuteN DE YATES

Cuando se aplican a datos discretos los resultados para distribuciones

continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres

comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de

Yates la cual viene dada mediante la expresioacuten

E

EOX CALCULADO

502

2

En general la correccioacuten se hace solamente cuando el numero de grados

de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos

resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en

relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia

esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi

cuadrado corregido y no corregido Si ambos valores conducen a la misma

conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se

presentan dificultades Si conducen a conclusiones diferentes se puede o bien

incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear

meacutetodos de probabilidad exactos

El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente

ejemplo

En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces

Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de

significancia del 005

No de caras Frecuencia Probabilidad Frecuencia (E)

Cara 115 05 100

cruce 85 05 100

2054

100

0510085

100

0510011522

2

CALCULADOX

Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado

con correccioacuten de Yates es

8432 TABULADOX

Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha

PRUEBA EXACTA DE FISHER

Para examinar la igualdad de las varianzas de dos poblaciones

independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de

las varianzas de las dos muestras Suponiendo que la informacioacuten de cada

poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2

2

2

1 SS sigue una

distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso

estadiacutestico RA Fisher

Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de

grados de libertad los grados de libertad en el numerador y en el denominador

la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea

2

2

2

111 21

S

SF nn

donde

n1 = tamantildeo de muestra en el grupo 1

n2 = tamantildeo de muestra en el grupo 2

n1 ndash 1 = grados de libertad en el grupo 1

n2 ndash 1 = grados de libertad en el grupo 2

2

1S varianza de la muestra en el grupo 1

2

2S varianza de la muestra en el grupo 2

Al probar la igualdad de dos varianzas se pueden emplear pruebas de una

cola o de dos colas

El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente

ejemplo

Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas

alta en la planta A que en la planta B Para determinar la variabilidad se puede

establecer una prueba de una cola en la forma siguiente

22 BAOH

22

1 BAH

Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta

A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta

ubicada en la cola superior de la distribucioacuten

Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de

libertad en el numerador y 19 en el denominador a un nivel de significancia de

001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene

71162 AS y 20142 BS por lo tanto

38512014

71162

2

1924 F como 1385 lt

292 no se rechaza la hipoacutetesis nula ( OH )

CONCLUSIOacuteN

La conclusioacuten que los resultados de una medida variable es la causa de

variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten

estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero

no puede reclamar legitimidad

La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en

describir la distribucioacuten de las variables estudiadas y en particular de los datos

numeacutericos Ademaacutes de las medidas descriptivas correspondientes el

comportamiento de estas variables puede explorarse graacuteficamente de un modo

muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro

organizador de las ciencias computarizadas y el modelo que nos dota de un

mejor razonamiento para implementar programas eficientes En este sentido la

combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un

reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en

colegios y universidades

Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de

combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y

evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras

loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre

operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten

juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la

teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones

simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades

que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea

BIBLIOGRAFIacuteA

AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis

Third Edition Texts in Statistical Science Chapman and Hall

BOXG E P HUNTER W G HUNTER JS (1978) Statistics for

Experimenters John Wiley amp Sons

BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores

Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de

Modelos Ed Revertsbquo SA

Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed

Piraacutemide

Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten

(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica

Matemaacutetica I Universidad de Antioquia

Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma

Madrid

Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill

Meacutexico

Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten

yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico

Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw

ndashHill 4ta Edicioacuten Colombia

CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana

Meacutexico

COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas

COX DR (1958) Planning of experiments New York John Wiley amp Sons

DANIEL C Applications of Statistics to Industrial Experimentation Willey

DAVIES OL The Design and Analysis of Industrial Experiments Hafner

(McMillan)

DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias

Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico

SA de CV Meacutexico

De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H

(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico

Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta

Estadiacutestica Editorial Microsoft corporation USA

ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial

Limusa SA Meacutexico

EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis

Arnold

FEDERER W (1965) Experimental design Oxford Publ Co

GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la

Varianza Grupo Editorial Universitario

FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico

McGraw Hill

FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque

ModernoEditorial SA Meacutexico

George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y

Meacutetodosrdquo Ed McGraw-Hill

GILL JL (1978) Design and Analysis of Experiments in the Animal and

Medical Sciences Iowa State University Press

JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression

and Experimental Design Springer-Verlag

Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor

Caracas

GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining

Institute

GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data

Mining Institute

Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial

Bourgeoacuten Caracas

Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la

EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute

Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial

BourgeoacutenCA Caracas ndash Venezuela

HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis

Multivariante 5ordf Edicioacuten Prentice Hall

JOBSON JD (1992) Applied Multivariate Data Analysis Volume II

Categorical and Multivariate Methods Springer-Verlag

KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial

Hispanoamericana Meacutexico

KIRK RE Experimental Design Procedures for the Behavioral Sciencies

BrooksCole Publishing Company

LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e

inferencia Estadiacutestica Editorial Limusa Meacutexico

LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV

Grupo Noriega Editores Meacutexico

LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial

HARLA Meacutexico

LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta

edicioacuten Editorial McGaw-Hill Usa

Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial

Hispanoameacuterica VI edicioacuten Meacutexico

LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire

Multidimensionnelle 3ordf Edition DUNOD

LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e

Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB

Caracas- Venezuela

LORENZEN T J Anderson V L (1993) Design of experiments A No-Name

Approach Marcel Dekker Inc

Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc

(1999) SPSS 90 Manual de Usuario SPSS Chicago

MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis

Academic Press

Enfocados hacia SPSS

Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de

wwwspssparatodoscom 2005

MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten

Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla

Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea

Ediciones Alfaomega SAN Meacutexico

MASON RL Statistical Design and Analysis of Experiments with Applications

to Engineering and Science John Wiley amp Sons New York

MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y

Economiacutea Editorial Iberoamericana Meacutexico

MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in

agriculture and experimental biology Second edition Chapman amp Hall

MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo

Editorial Iberoameacuterica

MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers

John Wiley amp Sons

Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial

Reverte Mejicana Meacutexico

Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da

Edicioacuten Meacutexico

Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc

Graw Hill

PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones

Editorial Limusa Meacutexico

NETER J et al Applied Linear Statistical Models Regression Analysis of

Variance and Experimental Designs Library of Congress Cataloging Publication

Data

OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp

RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo

Editorial Universitario

PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos

Lineales y Series Temporales Vol 1 y 2 Alianza Editorial

Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores

Spain SA Espantildea 2005

PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial

Mir Moscuacute

RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed

McGraw-Hill

Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca

UCV Caracas ndash Venezuela

RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE

Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en

Psicologiacuteardquo p 1

SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons

Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti

Caracas ndash Venezuela

Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores

deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico

Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica

Editorial Harla Meacutexico

STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y

procedimientos Segunda edicioacuten McGraw Hill

SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas

Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1

Ediciones UNESR Caracas

URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante

Coartiacuteculo Plan Nuevo Editorial AC

VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II

Anaacutelisis Multivariante) Mc-Graw Hill

Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows

Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea

2002

WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros

Editorial Interamericana Meacutexico

Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8

Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage

Learning Editores p 364 ISBN 9706861947

Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea

Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea

Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de

CV Meacutexico

Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para

Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico

DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR

httpesmwikipediaorgwikiSPSS

httpwwwbuenastareascomensayosque-es-el-SPSS1465478html

httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-

del-software-estadistico-integral-spss-base-160

httpesanswersyahoocomquestionindexqid=20070727073908aatuamw

httpwwwslidesharenetleticiagpestructura-de-spss-3126476

httpwwwehowenespanolcomprograma-spss-sobre_48697

httpwwwugres~bioestmedicinamanual_spsspdf

httpwwwmonografiascomtrabajos12tutortutorshtml

httpwwwspsscom

wwwspssparatodoscom

httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html

httpwwwspssfreecomcapitulotreshtml

httpwwwuvesRELIEVEemail relieveuves

httpwwwscribdcomdochellipspss-introduccioacuten

httpeswikipediaorgwikiSPSS

httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd

f

httpwwwspsscomaressuccessargentinashtml

httpeswikipediaorgwikiSPSS

httpwww-01ibmcomsoftwareesanalyticsspss

httppsicofcepurvesspssindex0htm

httpssitesgooglecomsiteestadisticaconelspss

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpe-stadisticabioucmesweb_spssindice_spsshtml

httpwwwquimicaurvesquimiogeneralanovacastpdf

httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da

tosyMultivariable14anova1_SPSSpdf

httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800

20AnE1lisis20de20Varianzaspdf

httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-

pearson

httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf

httpwwwuoceduin3emathdocsRegresionLinealpdf

httpeswikipediaorgwikiRegresiC3B3n_lineal

httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES

ION_LINEAL_CON_SPSSpdf

httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN

EAL20SIMPLE20CON20SPSSpdf

httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE

SION_LINEAL_CON_SPSSpdf

httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm

httpeswikipediaorgwikiNivel_de_medida

httphtmlrincondelvagocomregresion-lineal-simplehtml

httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp

lepdf

httpwwwvitutorcomestadisticabi8html

httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf

httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-

Martinez_1pdf

httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml

httpesslidesharenetpatolinkecuacin-de-regresin-lineal

httpeswikipediaorgwikiMC3ADnimos_cuadrados

httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios

httpwwwwordreferencecomdefinicioncorrelaciC3B3n

httpwwwditutorcomestadistica_2correlacion_estadisticahtml

httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson

httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n

httpeswikipediaorgwikiMatriz_de_correlaciC3B3n

httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza

httpwwwinfecepiunizares

httpwwwltbioestadisticaumaes

httpwwwuaqmxmatematicasestadisticasxu3html

httpwwwmembers-americastripodcom

httpwwwmsiplceorg

httpwwwbnvcocrsesionnotaaspg

httpwwwaltavistacom

httpwwwauyantepuycom

httpwwwinees

httpwwwudeccl

httpwwwrincondelvagocom

httpwwwmonografiascom

httpwwwfestadisticafguamesindicadoresiprihtml

httpwwwuaqmxmatematicasestadisticaxu3html

httpwwwinegoboiwd0801htmlE

httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm

httpwwwitlpedumx

httpwwweclaevespanovestadisticasna93nnsnann7eshtml

httpw3moritesmmx~cmendozamaestestoohtml

httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml

httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion

httpwwwunleduarfaveseiencuestasindexhtml

httpwwwmonografiascomtrabajos11operaoperashtml

httpwwwmonografiascomtrabajos6hisohisoshtml

httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos

httpwwwmonografiascomtrabajos16sistema-operativosistema-

operativoshtmlTIPPOS

httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-

operativoshtml

httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei

httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml

httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-

operativo

httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software

httpwwwsscccoclinformaticaconceptoshtml

httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr

httpwwwcadcommxhistoria_de_la_computacionhtm

httpwwweswikipediaorgwikiBus_(informC3A1tica)

httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla

httpwwwcavsicompreguntasrespuestasque-es-el-teclado

httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm

Page 22: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 23: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 24: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 25: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 26: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 27: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 28: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 29: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 30: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 31: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 32: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 33: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 34: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 35: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 36: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 37: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 38: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 39: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 40: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 41: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 42: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 43: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 44: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 45: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 46: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 47: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 48: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 49: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 50: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 51: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 52: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 53: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 54: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 55: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 56: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 57: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 58: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 59: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 60: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 61: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 62: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 63: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 64: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 65: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 66: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 67: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 68: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 69: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 70: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 71: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 72: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 73: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 74: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 75: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 76: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 77: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 78: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 79: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 80: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 81: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 82: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 83: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 84: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 85: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 86: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 87: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,
Page 88: MARIGABY ESTADÍSTICA I · 2017. 4. 5. · PRUEBAS PARAMÉTRICAS Porque comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. Como vemos,